AI智能
改变未来

用正则表达式以及用Jsoup框架来解析网站

1.首先得写一个爬网站的方法

然后在查看输出的源代码,用正则表达式中的断言来截取如下
因为我这里要截取古城动态所以直接用前断言加开头的代码


后断言也同理
然后你想获得具体内容就在创一个方法通过前面获得的动态区的源代码接着重复上一步即可

然后用Jsopu怎么来解析呢,这个就更简单更方便了
首先需下载jsoup的jar文件,导入到你的编程工具里面去。
然后直接调用里面的connect()方法当然也需要先导包返回一个Document类型的
然后通过HTML里面的css的选择器直接解析,
在css选择器加上你要解析内容的标签class属性,返回一个Elementsl类型
然后增强型for循环输出一下就OK了,对了你也可以调用方法像我这里就text()方法就是获取文本

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » 用正则表达式以及用Jsoup框架来解析网站