版本:最新免费版大小:287KB
类别:软件开发系统:WinAll, WinXP
立即下载jsoup 1.9.2.jar是一款功能强大的java编程处理html的开发包,拥有良好的可扩展性api设计,可以开发出强大的html解析功能,有需要的朋友就来IT猫扑下载吧!
jsoup是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
文档输入
jsoup 可以从包括字符串、URL地址以及本地文件来加载HTML 文档,并生成Document 对象实例。
解析并提取HTML 元素
这部分涉及一个HTML 解析器最基本的功能,但jsoup使用一种有别于其他开源项目的方式——选择器,我们将在最后一部分详细介绍jsoup选择器,本节中你将看到jsoup是如何用最简单的代码实现。
修改数据
在解析文档的同时,我们可能会需要对文档中的某些元素进行修改,例如我们可以为文档中的所有图片增加可点击链接、修改链接地址或者是修改文本等。
HTML 文档清理
jsoup 在提供强大的API 同时,人性化方面也做得非常好。在做网站的时候,经常会提供用户评论的功能。有些用户比较淘气,会搞一些脚本到评论内容中,而这些脚本可能会破坏整个页面的行为,更严重的是获取一些机要信息,例如XSS 跨站点攻击之类的。
修正了一个命名空间标签会causeelement cssselector失败
修正了一个问题,其中包含非ASCII字符但带有ASCII字符的标签名会导致分析器陷入无限循环中
修正了一个问题,API创建的XML文档将有一个不正确的序言
修正了一个问题,你不能使用属性选择器找到包含不平衡括号或圆括号的值
查看全部