使用Java将HTML文件读入DOM树

前端之家收集整理的这篇文章主要介绍了使用Java将HTML文件读入DOM树前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
有没有解析器/库能够使用 Java将HTML文档读入DOM树?我想使用Java提供的标准DOM / Xpath API.

大多数库似乎有自定义的API来解决这个任务.此外,转换为XML-DOM的HTML似乎不受大多数​​可用解析器的支持.

任何想法或经验与一个好的HTML DOM解析器?

解决方法

JTidy,通过将流处理为XHTML,然后使用您最喜欢的DOM实现来重新解析,或者使用parseDOM,如果有限的DOM imp给出足够的.

或者Neko.

猜你在找的Java相关文章