文本比较算法

前端之家收集整理的这篇文章主要介绍了文本比较算法前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我们在项目中有一个要求,我们必须比较两个法律文本(update1,update2),并提出一个算法来定义多少个单词和多少个句子已经改变.

有没有可以使用的算法?我甚至没有寻找代码.如果我知道算法,我可以用java编写它.谢谢.

解决方法

通常这是通过找到 Longest Common Subsequence(通常称为LCS问题)来实现的.这就是diff的工具.当然,diff是一个面向行的工具,它听起来像你的需求有所不同.但是,我假设你已经构建了一些比较单词和句子的方式.

猜你在找的HTML相关文章