ruby-on-rails – 用于文本比较的Ruby gem

前端之家收集整理的这篇文章主要介绍了ruby-on-rails – 用于文本比较的Ruby gem前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我正在寻找一个可以比较两个字符串(在这种情况下是文本段落)的宝石,并且能够衡量它们在内容上相似的可能性(可能只有几个单词重新排列,更改).我相信当用户提交问题时,SO会使用类似的东西.

解决方法

我可能会使用像Diff :: LCS这样的东西:
>> require "diff/lcs"
>> seq1 = "lorem ipsum dolor sit amet consequtor".split(" ")
>> seq2 = "lorem ipsum dolor amet sit consequtor".split(" ")
1.9.3-p194 :010 > Diff::LCS.diff(seq1,seq2).length
 => 2

它使用longest common subsequence算法(使用LCS获取差异的方法the wiki page中描述).

猜你在找的Ruby相关文章