所以,我希望能够在每个单词的基础上找到两个字符串之间的差异(可能比每个字符更快,但是,如果每个字符更快,那么我想这样做).
这是我想要实现的一个例子:
来源文字:
Hello there!
修改文本:
Helay scere?
DIFF:
Hel[lo](ay) [th](sc)ere[!](?)
使用命令行工具(例如opendiff)有一种超级hackish方式来执行此操作,但它需要在每个字符之间使用换行符,因为opendiff是基于行的.
我正在使用ruby,并且没有找到任何工具来执行此操作……但语言并不是非常重要,因为算法可以很容易地移植.
谢谢.
解决方法
您可能需要检查:
http://en.wikipedia.org/wiki/Longest_common_subsequence_problem.实施起来并不难.