我不知道客户的“略有不同”的概念是什么.我一直在研究实现自定义soundex算法.这会根据声音的方式将单词转换为数字.然后将该数字用于比较.
例如:
Zach Zack
Zach
Zack
将编码为相同的值.还有其他我可以考虑的选择吗?
它非常基本,但适用于’Zack / Zach’等情况.
通过在数据库中添加标签,您可以处理人们可以通过其首字母缩略词或其他口语名称搜索供应商的情况.
有关实施细节,请参见@L_301_1@和http://www.dotnetperls.com/levenshtein.