频道导航

database – 匹配模糊字符串

2020-07-16 Postgre SQL 前端之家

前端之家收集整理的这篇文章主要介绍了database – 匹配模糊字符串，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我需要在Postgresql中将两个表合并在公共变量“公司名称”上.不幸的是,许多公司名称并不完全匹配(即一个表中的MICROSOFT,另一个表中的MICROSFT).我尝试从两个列中删除常用词,例如“corporation”或“inc”或“ltd”,以便尝试在两个表中标准化名称,但我无法考虑其他策略.有任何想法吗？

谢谢.

此外,如果有必要,我可以在R中这样做

你考虑过fuzzystrmatch模块吗？你可以使用soundex,差异,levenshtein,Metaphone和dMetaphone,或者组合.

fuzzystrmatch documentation

SELECT something
FROM somewhere
WHERE levenshtein(item1,item2) < Carefully_Selected_Threshold

例如,从MICROSOFT到MICROSFT的levenshtein距离是一(1).

levenshtein(dMetaphone('MICROSOFT'),dMetaphone('MICROSFT')

以上返回零(0).结合levenshtein和dMetaphone可以帮助你匹配许多拼写错误.

上一篇：postgresql – 在Postgres数据库中下一篇：如何在PostgreSQL上添加条件唯一索

猜你在找的Postgre SQL相关文章

PosegreSQL基础回顾(第 4 章 SQL语法)

来源：http://www.postgres.cn/docs/11/ 4.1.1. 标识符和关键词 SQL标识符和关键...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 8 章数据类型)

来源：http://www.postgres.cn/docs/11/ 8.1. 数字类型数字类型由2、4或8字节的...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 5 章数据定义)

来源：http://www.postgres.cn/docs/11/ 5.1. 表基础 SQL并不保证表中行的顺序。...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 6 章数据操纵、第 7 章查询)

来源：http://www.postgres.cn/docs/11/ 6.4. 从修改的行中返回数据有时在修改行...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 13 章并发控制)

来源：http://www.postgres.cn/docs/11/ 13.2.1. 读已提交隔离级别读已提交是Po...

作者：前端之家时间：2020-11-21

PostgreSQL安装和使用

青岛OJ系统用的关系型数据库是PostgreSQL,为此对PostgreSQL大致了解下。今天的主要话题围...

作者：前端之家时间：2020-11-01

PostgreSQL整体架构

作者：前端之家时间：2020-08-07

为什么选择PostgreSQL而不是MySQL

David Bolton是一名独立开发者，他使用PostgreSQL和MySQL都已有超过十年的时间。近日，他撰...

作者：前端之家时间：2020-08-07

为什么选择PostgreSQL而不是MySQL

David Bolton是一名独立开发者，他使用PostgreSQL和MySQL都已有超过十年的时间。近日，他撰...

作者：前端之家时间：2020-08-07

专访唐成：从小工到专家，PostgreSQL的修炼之道

唐成，拥有十几年数据库、操作系统、存储领域的工作经验。目前任沃趣科技首席数据库架构师...

作者：前端之家时间：2020-08-07

编程分类

MySQL MsSQL Oracle Sqlite Postgre SQL Mariadb MongoDB NoSQL HBase JDBC