频道导航

asp.net – SQL – 两个不同长度的字符串之间的相似性

2020-02-16 asp.Net 前端之家

前端之家收集整理的这篇文章主要介绍了asp.net – SQL – 两个不同长度的字符串之间的相似性，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我有一个sql Server产品表,每个产品都有我们网站上公开的描述.我想防止,或者至少警告我们的用户何时,描述与其他产品的描述太相似.每个产品的描述长度都会有很大差异.

我想查询包含相互之间的重复/相似段落/文本块的描述的产品.即字符串A有一堆独特的内容,但与字符串B共享一个相似/相同的段落.但是,我不确定哪种相似度算法最好用：

> Levenshtein distance和Jaro-Winler distance算法似乎只适用于短字符串.
>我不确定longest common subsequence algorithm是否考虑到了很大的差异.即它似乎忽略两个字符之间的潜在空间,找到任何类似的组合序列.

Fuzzy hashing听起来像我正在寻找的,但我不仅仅是寻找具有微妙差异的重复内容.我也在寻找具有在独特文本块中注入的细微差异的重复内容.我不知道如何在sql中实现模糊哈希. SOUNDEX()和DIFFERENCE()似乎使用模糊散列,但对我的用例来说非常不精确.

理想情况下,相似性sql 函数会很快,但我可以将缓存的相似性值存储在另一个表中,并安排作业偶尔更新.

实现此目的的最佳算法/ sql(或CLR集成)实现是什么？

解决方法

我不是最近不得不通过模糊字符串匹配来加入组名.
我已经尝试过大约40种不同的算法,但是没有一种能够做到这一点,即使编写的组名只是因为一些拼写错误,缺少空格以及偶尔添加_mLF而有所不同.

因此,如果您尝试类似的事情,我强烈建议您立即停止,并将数据(在我的情况下为Excel文件)发送回用户进行更正,以便进行更正.

如果您真的只是对比较字符串感兴趣,这个链接可能正是您所需要的：
http://anastasiosyal.com/POST/2009/01/11/18.ASPX

我发现Jaro-Winkler函数在我的情况下产生了最好的结果,但你可以为自己测试一下.

上一篇：asp.net-mvc – 调试已部署的azure 下一篇：asp.net – 授权属性中的UrlHelper

猜你在找的asp.Net相关文章

.NetCore+WebUploader实现大文件分片上传

项目要求通过网站上传大文件，比如视频文件，通过摸索实现了文件分片来上传，然后后台进行...

作者：踏平扶桑时间：2024-09-29

CentOS7下让Asp.Net Core的网站自动运行

安装新版本的Nginx（vim /etc/yum.repos.d/nginx.repo） [nginx-stable] name=nginx stabl...

作者：踏平扶桑时间：2024-09-29

使用SignalR ASP.NET Core来简单实现一个后台实时推送数据给Echarts展示图表的功能

什么是 SignalR ASP.NET Core ASP.NET Core SignalR 是一种开放源代码库，可简化...

作者：踏平扶桑时间：2024-09-29

.NETCore项目在Windows下构建Docker镜像并本地导出分发到CentOS系统下

在Windows下使用Docker，我们选择Docker Desktop这个软件，非常方便。 ## Docker Desktop介...

作者：踏平扶桑时间：2024-09-29

C#编写运行在Linux环境下的采用Mediainfo来获取多媒体文件信息的代码

项目开始设计的是运行在windows下，所以一开始采用的是windows服务模式来获取多媒体文件信...

作者：踏平扶桑时间：2024-09-29

Blazor Server App Cannot find the fallback endpoint specified by route values

github官方issues中提到的解决方案，CreateBuilder时指定项目绝对路径可以解决。 1 // 指定...

作者：踏平扶桑时间：2024-09-29

ASP.NET CORE使用WebUploader对大文件分片上传，并通过ASP.NET CORE SignalR实时反馈后台处理进度给前端展示

本次，我们来实现一个单个大文件上传，并且把后台对上传文件的处理进度通过ASP.NET CORE S...

作者：踏平扶桑时间：2024-09-29

解决WPF+Avalonia在openKylin系统下默认字体问题

一、openKylin简介 openKylin（开放麒麟）社区是在开源、自愿、平等和协作的基础上，由基...

作者：踏平扶桑时间：2024-09-29

WTM的项目中EFCore如何适配人大金仓数据库

一、WTM是什么 WalkingTec.Mvvm框架（简称WTM）最早开发与2013年，基于Asp.net MVC3 和最...

作者：踏平扶桑时间：2024-09-29

实现ASP.Net Core3.1运行在DockeDesktop下并用Nginx实现负载均衡

一、首先去https://docs.docker.com/get-docker/下载Windows版本的Docker Desktop并安装（...

作者：踏平扶桑时间：2024-09-29

编程分类

PHP Java Java SE Python C#C&C++Ruby VB asp.Net Go Perl netty Django Delphi Jsp .NET Core Spring Flask Springboot SpringMVC Lua Laravel Mybatis Asp Groovy ThinkPHP Yii swoole

最新文章