频道导航

javascript – 使用node.js和自然语言处理来处理多个单词短语

2019-08-19 JavaScript 前端之家

前端之家收集整理的这篇文章主要介绍了javascript – 使用node.js和自然语言处理来处理多个单词短语，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在使用非常酷的 natural库为node.js.

我正在努力训练我的分类器来匹配短语用户体验.我的问题是,如果我做这样的事情：

classifier.addDocument(['user experience'],'ux');

它不匹配2个单词短语,我相信,因为它标记的话.如果我做这样的事情：

classifier.addDocument(['user','experience'],'ux');

它的工作原理就像我想要的那样,但是我的问题是,我不想仅仅匹配用户这个词,因为一篇文章可以提到多次使用用户名,这可能与用户体验无关,导致不准确的分类.所以,我的问题是如何使用NLP匹配2个或更多的单词短语？

感谢您的帮助提前.

解决方法

你应该看看n-gram,特别是在这种情况下,它被称为二进制,一系列两个令牌.
https://github.com/NaturalNode/natural#bigrams

我没有使用这个特定的库(不要认为nodejs是NLP最好的语言,它仍然处于早期阶段,我建议你为NLP使用一个更成熟的库(NLTK)/语言(python)我想这只是为了测试还是一些小的项目).

无论如何,从手册判断,你可能会做一些类似的事情

classifier.addDocument([['user','experience']],'ux');

为要添加在一起的每个序列添加括号.

上一篇：javascript – 如何仅将一个对象保下一篇：javascript – 用redux创建秒表

猜你在找的JavaScript相关文章

Javascript中的事件冒泡与捕获

事件冒泡和事件捕获起因：今天在封装一个bind函数的时候，发现el.addEventListener函数支...

作者：前端之家时间：2021-02-22

搞懂js中小数运算精度问题原因及解决办法

js小数运算会出现精度问题 js number类型 JS 数字类型只有number类型，number类型相当于其...

作者：前端之家时间：2021-02-22

搞懂：前端跨域问题JS解决跨域问题VUE代理解决跨域问题原理

什么是跨域跨域：广义的跨域包含一下内容： 1.资源跳转（链接跳转，重定向跳转，表单提...

作者：前端之家时间：2021-02-22

前端对base64编码的理解，原生js实现字符base64编码

@ "TOC" 常见对base64的认知(不完全正确) 首先对base64常见的认知，也是...

作者：前端之家时间：2021-02-22

搞懂：MVVM模型以及VUE中的数据绑定数据劫持发布订阅模式

搞懂：MVVM模式和Vue中的MVVM模式 MVVM MVVM ：的缩写，说都能直接说出来：模型，：视图...

作者：前端之家时间：2021-02-22

js判断浏览器是否支持webGL

起因是我之前开发的网页，用到了three.js制作了一个3d的旋转球体效果。在各种浏览器上运行...

作者：前端之家时间：2021-02-14

js判断undefined和null

js判断undefined js判断null js判断null和undefined

作者：前端之家时间：2021-02-14

将文字自动转为banner打印形式的工具

http://patorjk.com/software/taag/

作者：前端之家时间：2021-02-14

聊一聊 bootstrap 的轮播图插件

今天做工作的时候，轻车熟路的做完，又用到了bootstrap的轮播图，觉得有必要安利一下这个插...

作者：前端之家时间：2021-02-14

js实现图片无缝循环跑马灯

html 代码 css js代码 function mylsRunHorseLight() { if (mylsTimer != null) { clearIn...

作者：前端之家时间：2021-02-14

最新文章