php – 建议内容关键字的有效库是什么?

前端之家收集整理的这篇文章主要介绍了php – 建议内容关键字的有效库是什么?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
目前正在设计CMS以在我的网站上使用.我想知道是否有任何免费库可用于根据内容创建标签.

I like trees. Trees are plants that have leaves. Leaves on tree can be
multi-colored.

会产生标签树和树叶.

该库应该是PHP或JS.

编辑1:

我找到了一个简单的库来完成我的一半任务 – http://www.cafewebmaster.com/get-top-100-words-keywords-text-php

我已经编辑了库规范应该是什么(感谢@NullUserException的指导) –

>计算所有单词(忽略大小写和变形),抛出停用词并选择频率最高的单词
>编辑文本以使更具特定于该类型的单词(可能具有更低的频率)具有更高的值.例如,在示例中 – “多色”应该变得更高,因为它对于主题更具体.但是它应该包含一个前缀,表明它与主题有关(它将变成叶子多色).

编辑2:

算法应删除少于3个字符的单词,除非它们是大写字母或其他格式

您的CMS上的标签是否已定义?如果是,您可以将内容中的文本编入索引,并使用针对文本的所有已知标记进行搜索.选择得分最高的标签并呈现给用户.

索引和搜索可以使用http://lucene.apache.org/solr/完成

编辑:请注意,我建议您从管理面板(例如wordpress)中定义和管理您的标签/关键字.否则,您最终会得到数千个从您的文章生成的关键字,这些关键字永远无法帮助最终用户.

猜你在找的PHP相关文章