目前正在设计CMS以在我的网站上使用.我想知道是否有任何免费库可用于根据内容创建标签.
例
I like trees. Trees are plants that have leaves. Leaves on tree can be
multi-colored.
会产生标签树和树叶.
该库应该是PHP或JS.
编辑1:
我找到了一个简单的库来完成我的一半任务 – http://www.cafewebmaster.com/get-top-100-words-keywords-text-php
我已经编辑了库规范应该是什么(感谢@NullUserException的指导) –
>计算所有单词(忽略大小写和变形),抛出停用词并选择频率最高的单词
>编辑文本以使更具特定于该类型的单词(可能具有更低的频率)具有更高的值.例如,在示例中 – “多色”应该变得更高,因为它对于主题更具体.但是它应该包含一个前缀,表明它与主题有关(它将变成叶子多色).
编辑2:
算法应删除少于3个字符的单词,除非它们是大写字母或其他格式