php – 计算趋势主题

前端之家收集整理的这篇文章主要介绍了php – 计算趋势主题前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

假设我正在根据各种标准从twitter收集推文,并将这些推文存储在本地mysql数据库中.我希望能够使用计算机热门话题,比如twitter,可以是1-3个单词的长度.

是否有可能编写一个脚本来做这样的PHPMysqL

我已经找到了在你能够获得术语计数后如何计算哪些术语“热”的回答,但我坚持第一部分.如何将数据存储在数据库中,如何计算数据库中1-3个字长的术语频率?

最佳答案
来自我的热门话题收据:
1.获取推文
2.将每个推文按空格分成n-gram(如果你想要3个字长,最多3克)数组
3.从url,@ username,常用词和垃圾字符中过滤掉每个数组
4.统计所有独特的关键字/短语频率
5.静音一些垃圾词/短语

是的,你可以在PHP& MysqL;)

原文链接:https://www.f2er.com/mysql/432932.html

猜你在找的MySQL相关文章