西南大学张志英等人[18]专门针对微博用户的微博数据进行热点事件的研究和发现,并提出了基于主题模型和贝叶斯算法的文本分类,结合两者对微博静态的文本信息进行深入研究,检测文本中的热点事件。并提出了一种动态时间检测方法,该方法基于社区发现和图核算法对事件背后的信息进行解析和发现。作者最后实时抓取微博数据对算法进行验证,结果也能达到预期效果,但是数据量只有几十MB,并没有针对大数据量进行研究,而微博数据又是数据量巨大、稀疏、冗余的特点,针对这些挑战并不能很好的解决和处理。
751论文网手机版...
主页:http://www.751com.cn
关闭返回