主题模型

推荐系统技术 --- 文本相似性计算(二)

第一篇地址:https://segmentfault.com/a/1190000005270047上一篇中我们的小明已经中学毕业了,今天这一篇继续文本相似性的计算。首先前一篇不能解决的问题是因为我们只是机械的计算了词的向量,并没有任何上下文的关系,所以思想还停留在机器层面,还没有到更高的层次上来,正因为这样才有了自然语言处理这门课程了。今天我们稍微说说这个吧,后台留言很多朋

推荐系统技术文本相似性计算(三)实战篇

前两篇可以直接看我的专栏或者文本相似性计算(一)文本相似性计算(二)前面说了两篇了,分别介绍了TFIDF和向量空间的相关东西,然后介绍了主题模型,这一篇我们就来试试这两个东西。词向量就不在这篇试了,词向量和这两个关系不大,不好对比,不过我最后也给出了代码。0. 工具准备工欲善其事,必先利其器,那么我们先来利其器,这里我们使用的是python的gensim工具包,地址是:ht

推荐系统技术文本相似性计算(三)实战篇

前两篇可以直接看我的专栏或者文本相似性计算(一)文本相似性计算(二)前面说了两篇了,分别介绍了TFIDF和向量空间的相关东西,然后介绍了主题模型,这一篇我们就来试试这两个东西。词向量就不在这篇试了,词向量和这两个关系不大,不好对比,不过我最后也给出了代码。0. 工具准备工欲善其事,必先利其器,那么我们先来利其器,这里我们使用的是python的gensim工具包,地址是:ht