google最近新开放出word2vec项目,该项目使用deep-learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算. word2vec项目首页:https://code.google.com/p/word2vec/,文档比较详尽,很容易上手.可能对于不同的系统和gcc版本,需要稍微改一下代码和makefile.具体到我的mac系统,源代码中所有#include <malloc.h>的地方都需要…