---恢复内容开始--- 一.结巴中文分词涉及到的算法包括: (1) 基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG): (2) 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合: (3) 对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法. 结巴中文分词支持的三种分词模式包括: (1) 精确模式:试图将句子最精确地切开,适合文本分析: (2) 全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不…