前言 cutoff是一个比较冷门的概念,相比于DP经典算法的编辑距离,cutoff距离只局限于自然语言处理领域.提出cutoff距离的起因很简单,因为经典的编辑距离无法很好地衡量在字符串搜索过程中的编辑距离. 比如我们要对一个错误的字符串进行纠正,我们会用编辑距离去衡量可能正确字符串和错误字符串之间的差异.但是编辑距离有一个很大的问题就是对于自动机匹配过程存在缺陷,在自动机匹配的过程中编辑距离会变得很大.(很明显对于词库比较大的情况,必须要使用自动机)比如hello很有可能是hellx的正确单词…