繁简转换

HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。

说明

·HanLP能够识别简繁分歧词,比如打印机=印表機。许多简繁转换工具不能区分“以后”“皇后”中的两个“后”字,HanLP可以。

算法详解

·《汉字转拼音与简繁转换的Java实现》——请查阅此文

  1. from pyhanlp import *
  2. # 繁简转化
  3. print(HanLP.convertToTraditionalChinese("“以后等你当上皇后,就能买草莓庆祝了”。发现一根白头发"))
  4. print(HanLP.convertToSimplifiedChinese("憑藉筆記簿型電腦寫程式HanLP"))
  5. # 简体转台湾繁体
  6. print(HanLP.s2tw("hankcs在台湾写代码"))
  7. # 台湾繁体转简体
  8. print(HanLP.tw2s("hankcs在臺灣寫程式碼"))
  9. # 简体转香港繁体
  10. print(HanLP.s2hk("hankcs在香港写代码"))
  11. # 香港繁体转简体
  12. print(HanLP.hk2s("hankcs在香港寫代碼"))
  13. # 香港繁体转台湾繁体
  14. print(HanLP.hk2tw("hankcs在臺灣寫代碼"))
  15. # 台湾繁体转香港繁体
  16. print(HanLP.tw2hk("hankcs在香港寫程式碼"))

17.

18.# 香港/台湾繁体和HanLP标准繁体的互转

19.print(HanLP.t2tw("hankcs在臺灣寫代碼"))

20.print(HanLP.t2hk("hankcs在臺灣寫代碼"))

21.

22.print(HanLP.tw2t("hankcs在臺灣寫程式碼"))

23.print(HanLP.hk2t("hankcs在台灣寫代碼"))

1.「以後等你當上皇后,就能買草莓慶祝了」。發現一根白頭髮

2.凭借笔记本电脑写程序HanLP

3.hankcs在臺灣寫程式碼

4.hankcs在台湾写代码

5.hankcs在香港寫代碼

6.hankcs在香港写代码

7.hankcs在臺灣寫程式碼

8.hankcs在香港寫代碼

9.hankcs在臺灣寫程式碼

10.hankcs在台灣寫代碼

11.hankcs在臺灣寫代碼

12.hankcs在臺灣寫代碼

---------------------

作者:Font Tian

汉语言处理工具pyhanlp的简繁转换的更多相关文章

  1. 利用 OpenCC 工具进行文字的简繁转换

    前言 近日在公司遇到一个需求,因为准备要推出海外版产品,所以需要将所有的简体文字转换为繁体文字.一开始是改了表面的文字,但是后面发现很多提示语也需要去改,所以找了一个工具去对所有 .m 文件进行批量文 ...

  2. js搞定网页的简繁转换

    对网页进行简繁字体转换的方法一般有两种:一是使用<简繁通>这样的专业软件,另外一种是制作两套版本的网页.显然,这两种方法都较为麻烦,而且专业软件一般不能用于免费的空间.笔者在这里给大家提供 ...

  3. 汉语言处理工具pyhanlp的拼音转换与字符正则化

    汉字转拼音 HanLP中的汉字转拼音功能也十分的强大. 说明: l HanLP不仅支持基础的汉字转拼音,还支持声母.韵母.音调.音标和输入法首字母首声母功能. l HanLP能够识别多音字,也能给繁体 ...

  4. [原创]使用OPENCC库进行简繁转换(C++代码)

    最近公司有一款游戏产品,字库存在问题,希望全自动进行简繁同屏自动转换的行为,减少工作量. 所以自己使用了WINDOWS自带的一些转换函数,但发现大量字出现异常,无法转换(测试iconv也发现无法转换) ...

  5. Office WORD如何简繁转换

    选中要转换的文字,工具-语言,中文简繁转换.

  6. SQL简繁转换函数

    declare @jall nvarchar(4000),@fall nvarchar(4000) select @jall=N'啊阿埃挨哎唉哀皑癌蔼矮艾碍爱隘鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱袄傲奥懊 ...

  7. javascript 简繁转换

    js 简繁转换 function copy(ob) { var obj=findObj(ob); if (obj) { obj.select();js=obj.createTextRange();js ...

  8. Elasticsearch高级搜索排序( 中文+拼音+首字母+简繁转换+特殊符号过滤)

    一.先摆需求: 1.中文搜索.英文搜索.中英混搜   如:"南京东路","cafe 南京东路店" 2.全拼搜索.首字母搜索.中文+全拼.中文+首字母混搜   如 ...

  9. HanLP极致简繁转换详细讲解

    HanLP极致简繁转换详细讲解 作者: hankcs(大快高级研究员 hanlp项目负责人) 谈起简繁转换,许多人以为是小意思,按字转换就行了.事实上,汉语历史悠久,地域复杂,发展至今在字符级别存在“ ...

随机推荐

  1. datatables弹窗报错信息屏蔽方法

    在使用datatables的时候,总是会弹出这样的warning: Error: DataTables warning: table id=data_table- Requested unknown ...

  2. CentOS7.5下安装Python3.7 --python3

    1.将本地安装包上传到远程主机上 scp Python-3.7.0.tgz root@123.206.74.24:/root 2.扩展 安装Python之前安装Python相关的依赖包(主要是u红色部 ...

  3. 使用 erlang OTP 模式编写非阻塞的 tcp 服务器(来自erlang wiki)

    参考资料:http://erlangcentral.org/wiki/index.php/Building_a_Non-blocking_TCP_server_using_OTP_principles ...

  4. selenium java maven自动化测试环境搭建

    版本说明: JDK 版本:1.8.0_112: Eclipse IDE: 4.6.1: Maven 版本:apache-maven-3.3.9: Selenium 版本: 3.0.1: Firefox ...

  5. openstack详细笔记-nova-glance-swift-cinder-keystone等

    一.openstack各大模块 1.openstack总架构图 http://3ms.huawei.com/km/blogs/details/2655265 2.nova 2.0架构图 2.1 nov ...

  6. 在github上参与开源项目贡献代码

    1 登录github, 点击自己感兴趣的repository的fork按钮,这样自己的github主页会有一个拷贝. 2 在自己本地修改同时保持和原来的repository同步: git remote ...

  7. 枚举Enum 的常用方法

    一.枚举介绍 通常定义常量方法和枚举定义常量方法区别 public class State { public static final int ON = 1; public static final ...

  8. 密码机制(PGP)

    01 PGP概念 02 PGP认证加密体系

  9. linux软件管理 YUM命令

    yum的优点 将所有软件包放到官方服务器上,当进行yum在线安装时可以自动解决依赖性问题 yum源文件 [root@ssgao1987 yum.repos.d]# cd /etc/yum.repos. ...

  10. hashlib使用

    提供摘要算法:主要提供SHA1,SHA224,SHA256,SHA384,SHA512,MD5算法 import hashlib m = hashlib.md5("ddddd".e ...