日文假名和韩国谚文 回忆上次内容
  • 上次回顾了非ascii的拉丁字符编码的进化过程
  • 0-127 是 ascii 的领域
 
  • 世界各地编码分布
  • 拉丁字符扩展 ascii 共 16 种
  • 由iso组织制定
  • 从iso-8859-1
  • 到iso-8859-16
 
  • 无法同时显示俄文和法文
 
 
  • 此时中日韩的文字也需要进入计算机
  • 象形文字的字符集超级巨大
  • 日本、韩国也用汉字
  • 数量2万起步
 

 
添加图片注释,不超过 140 字(可选)
 
  • 真能把 如此巨大的字符集
  • 编码进入计算机吗?
 
文字
  • 日本汉字我们可以直接看懂

 
添加图片注释,不超过 140 字(可选)
 
  • 地铁里的 标记

 
添加图片注释,不超过 140 字(可选)
 
  • 日文中 为什么
  • 这么多汉字呢?
 
遣唐使
  • 皇子公卿僧侣
  • 都要 专门
  • 来中国 朝圣
  • 学文化
 

 
添加图片注释,不超过 140 字(可选)
 
  • 日文 很多词
  • 都 能看懂
  • 管 老师 叫做 先生
  • 管 火车 叫做 机车
  • 管 学习 叫做 勉强
  • 管 辣 叫 辛
 

 
添加图片注释,不超过 140 字(可选)
 
  • 特别辣
  • 叫 激辛
 
  • 这些汉字怎么来的呢?
空海和尚
  • 从日本来的 留学僧
  • 不但学习 汉语佛法
  • 也学习 汉字书法
 

 
添加图片注释,不超过 140 字(可选)
 
  • 并把这些文化带回日本
  • 汉字 成为 书写符号
  • 口头系统的 日语
  • 可以 记录下来了
 
 
  • 正如同
  • 使用圣书体的一些字型
  • 将腓尼基的口语记录下来
 
 
万叶集
  • “叶” 是 “世”
  • 即时代
  • 希望能流传到万世
 
  • 各种各样的歌
  • 敬畏自然山神、河神 的歌
  • 男女恋爱 的歌
  • 挽歌
 

 
添加图片注释,不超过 140 字(可选)
 
  • 汉字
  • 数量很多
  • 记起来、写起来也比较复杂
  • 只有 最有文化的人
  • 才能 都写下来
 
 
  • 自己 写东西 的时候
  • 有些字 忘了 怎么写
  • 就拿一个 同音字
  • 来 假借
 
 
日语假名
  • 假借的 次数 多了
  • 就 固定了下来
 
  • 形成了
  • 专门的 日语拼音 字符
 

 
添加图片注释,不超过 140 字(可选)
 
  • 假名
  • 存在着多个体系
  • 不同的时代
  • 不同的地域
 
 
平假名
  • 直到明治33年
  • 发行公文才得以统一
 
  • 万葉仮名(假名)
  • 草书风格的符号
  • 有女性的柔美
  • 抄文众多
  • 《枕草子》
  • 《源氏物语》
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 把写法也固定了下来
  • 成为铅字
 
  • 万葉仮名(假名)
  • 形成了
  • 现代假名系统 中的 平假名
 
 
  • 除了平假名之外
  • 还有片假名
 
片假名
  • 片假名来自 汉字 的 一片
  • 也是一种 假名系统
  • 有 硬朗的 楷书 转化而来
 

 
添加图片注释,不超过 140 字(可选)
 
  • 明治维新时期
  • 大量欧美外来语涌入日本
  • 日语只取其读音
  • 用片假名将其表示出来
 
  • 假名系统
  • 是 拼音文字 系统
  • 字符数量 不多
 
最初的日文编码
  • 在ascii的基础上
  • 把片假名加了上去
 

 
添加图片注释,不超过 140 字(可选)
 
  • 字型什么样呢?
假名字形码

 
添加图片注释,不超过 140 字(可选)
 
  • 可以把这些片假名输出出来吗?
输出假名
  • 下面的代码是将a1到e0
  • 封包进入一个字节
  • 然后再将字节解码
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 可以动手试试
  • 以后我们会详细讲解封包解包
 
  • 范围[0xa1, 0xe0)

 
添加图片注释,不超过 140 字(可选)
勇者斗恶龙
  • 当时的日文
  • 能显示出ascii和假名的字型
  • 就已经很厉害
 

 
添加图片注释,不超过 140 字(可选)
 
  • 想显示出中文字型
  • 是不可能的
 
日本汉字
  • 是中文的拼音文字
  • 只是假名都加在一起就至少 100+
  • 128 根本不够用
 

 
添加图片注释,不超过 140 字(可选)
 
  • 更何况日文里面用日本汉字
  • 虽然只有2000个不到
  • 但是是文化的象征
 
  • 不过假名毕竟是假的
  • 日文中最厉害的还是汉字
 
汉字文化
  • 日语中混有各种汉字

 
添加图片注释,不超过 140 字(可选)
 
  • 感觉根本不用翻译

 
添加图片注释,不超过 140 字(可选)
 
  • 也会造一些日本汉字
汉字
发音
含义
なぎ
风平 浪静
しずく
水滴 如雨下
しつけ
教育
さかき
寺庙里的 树
评选年度汉字

 
添加图片注释,不超过 140 字(可选)
 
  • 所以日文中的字符直接超过2000+
  • 1 个字节 是不够了
  • 至少需要 2 个字节
 

 
添加图片注释,不超过 140 字(可选)
 
  • 日本规格协会制定标准
  • JIS X 0212
 
  • 点阵字库 产生了
  • 日本汉字的黑体模式
 
无衬线黑体风格
  • 无衬线
  • 黑体
  • 注重实效
  • 注重清晰度
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 任何字帖一般都有两种风格
  • 板正规范的生硬风格
  • 圆润灵动的手写风格
 
手写风格

 
添加图片注释,不超过 140 字(可选)
 
  • 不像大写字母
  • 那么生硬
 

 
添加图片注释,不超过 140 字(可选)
 
  • 就像小写字母
  • 那么圆滑
 
  • 韩文字符又是如何编码的呢?
韩文
  • 韩文也是一种拼音文字
  • 基础字母有二十四个
  • 符号是朝鲜王朝世宗大王时创作的
  • 从此韩文有了谚文
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 但是韩国士大夫会写汉字
  • 不愿意推广谚文
 
拼音
  • 不过拼音文字
  • 更容易一些
 

 
添加图片注释,不超过 140 字(可选)
 
  • 谚文书写 普及速度 比汉字书写 快得多
  • 拼音 是有结构的
谚文结构
  • 谚文是由表音符号组合而成的
  • 有各种间架结构
 

 
添加图片注释,不超过 140 字(可选)
 
  • 这些声旁都发什么音呢?
声音
  • 韩文名字
  • 宋仲基(송중기)
  • 金喜善(김희선)
  • 李英爱(이영애)
  • 阿一古(아이구)
  • 圆圈不发音
 

 
添加图片注释,不超过 140 字(可选)
 
  • 从此就连哎呦喂(阿一古)
  • 都有了标准发音方法
  • 用拼音文字把读音固化下来
 
  • 谚文有多少字符呢?
谚文字符
  • 声母韵母拼写在一起算一个
  • 共 554 个
 
  • 而且这还不算朝鲜汉字

 
添加图片注释,不超过 140 字(可选)
 
  • 这554个基础字符导致
  • 1 个字节不够
  • 2 个字节才够
 
  • 韩文的字符集为
  • KS X 1001
 
总结
  • 日韩各有 编码格式
  • 日本
  • 有假名
  • 五十音
  • 一字节 可以勉强放下
 
  • 有日本汉字
  • 字符数量超过20000+
 
 
  • 韩国
  • 有谚文
  • 数量超过500
  • 一个字节 放不下
 
  • 有朝鲜汉字
  • 字符数量超过20000+
 
 
 

 
添加图片注释,不超过 140 字(可选)
 
  • 作为 汉字源头的中国
  • 究竟应该 如何对汉字 进行编码 呢?
 


[oeasy]python0122_日韩字符_日文假名_JIS_Shift_韩国谚文的更多相关文章

  1. 《中日韩联合开发 - Asianux Server 3》(Asianux Server 3.0)[ISO]

    中文名: 中日韩联合开发 - Asianux Server 3英文名: Asianux Server 3.0资源格式: 光盘镜像发行时间: 2007年制作发行: 红旗软件(中国)MiracleLinu ...

  2. BZOJ_4566_[Haoi2016]找相同字符_后缀自动机

    BZOJ_4566_[Haoi2016]找相同字符_后缀自动机 Description 给定两个字符串,求出在两个字符串中各取出一个子串使得这两个子串相同的方案数.两个方案不同当且仅当这两 个子串中有 ...

  3. C#中的流_字节_字符_字符串之间的相互转换

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.I ...

  4. 学界 | Yann LeCun新作,中日韩文本分类到底要用哪种编码?

    https://www.wxwenku.com/d/102093756 AI科技评论按:前几天,Yann LeCun与其学生 张翔在arXiv上发表了一篇新作「Which Encoding is th ...

  5. 字节与字符_字节流与字符流_ASCII与Unicode_GB2312_GBK_GB18030_BIG-5

    字节(Byte):通常将可表示经常使用英文字符8位二进制称为一字节. 一个英文字母(不分大写和小写)占一个字节的空间,一个中文汉字占两个字节的空间. 符号:英文标点2占一个字节,中文标点占两个字节. ...

  6. Tesseract-OCR 3.05 躲过语言文字识别(运行程序+中英日韩语言包)

    最新版本 静态编译 tesseract 3.05.00dev leptonica-1.73 libgif 5.1.3 : libjpeg 8c : libpng 1.6.16 : libtiff 3. ...

  7. 关于PHP程序员技术职业生涯规划 2017年3月5日韩 天峰

    看到很多PHP程序员职业规划的文章,都是直接上来就提Linux.PHP.MySQL.Nginx.Redis.Memcache.jQuery这些,然后就直接上手搭环境.做项目,中级就是学习各种PHP框架 ...

  8. Tesseract-OCR 3.05 多过语言文字识别(运行程序+中英日韩语言包)

    最新版本 静态编译 tesseract 3.05.00dev leptonica-1.73 libgif 5.1.3 : libjpeg 8c : libpng 1.6.16 : libtiff 3. ...

  9. 680. Valid Palindrome II【Easy】【双指针-可以删除一个字符,判断是否能构成回文字符串】

    Given a non-empty string s, you may delete at most one character. Judge whether you can make it a pa ...

  10. Java 连接数据库及字符编码

    通过JDBC方式连接MYSQL数据库: public static Connection getConnection(){ String username="root" ; Str ...

随机推荐

  1. Linux系统中如何查看磁盘情况

    Linux不像windows系统那样方便的图形界面,特别是作为服务器使用的时候,只有命令行可以使用. 我有个云服务器平时用来做一些数据分享用的,最近想看看磁盘和其中文件的占用情况,于是搜索并学习了一些 ...

  2. ISCC 2024 练武题 misc趣题记录

    Number_is_the_key 题目 The answers to the questions are hidden in the numbers. 文件是空白的xlsx文件 我的解答: 乱点发现 ...

  3. Asp.NetCore3.1 asp.net 5.0 中多次读取 Request.Body Ajax Post过来的JSON数据等 已验证有效

    首先,以下方式是错误的(这个重复读取只能在using语句里面生效,因为用了ms对象赋值,当using结束后ms资源被释放,Request.Body就无法再读了) [HttpPost] public a ...

  4. C# WinForm控件及其子控件转成图片(支持带滚动条的长截图)

    概述(Overview) 参考了网上的分析,感觉都不太理想:1.一个控件内如果包含多个子控件时没有考虑顺序问题:2.超出控件可显示区域时不能长截图,有滚动条会多余截取了滚动条.这个随笔旨在解决这个问题 ...

  5. request to https://registry.npm.taobao.org/cnpm failed, reason: certificate has expired

    换华为的,否则会出问题:cnpm confg set registry https://mirrors.huaweicloud.com/repository/npm/ npm ERR! code CE ...

  6. (三)Redis 线程与IO模型

    1.Redis 单线程 通常说 Redis 是单线程,主要是指 Redis 的网络 IO 和键值对读写是由一个线程来完成的,其他功能,比如持久化.异步删除.集群数据同步等,是由额外的线程执行的,所以严 ...

  7. (五)基于selenium实现12306模拟登陆

    这里介绍一款强大验证码识别平台:超级鹰 - 超级鹰:http://www.chaojiying.com/about.html - 注册:普通用户 - 登录:普通用户 - 题分查询:充值 - 创建一个软 ...

  8. 《Android开发卷——自定义日期选择器(一)》

    (小米手机) (中兴手机) 在实际开发中,Google官方提供的时间选择器API已经不能满足于我们的需要了,所以很多公司都是采用自定义的形式来实现日期选择器. 这个例子很简单,定义三个NumberPi ...

  9. NumPy 舍入小数、对数、求和和乘积运算详解

    舍入小数 在 NumPy 中,主要有五种方法来舍入小数: 截断 去除小数部分,并返回最接近零的浮点数.使用 trunc() 和 fix() 函数. 示例: import numpy as np arr ...

  10. Luban小试牛刀

    Luban小试牛刀 LubanUnity LubanUnity配置工具配置解决方案 简介 Github  文档   视频教程  Unity工具 个人感觉挺强大,便捷的,适合中大型游戏项目的配置工作.小 ...