需要中文版《The Scheme Programming Language》的朋友可以在此留言(内附一小段译文)
首先给出原著的链接:http://www.scheme.com/tspl4/。
我正在持续翻译这本书,大概每天都会翻译两小时。若我个人拿不准的地方,我会附上原文,防止误导;还有些不适合翻译的术语,我会特意不翻译。
想看翻译的人,可以在下面留言。发这篇博文,就是为了看看有多少人需要,我的翻译有没有公开的价值。
若真有人需要,我可以把翻译不断分享给大家~
在此先给出一小段译文,分享给大家。
本段译文只在排版上于原著每段中加了些换行,别的均与原著保持了一致。
Chapter 7. 输入和输出
所有的输入和输出操作都经由 端口 执行。
端口就是(可能是无限大的)数据流的指针,这数据常为一个文件。
流是一个通路,可供程序存取字节或字符。
端口类型有:输入端口、输出端口、双向端口。
端口是一等对象,和Scheme中的其他对象一样。
端口没有供打印的表示方法(原文是have a printed representation)。
有三个内置的端口:通用输入端口、通用输出端口、通用错误端口,
分别连接到进程的:标准输入、标准输出、标准错误流。
语言本身提供了很多种打开新的端口的方法。
输入端口往往指向有限的流,例如存储在硬盘上的输入文件。
如果一个输入操作(例如:get-u8、get-char、get-datum)从一个已达有限流末尾的端口读取,
则会返回一个特殊的 eof (end of file) 对象。
谓词 eof-object? 可以用来判断输入操作的返回值是否是eof对象。
端口类型有binary和textual。
binary端口允许程序于流中读写8-bit无符号字节、"octets,"。
textual端口允许程序读写字符。
很多时候,流被组织成字节序列, 但这些字节其实是字符的编码。
此时,可以借助transcoder创建textual端口,从而在输入时将字节解码成字符、在输出时将字符编码成字节。
transcoder内封装了codec,它确定了字符如何表示成字节。
有三个标准的codec:latin-1 codec, Unicode utf-8 codec, Unicode utf-16 codec。
在 latin-1 中,每个字符用一个字节表示。
在 utf-8 中,每个字符用一到四个字节表示。
在 utf-16 中,每个字符用两个或四个字节表示。
transcoder内还封装了eol style,用来确定 识别哪种 以及 如何识别 行尾标志。
如果 eol style 是 none,那么不识别任何一种行尾标志。
另外六个标准 eol styles 如下所示:
| lf: | line-feed 换行字符 |
| cr: | carriage-return 回车字符 |
| nel: | Unicode next-line C-n字符 |
| ls: | Unicode line-separator 行分割字符 |
| crlf: | 换行字符+回车字符 |
| crnel: | C-n字符+回车字符 |
不同的 eol style 下,输入输出操作也会不同。
输入时,除 none 之外的所有 eol style 下,均会将 各种行尾标志 转换为 单换行字符。
输出时,除 none 之外的所有 eol style 下,均会将 换行字符 转换为 各自风格的行尾标志。
在输入方向,除 none 之外的所有 eol style 都是等价的;
而在输出方向,则只有 none 和 lf 是等价的。
除了 codec 和 eol style,transcoder内只还封装了一块信息:error-handling模式, 确定了当编码解码错误出现时,会如何处理。
例如,在输入方向上,用封装的 codec 无法将一个字节序列转换成字符;
或者,在输出方向上,用封装的 codec 无法将一个字符转换成字节序列。
error-handling模式有:ignore, raise, replace。
在 ignore 模式下,出错的字节序列或字符会被忽略。
在 raise 模式下,会抛出一个异常,类型是:i/o-decoding 或 i/o-encoding;
在输入方向,端口定位到字节序列之后。
在 replace 模式下,会产生一个替换的字符或字符编码:
在输入方向,替换字符是 U+FFFD,
而在输出方向,替换字符则如下:
当 codec 为 utf-8 或 utf-16 时,替换字符是 U+FFFD;
当 codec 为 latin-1 时,替换字符则是 问号字符 ( ? )。
为了效率,端口会有缓存机制, 从而消除向操作系统逐字节或字符取用的开销。
标准的buffer模式有三个:block、line、none。
在block模式下,将输入输出流分成很多块分别操作,每块流的大小与实现相关。
在line模式下,缓存将构建成一行一行的,或者是实现相关的大小。
上面这两种模式,仅在 textual输出端口 中有明显区别;
因为 binary端口 中并不分行,而 输入 则往往在流开始可读时便直接读取了。
在none模式下,没有缓存,因此会直接输出到流中,也仅在需要时才去输入。
本章余下的内容有:
transcoder上的操作、
文件端口、标准端口、字符串和字节向量端口、自定义端口(custom ports)、
通用端口操作、输入操作、输出操作、
方便的输入输出、文件系统操作、字节向量和字符串的相互转换。
需要中文版《The Scheme Programming Language》的朋友可以在此留言(内附一小段译文)的更多相关文章
- 一群牛人翻译:The Swift Programming Language 中文版
无聊闲逛GIthub,看到一群牛人在github上创建了一个关于Switf的文档翻译项目 The Swift Programming Language 中文版 项目地址:中文版 Apple 官方 Sw ...
- The Swift Programming Language 中国版
iSwifting社会的 Swift 兴趣交流群:303868520 iOS 微信公众账号:iOSDevTip Swift 微信公众账号:SwiftDev iSwifting社区 假设你认为这个项目不 ...
- 不忘初心 --- 重读<<The C Programming Language>>
这篇文章应该发布在好几年前,2011年计算机界大师Dennis Ritchie仙逝,那时对大师的映象还停留在大一刚学编程时:Unix的合作开发者,C语言的发明人.通过网上的纪念文章<<Un ...
- 转:从《The C Programming Language》中学到的那些编程风格和设计思想
这儿有一篇写的很好的读后感:http://www.cnblogs.com/xkfz007/articles/2566424.html 读书不是目的,关键在于思考. 很早就在水木上看到有人推荐& ...
- iOS Swift-元组tuples(The Swift Programming Language)
iOS Swift-元组tuples(The Swift Programming Language) 什么是元组? 元组(tuples)是把多个值组合成一个复合值,元组内的值可以使任意类型,并不要求是 ...
- iOS Swift-控制流(The Swift Programming Language)
iOS Swift-控制流(The Swift Programming Language) for-in 在Swift中for循环我们可以省略传统oc笨拙的条件和循环变量的括号,但是语句体的大括号使我 ...
- iOS Swift-简单值(The Swift Programming Language)
iOS Swift-简单值(The Swift Programming Language) 常量的声明:let 在不指定类型的情况下声明的类型和所初始化的类型相同. //没有指定类型,但是初始化的值为 ...
- Java Programming Language Enhancements
引用:Java Programming Language Enhancements Java Programming Language Enhancements Enhancements in Jav ...
- The Swift Programming Language 英文原版官方文档下载
The Swift Programming Language 英文原版官方文档下载 今天Apple公司发布了新的编程语言Swift(雨燕)将逐步代替Objective-C语言,大家肯定想学习这个语言, ...
随机推荐
- IE8下解决position:flxed无效的问题
只需将文档类型声明改成如下方式即可 <!DOCTYPE html>
- GDI学习之俄罗斯方块
做个玩玩 public Form1() { InitializeComponent(); } #region 定义砖块int[i,j,y,x] Tricks:i为那块砖,j为状态,y为列,x为行 pr ...
- SQL2012数据库加密方法
1.非对称密钥来保护新的对称密钥 /*--测试环境 Microsoft SQL Server 2012 (SP1) - 11.0.3000.0 (X64) Oct 19 2012 13:38:57 C ...
- grep, sed, awk
这几个工具是shell中非常好用的文本流处理工具,可以进行查找,编辑或者分析等工作,它们都支持正则表达式,也支持使用shell内置的变量 grep grep是一个字符串比较工具,用于从文件中提取满足条 ...
- SSI
一.简介 SSI(Server Side Includes)技术,是为WEB服务器提供的一套命令,在HTML文档中通过注释行调用的命令或指针,就可以将文本.图形或应用程序信息包含到网页中. SSI具备 ...
- Codeforces Round #254 DZY Loves Colors
题意:输入n, m ; 有n给位置, 初始时第i个位置的color为i, colorfulness为0. 有m次操作,一种是把成段的区域color更新为x, 对于更新的区域,每个位置(令第i ...
- mysql存储过程procedure
传送门 http://www.blogjava.net/sxyx2008/archive/2009/11/24/303497.html ) ); DROP PROCEDURE IF EXISTS ju ...
- Hadoop Resource
http://www.aiopass4sure.com/cloudera-exams/ccd-410-exam-questions/which-process-describes-the-lifecy ...
- perl学习笔记
一.正则表达式 匹配一个文件中的某个单词,并打印出来 #!/usr/bin/perl use strict; use warnings; ; open(FILE, "< temp.pl ...
- liunx中的进程与线程
1. 进程和线程 进程和线程是程序运行时状态,是动态变化的,进程和线程的管理操作(比如,创建,销毁等)都是有内核来实现的. Linux中的进程于Windows相比是很轻量级的,而且不严格区分进程和线程 ...