VIM从原理上认识^M问题
问题背景
VIM在打开文件的时候如果遇到两种换行符风格(dos与unix)共存的文件,通常会在行尾显示出烦人的^M。如果^M较少,比较容易定位到哪几行出了问题,但是如果^M较多,就很难搞。下面先给出解法,再来做分析。
解决方案
- ^M较少,需要定位哪几行包含^M,只需要在vim中输入:
/\r
- ^M较多,需要定位到哪几行不包含^M,只需要在vim中输入:
/^\(.*\r\)\@!.*
原理解析
要了解如何定位^M,首先得知道^M是如何产生的。要了解^M的产生原因,首先得了解VIM的fileformat——文件换行符风格。
- 三种换行符风格
换行符风格目前分了三种风格,分别是:
- DOS-format:采用\r\n换行,在vim中用"dos"表示,Windows系统默认风格
- unix-format:采用\n换行,在vim中用"unix"表示,unix派系系统默认风格
- Mac-format:采用\r换行,在vim中用"mac"表示,Mac系统默认风格
想确定当前文件是被vim判断为哪种文件格式,可以在vim内输入“:set fileformat”,如果是unix风格,会在左下角的命令输入行显示如下:
另外还可以用":set fileformats"查看当前配置的vim支持哪些换行符风格,如果能确定当前文件的格式不在可识别文件格式列表内,可以使用":set fileformats=unix,dos,mac"手动添加可识别格式。
三种风格的历史由来感兴趣的同学可以自行百度,还是挺有意思的。
- vim是如何判断文件的fileformat的
- 如果所有行都是以 "\r\n" 也就是<CR><NL>结尾,'fileformat' 会被设置为 "dos"
- 如果 "fileformats" 包含 "mac" 并且文件不含 "\r" 也就是 <NL> 字符,'fileformat' 会被设置为 "mac"
- 以上两种情况之外的,会设置为 ‘unix’
- ^M是如何产生的
因为只有当文件所有行都是以 "\r\n" 结尾,能被识别为 "dos" 格式,所有当文件内 "\r\n" 风格和 "\n" 风格共存的时候,就会被标志为 "unix" 风格,而在unix风格中,只有 "\n" 被识别为换行,多余的 "\r" 就会用^M标识出来,^M其实就是 "\r" 在vim中的字符表述。所以在上文中用 "\r" 作为匹配字符串的时候,会匹配到 ^M,如下图所示
- 匹配不包含^M的行
匹配包含某个字符串的行非常的简单,但是匹配不包含某个字符串的行,就需要花费一番功夫了。具体可以参考这篇博文:http://blog.sina.com.cn/s/blog_9eccc8e50102wd7h.html。博主也是参考了这篇博文之后,才摸索出了上面的匹配不存在^M的行的写法。
总结
本次最大的收获是从原理上理解了vim是如何判断文件换行符风格的,在了解了原理之后,才能更清晰的认识到^M产生的原因,并且轻松找到应对方案。另外也掌握了vim里面匹配不存在行的技巧,这是一个非常有用的技巧。
VIM从原理上认识^M问题的更多相关文章
- AJAX练习(一):制作可以自动校验的表单(从原理上分析ajax的作用)
继上文(AJAX(一)AJAX的简介和基础)作为联系. 传统网页在注册时检测用户名是否被占用,传统的校验显然缓慢笨拙. 当ajax出现后,这种体验有了很大的改观,因为在用户填写表单时,签名的表单项已经 ...
- 从原理上搞定编码(二)-- Web编码
周末宅在家里睡完觉就吃饭,吃完饭接着睡觉,这日子过的实在是没劲啊.明明还有计划中的事情没有做, 为什么就是不想去做呢,这样的生活持续下去,必然会成为一个彻头彻尾的loser.上一篇写的 初识编码 ,这 ...
- 从原理上理解MySQL的优化建议
从原理上理解MySQL的优化建议 预备知识 B+树索引 mysql的默认存储引擎InnoDB使用B+树来存储数据的,所以在分析优化建议之前,了解一下B+树索引的基本原理. 上图是一个B+树索引示意图, ...
- vim plugin 原理
vim 个性化设置与功能扩展均通过 script 来实现,这种 script 又叫 plugin.plugin 是 vim 的核心与精髓. 最常用的配置文件 vimrc,也是一种 plugin.换句话 ...
- vim安装不上
前阵子,刚安装Ubuntu时,安装vim的问题,现在些出来分享一下.apt-get install vim正在读取软件包列表... 完成正在分析软件包的依赖关系树正在读取状态信息... 完成有一些软件 ...
- 001_从原理上搞定编码-- Base64编码
开发者对 Base64编码肯定很熟悉,是否对它有很清晰的认识就不一定了.实际 上Base64已经简单到不能再简单了,如果对它的理解还是模棱两可实在不应该.大概介绍一下Base64的相关内容,花几分钟时 ...
- 从原理上理解NodeJS的适用场景
NodeJS是近年来比较火的服务端JS平台,这一方面得益于其在后端处理高并发的卓越性能,另一方面在nodeJS平台上的npm.grunt.express等强大的代码与项目管理应用崛起,几乎重新定义了前 ...
- 从原理上搞定编码-- Base64编码
BASE64是一种编码方式,通常用于把二进制数据编码为可写的字符形式的数据.这是一种可逆的编码方式.编码后的数据是一个字符串,其中包含的字符为:A-Z.a-z.0-9.+./共64个字符:26 + 2 ...
- apache和nginx原理上的不同之处
今天群里提到面试时问到apache和nginx原理有什么不同,一时还真没想起,想到的只是他们的优缺点,便搜索了下.记录学习下.顺便记录下优缺点吧. 原理不同之处: 为什么Nginx的性能要比Apach ...
随机推荐
- 容器版Jenkins连接Kubernetes---------非容器版jenkins是无法安装kubenetes插件的,所以无法连接k8s
容器版Jenkins连接Kubernetes 特别注意:必须用谷歌浏览器,而且非容器版jenkins是无法安装kubernetes插件的,所以无法连接k8s 一.环境说明 OS系统版本:Ubuntu ...
- 强化学习——Q-learning算法
假设有这样的房间 如果将房间表示成点,然后用房间之间的连通关系表示成线,如下图所示: 这就是房间对应的图.我们首先将agent(机器人)处于任何一个位置,让他自己走动,直到走到5房 ...
- Ubuntu下Iptables的简单运用,开放/关闭端口,禁止/允许IP或IP段访问...
首先添加规则有两个参数:-A和-I,其中-A是添加到规则的末尾:-I可以插入到指定位置,没有指定位置的话默认插入到规则的首部,由于匹配规则是从上往下,依次查找的,可能出现配置的规则冲突导致后续的规则不 ...
- 对ysoserial工具及java反序列化的一个阶段性理解【未完成】
经过一段时间的琢磨与反思,以及重读了大量之前看不懂的反序列化文章,目前为止算是对java反序列化这块有了一个阶段性的小理解. 目前为止,发送的所有java反序列化的漏洞中.主要需要两个触发条件: 1. ...
- Blynk系列随笔
Blynk系列随笔 1.基于Blynk服务器搭建物联网测试Demo 2.本地 Blynk服务器搭建
- Ubuntu14.04LTS 下配置Tomcat Hadoop eclipse环境
下在相关软件: (genju yingjian xuanze xitong weishu,根据系统是32位还是64位选择软件的版本:jdk和eclipse) HADOOP:http://mirrors ...
- UWP笔记-消息弹窗自动淡出
为了让用户有个更好的UI交互,可以增加自动淡出的消息弹窗,例如:网易云音乐UWP,切换播放模式时,出现的类似消息提示. 右键项目,添加用户控件 UserControlDemo.xaml: <Us ...
- (模板)求逆矩阵luoguP4783
题目链接:https://www.luogu.org/problem/P4783 题意:求矩阵的逆. 思路:高斯消元法求矩阵的逆,n为400,卡常,我是开了O2优化才AC的.. AC代码: #incl ...
- #论文阅读# Universial language model fine-tuing for text classification
论文链接:https://aclweb.org/anthology/P18-1031 对文章内容的总结 文章研究了一些在general corous上pretrain LM,然后把得到的model t ...
- 24.Azkaban调度脚本的编写
启动azkaban 在启动了server和excutor之后,在浏览器打开azkaban,会发现不能打开,日志报这个错误 at sun.security.ssl.InputRecord.handleU ...

