揭秘String类型背后的故事——带你领略汇编语言魅力
字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。在程序设计中,字符串(string)为符号或数值的一个连续序列,如符号串(一串字符)或二进制数字串(一串二进制数字)。
String类型你一定不陌生,毕竟每一位coder都是从var str1 = “Hello World”过来的。
但它真的就只是如此吗?听我娓娓道来。
一、思考
在 Swift 开发使用字符串的过程中,你是否有思考过以下问题?
- 1 个字符串变量占用多少内存?
- 字符串 str1、str2 的底层存储有什么不同?
- 如果对 str1、str2 进行拼接操作,str1、str2 的底层存储又会发生什么变化?
如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是比较了解的。
二、1 个字符串变量占用多少内存?
方法 1:MemoryLayout
首先,可以借助 Swift 自带的 MemoryLayout 来测试一下
方法 2:汇编
另外,我们也可以借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储
- 实际上分析其他语法、系统库的底层,都可以借助汇编语言
- 比如多态的原理、泛型的原理、Array 的底层、枚举的底层等等
另外,不仅仅是 Swift,C、C++、OC 的底层分析,依然可以借助汇编语言
- 毕竟你写的每一行有效代码,最终都是要转成机器指令(0 和 1)
- 而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令
- 能读懂汇编指令,就相当于能读懂机器指令,知道 CPU 具体在干嘛(操作了什么寄存器,操作了哪块内存)
- 本教程的代码是直接跑在 Mac 的命令行(CommandLineTools)项目上
- 因此展示的汇编代码是基于 X64 的 AT&T 格式汇编,并非 iOS 真机设备的 ARM 汇编
- 其实不同种类的汇编之间有极大的相似性,只是有些指令的叫法不一样
跟微软的 Visual Studio 一样,Xcode 也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下
- 在某一行需要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)
- 菜单:`Debug` > `Debug Workflow` > `Always Show Disassembly`
- `Assembly` 译为汇编, `Disassembly` 译为反汇编
- 运行程序,看到反汇编界面
如果你的反汇编经验十足,根据第 16、17 行的汇编就可以推敲出来,String 是占用 16 个字节
- 因为它用了 rax、rdx 寄存器存放字符串 str 的内容,而 rax、rdx 都是 8 字节的
汇编的内容太多了,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。
三、字符串的底层存储
窥探内存
此前我写了个可以窥探 Swift 变量内存的小工具:https://github.com/CoderMJLee/Mems
- 现在用它来窥探下字符串的 16 字节里面,究竟存储着什么数据
- `Mems.memStr(ofVal:)` 默认情况下按照 8 个字节一组来显示内存数据
- 传递参数 `alignment: .one` 是按照 1 个字节一组来显示内存数据
字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
- 它直接将所有字符的 ASCII 值存储在 str1 的 16 字节中
- 最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符
拼接
可以发现,当对 str1 进行拼接 "ABCDE" 的时候
- 它最终是将 "0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中
- 最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
- 可以看得出来,目前 16 个字节已经存满了,那如果再拼接 1 个字符呢?
可以看到,str1 里面存储的数据发生了非常大的变化,每一个字符的 ASCII 值不见了,
- 那里面的 16 字节具体是什么含义呢?
- 所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?
其他情况
如果一开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?
相信你能猜到是这个结果
- 这 16 个字节里面并没有出现任何一个字符的 ASCII 值
- 而且这 16 个字节跟 `第27行的str1` 还是有所区别
- 虽然它们的字符串内容都是"0123456789ABCDEF"
如果对 str2 进行拼接操作
不难发现:这时 str2 的 16 字节又发生了变化,跟 `第27行的str1` 是有点相似的
如何解决上述疑问?
上述的种种疑问,光看打印出来的内存数据是无法解决的,但是都可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,因为文章的篇幅有限,平时工作也比较忙,我把上述问题的详细剖析过程录制成了长达 2 个多小时的视频,有兴趣的朋友可以用 1.5~2 倍速度观看
- 链接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA
- 提取码:kzrk
- 视频对于没有汇编基础的朋友来说,可能会有点难度,最好挑一个头脑清醒的时间去观看
- 看完视频后,希望大家能够确切地感受到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面。
四、最后
最后想多说一句:汇编能给你带来的价值远远不止这篇文章所说的窥探字符串的底层,对你的程序生涯影响绝对是终生受益的(数据结构与算法功底也是如此),比如你还能玩转软件破解、游戏外挂等,这是我此前用【汇编\C++】编写的一个游戏外挂:https://github.com/CoderMJLee/SeemygoPVZCheater
汇编语言是最接近于机器语言的编程语言。如果说机器语言是计算机操作的本质,那么汇编语言就是最最接近本质的语言。汇编语言能够让你更好的理解高级语言,学会汇编后,你可以通过修改高级语言的代码来提高算法所不能提高的效率。
在编程领域,字符串虽然是所有编程语言中最重要的部分之一,但它也仅仅是这片领域的一隅。对程序员而言,唯有不断的探索学习更多技术,才能在这片领域中纵横遨游。
以上就是我的技术分享,感觉意犹未尽还想学的朋友,送福利了!!想获取更多技术提升秘籍,欢迎加微信:19950277730,我在这里为你随时解答。这里有很多如 iOS、数据结构与算法等编程技巧的免费视频和学习资料。
揭秘String类型背后的故事——带你领略汇编语言魅力的更多相关文章
- C# 利用反射动态创建对象——带参数的构造函数和String类型
C# 利用反射动态创建对象——带参数的构造函数和String类型 最近笔者有一个想法需要利用反射动态创建对象(如string,int,float,bool,以及自定义类等)来实现,一直感觉反射用不好, ...
- 背后的故事之 - 快乐的Lambda表达式(一)
快乐的Lambda表达式(二) 自从Lambda随.NET Framework3.5出现在.NET开发者眼前以来,它已经给我们带来了太多的欣喜.它优雅,对开发者更友好,能提高开发效率,天啊!它还有可能 ...
- ElasticSearch 5学习(9)——映射和分析(string类型废弃)
在ElasticSearch中,存入文档的内容类似于传统数据每个字段一样,都会有一个指定的属性,为了能够把日期字段处理成日期,把数字字段处理成数字,把字符串字段处理成字符串值,Elasticsearc ...
- 背后的故事之 - 快乐的Lambda表达式(二)
快乐的Lambda表达式 上一篇 背后的故事之 - 快乐的Lambda表达式(一)我们由浅入深的分析了一下Lambda表达式.知道了它和委托以及普通方法的区别,并且通过测试对比他们之间的性能,然后我们 ...
- ASP.NET Web API自身对CORS的支持: EnableCorsAttribute特性背后的故事
从编程的角度来讲,ASP.NET Web API针对CORS的实现仅仅涉及到HttpConfiguration的扩展方法EnableCors和EnableCorsAttribute特性.但是整个COR ...
- printf背后的故事
printf背后的故事 说起编程语言,C语言大家再熟悉不过.说起最简单的代码,Helloworld更是众所周知.一条简单的printf语句便可以完成这个简单的功能,可是printf背后到底做了什么事情 ...
- Mac OS X 背后的故事
Mac OS X 背后的故事 作者: 王越 来源: <程序员> 发布时间: 2013-01-22 10:55 阅读: 25840 次 推荐: 49 原文链接 [收藏] ...
- 你好,C++(4)2.1.3 我的父亲母亲:编译器和链接器 2.1.4 C++程序执行背后的故事
2.1.3 我的父亲母亲:编译器和链接器 从表面上看,我是由Visual Studio创建的,而实际上,真正负责编译源代码创建生成可执行程序HelloWorld.exe的却是Visual Studi ...
- elf 文件格式探秘——程序运行背后的故事
摘要:本文主要讲解elf文件格式,通过readelf命令结合底层的相关数据结构,讲解相关内容,分析程序运行的基本原理. 本文来源:elf 文件格式探秘——程序运行背后的故事 http://blog.c ...
随机推荐
- The usage of Markdown---列表
目录 1. 序言 2. 有序列表 3. 多级有序列表 3. 无序列表 4. 多级无序列表 5. 列表中的转义字符 6. 无效化 7. 任务列表 更新时间:2019.09.14 1. 序言 其实我昨 ...
- 将windows项目移植到linux上
提要:由于项目使用java开发,移植中没有什么编译问题(移植很快,但小问题多) 1.移植过程中遇到的问题: (1).由于项目中使用了 1024以下的端口号,导致网络通信一直出错 原因:因为Linux要 ...
- Tkinter 之Entry输入框标签
一.参数说明 语法 作用 Entry(root,width=20) 组件的宽度(所占字符个数) Entry(root,fg='blue') 前景字体颜色 Entry(root,bg='blue') 背 ...
- 使用pyquery
简单举例 from pyquery import PyQuery as pq html = ''' <div> <ul> <li class="item-O&q ...
- C# 倒计时,显示天,时,分,秒。时间可以是从数据库捞出来
从数据库把时间读出来,接着 你用个timer控件启用控件,设置1000毫秒timer时间里 用当前时间-你取出的时间 就可以了 DateTime furtime = Convert.ToDateTim ...
- linux sudo root 权限绕过漏洞(CVE-2019-14287)
0x01 逛圈子社区论坛 看到了 linux sudo root 权限绕过漏洞(CVE-2019-14287) 跟着复现下 综合来说 这个漏洞作用不大 需要以下几个前提条件 1.知道当前普通用户的密 ...
- Python进阶函数
一.函数的动态参数 之前我们说过了传参, 如果我们需要给一个函数传参, 而参数又是不确定的. 或者我给一个函数传很多参数, 我的形参就要写很多, 很麻烦, 怎么办呢. 我们可以考虑使用动态参数. 动态 ...
- GPS学习笔记
预备知识 1. 卫星发送信号时,是以特定频率的电磁波为载波,调整信号到载波上的.多普勒效应就是,卫星和接收机是相对运动的,那么载波的频率会随运动距离发生改变.(<GPS测量与数据处理>p3 ...
- NOIP模拟 8
T1 水题,可是没A,惭愧. 值得一提的是,虽然我忘了kmp,现场制造的kmp因为缺少针对题目的特判挂了,但是现场制造的kmp板子能过字符串板子题.. 对..把板子改装了...而且改对了! nx[]= ...
- 「刷题」JZPKIL
这道反演题,真牛逼. 以下用$B$代表伯努利数,$l*g=f$代表狄利克雷卷积,先推式子. 对于给出的$n,x,y$求一百组数据的$ans$ $\begin{array}{rcl} ans & ...