汇编窥探Swift String的底层
String(字符串),是所有编程语言中非常重要的成员,因此非常值得去深入研究。众所周知,字符串的本质是字符序列,由若干个字符组成。比如字符串 "iOS" 由 'i'、'O'、'S' 三个字符组成。(这里不考虑有些编程语言中提及的尾部的 '\0')
思考
在 Swift 开发使用字符串的过程中,你是否有思考过以下问题?
- 1 个字符串变量占用多少内存?
- 字符串 str1、str2 的底层存储有什么不同?

- 如果对 str1、str2 进行拼接操作,str1、str2 的底层存储又会发生什么变化?

如果你能准确地回答以上问题,那说明对 Swift 字符串的底层存储机制还是比较了解的。
1 个字符串变量占用多少内存?
MemoryLayout
首先,可以借助 Swift 自带的 MemoryLayout 来测试一下

汇编
另外,我们也可以借助一个强有力的底层分析助手—汇编语言,来窥探一下 String 的底层存储
实际上分析其他语法、系统库的底层,都可以借助汇编语言
- 比如多态的原理、泛型的原理、Array 的底层、枚举的底层等等
- 另外,不仅仅是 Swift,C、C++、OC 的底层分析,依然可以借助汇编语言
- 毕竟你写的每一行有效代码,最终都是要转成机器指令(0 和 1)
- 而机器指令是跟汇编指令一一对应的,每一条机器指令都能翻译成与之对应的汇编指令
- 能读懂汇编指令,就相当于能读懂机器指令,知道 CPU 具体在干嘛(操作了什么寄存器,操作了哪块内存)
- 本教程的代码是直接跑在 Mac 的命令行(CommandLineTools)项目上
- 因此展示的汇编代码是基于 X64 的 AT&T 格式汇编,并非 iOS 真机设备的 ARM 汇编
- 其实不同种类的汇编之间有极大的相似性,只是有些指令的叫法不一样
跟微软的 Visual Studio 一样,Xcode 也内置了非常方便的反汇编功能,可以轻松查看每一句代码对应的汇编指令,打开反汇编界面的步骤如下
在某一行需要调试的代码打上断点(反汇编界面会在断点调试状态下显示出来)
- 菜单:
Debug>Debug Workflow>Always Show DisassemblyAssembly译为汇编,Disassembly译为反汇编

- 运行程序,看到反汇编界面

如果你的反汇编经验十足,根据第 16、17 行的汇编就可以推敲出来,String 是占用 16 个字节
- 因为它用了 rax、rdx 寄存器存放字符串 str 的内容,而 rax、rdx 都是 8 字节的
汇编的内容太多了,因为时间和篇幅关系,文章里并不会对每一句汇编指令进行详细地讲解,更多的是想说明汇编的重要性。
字符串的底层存储
窥探内存
此前我写了个可以窥探 Swift 变量内存的小工具:https://github.com/CoderMJLee/Mems
现在用它来窥探下字符串的 16 字节里面,究竟存储着什么数据
Mems.memStr(ofVal:)默认情况下按照 8 个字节一组来显示内存数据传递参数
alignment: .one是按照 1 个字节一组来显示内存数据

字符 '0'~'9' 的 ASCII 值是 0x30~0x39,认真观察最初 str1 的 16 个字节数据,你发现了什么?
它直接将所有字符的 ASCII 值存储在 str1 的 16 字节中
最后 1 个字节 0xea 中的 0xa 就是字符的数量,也是共 10 个字符
拼接

可以发现,当对 str1 进行拼接 "ABCDE" 的时候
它最终是将 "0123456789ABCDE"十五个字符的 ASCII 值都存储在了 str1 的 16 字节中
最后 1 个字节 0xef 中的 0xf 就是字符的数量,也是共 15 个字符
可以看得出来,目前 16 个字节已经存满了,那如果再拼接 1 个字符呢?

可以看到,str1 里面存储的数据发生了非常大的变化,每一个字符的 ASCII 值不见了,
那里面的 16 字节具体是什么含义呢?
所有字符('0'~'9'、'A' 到 'F')的 ASCII 值又存到哪去了呢?
其他情况
如果一开始初始化的时候(未拼接之前),字符串的内容就是超过 15 个字符呢?

相信你能猜到是这个结果
- 这 16 个字节里面并没有出现任何一个字符的 ASCII 值
- 而且这 16 个字节跟
第27行的str1还是有所区别- 虽然它们的字符串内容都是"0123456789ABCDEF"
如果对 str2 进行拼接操作

不难发现:这时 str2 的 16 字节又发生了变化,跟 第27行的str1 是有点相似的
如何解决上述疑问?
上述的种种疑问,光看打印出来的内存数据是无法解决的,但是都可以利用【!!!汇编!!!】来解决,分析汇编指令,立马就得出结论,因为文章的篇幅有限,平时工作也比较忙,我把上述问题的详细剖析过程录制成了长达 2 个多小时的视频,有兴趣的朋友可以用 1.5~2 倍速度观看
- 链接:https://pan.baidu.com/s/1AkS3K1ZKP8zyxhlhLRaBkA
- 提取码:kzrk
视频对于没有汇编基础的朋友来说,可能会有点难度,最好挑一个头脑清醒的时间去观看
看完视频后,希望大家能够确切地感受到汇编语言的重要性,不要永远只停留在编写高级语言代码、沉迷于语法糖的层面
最后
最后想多说一句:汇编能给你带来的价值远远不止这篇文章所说的窥探字符串的底层,对你的程序生涯影响绝对是终生受益的(数据结构与算法功底也是如此),比如你还能玩转软件破解、游戏外挂等,这是我此前用【汇编\C++】编写的一个游戏外挂:https://github.com/CoderMJLee/SeemygoPVZCheater

汇编窥探Swift String的底层的更多相关文章
- 窥探Swift编程之错误处理与异常抛出
在Swift 2.0版本中,Swift语言对其错误处理进行了新的设计,当然了,重新设计后的结果使得该错误处理系统用起来更爽.今天博客的主题就是系统的搞一下Swift中的错误处理,以及看一下Swift中 ...
- 窥探Swift系列博客说明及其Swift版本间更新
Swift到目前为止仍在更新,每次更新都会推陈出新,一些Swift旧版本中的东西在新Swift中并不适用,而且新版本的Swift会添加新的功能.到目前为止,Swift为2.1版本.去年翻译的Swift ...
- 窥探Swift之协议(Protocol)和委托代理(Delegate)回调的使用
协议与委托代理回调在之前的博客中也是经常提到和用到的在<Objective-C中的委托(代理)模式>和<iOS开发之窥探UICollectionViewController(四) - ...
- 窥探Swift之类的继承与类的访问权限
上一篇博客<窥探Swift之别具一格的Struct和Class>的博客可谓是给Swift中的类开了个头.关于类的内容还有很多,今天就来搞一下类中的继承以及类的访问权限.说到类的继承,接触过 ...
- 窥探Swift之基本数据类型
在上一篇博客“窥探Swift编程之在Playground上尽情的玩耍”中介绍了如何使用Playground来学习Swift语言.本篇博客就使用Playground来窥探Swift语言.千里之行始于足下 ...
- 窥探Swift编程之强大的Switch
之前初识Swift中的Switch语句时,真的是让人眼前一亮,Swift中Switch语句有好多特有而且特好用的功能.说到Switch, 只要是写过程序的小伙伴对Switch并不陌生.其在程序中的出镜 ...
- 窥探Swift编程之在Playground上尽情的玩耍
自从苹果公司发布Swift的时候,Xcode上又多了一样新的东西---"Playground".Playground就像操场一样,可以供我们在代码的世界里尽情的玩耍,在本篇博客中就 ...
- string的底层实现
String底层实现 string在C++也是一个重要的知识,但是想要用好它,就要知道它的底层是如何写的,才能更好的用好这个string,那么这次就来实现string的底层,但是string的接口功能 ...
- 窥探Swift之字符串(String)
之前总结过Objective-C中的字符串<Objective-C精选字符串处理方法>,学习一门新语言怎么能少的了字符串呢.Swift中的String和Objective-C语言中NSSt ...
随机推荐
- springboot启动报错 Failed to configure a DataSource: 'url' attribute is not specified and no embedded datasource could be configured.
新建了一个springboot项目报一下错误: Failed to configure a DataSource: 'url' attribute is not specified and no em ...
- 基 B/S 平台的机房监控云平台-U位篇
前言 机柜 U 位管理是一项突破性创新技术--继承了 RFID 标签(电子标签)的优点的同时,完全解决了 RFID 技术(非接触式的自动识别技术)在机房 U 位资产监控场应用景中的四大缺陷,采用工业互 ...
- python——pyinstaller踩的坑 UnicodeDecodeError
程序本身运行没任何毛病,奈何用pyinstaller -w xx.py的时候提示——UnicodeDecodeError: 'ascii' codec can't decode byte 0xb3 i ...
- 两小无猜的爱恨情仇--java =+和+=揭秘
故事背景 当一个人问另一个人“敢不敢”的时候,另一个人必须说“敢”,这就是游戏的规则.小男孩朱利安和小女孩苏菲的相遇即开始于这样一场孩童的闹剧,一个精美的铁盒子就是他们游戏的见证.说脏话,扰乱课堂,在 ...
- Java性能调优的9个实用方法
1.使用StringBuilder StingBuilder 应该是在我们的Java代码中默认使用的,应该避免使用 + 操作符. 一般来说,使用 StringBuilder 的效果要优于使用 + 操作 ...
- Scala 占位符在REPL和Eclipse/IDEA中初始化变量问题
占位符在REPL和Eclipse/IDEA中初始化变量问题: 占位符初始化,如果是局部变量,都会报错!只能在全局变量中使用! REPL: Eclipse: IDEA: 如果是类的属性,却就是对的.
- 利用双重检查锁定和CAS算法:解决并发下数据库的一致性问题
背景 最近有一个场景遇到了数据库的并发问题.现在先由我来抽象一下,去掉不必要的繁杂业务. 数据库表book存储着每本书的阅读量,一开始数据库是空的,不存在任何的数据.当用户访问接口的时候,判断 ...
- 你所不知道的TIME_WAIT和CLOSE_WAIT
你遇到过TIME_WAIT的问题吗? 我相信很多都遇到过这个问题.一旦有用户在喊:网络变慢了.第一件事情就是,netstat -a | grep TIME_WAIT | wc -l 一下.哎呀妈呀,几 ...
- 【包教包会】Chrome拓展开发实践
首发于微信公众号<前端成长记>,写于 2019.10.18 导读 有句老话说的好,好记性不如烂笔头.人生中,总有那么些东西你愿去执笔写下. 本文旨在把整个开发的过程和遇到的问题及解决方案记 ...
- 算法学习之剑指offer(五)
题目1 题目描述 输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果.如果是则输出Yes,否则输出No.假设输入的数组的任意两个数字都互不相同. public class Solution ...