使用 Python 创建你自己的 Shell：Part I

使用 Python 创建你自己的 Shell：Part I

原文链接与说明

https://hackercollider.com/articles/2016/07/05/create-your-own-shell-in-python-part-1/
本翻译文档原文选题自 Linux中国 ，翻译文档版权归属 Linux中国 所有

我很想知道一个 shell （像 bash，csh 等）内部是如何工作的。为了满足自己的好奇心，我使用 Python 实现了一个名为 yosh （Your Own Shell）的 Shell。本文章所介绍的概念也可以应用于其他编程语言。

（提示：你可以在这里查找本博文使用的源代码，代码以 MIT 许可证发布。在 Mac OS X 10.11.5 上，我使用 Python 2.7.10 和 3.4.3 进行了测试。它应该可以运行在其他类 Unix 环境，比如 Linux 和 Windows 上的 Cygwin。）

让我们开始吧。

步骤 0：项目结构

对于此项目，我使用了以下的项目结构。

yosh_project

|-- yosh

   |-- __init__.py

   |-- shell.py

yosh_project 为项目根目录（你也可以把它简单命名为 yosh）。

yosh 为包目录，且 __init__.py 可以使它成为与包目录名字相同的包（如果你不写 Python，可以忽略它。）

shell.py 是我们主要的脚本文件。

步骤 1：Shell 循环

当启动一个 shell，它会显示一个命令提示符并等待你的命令输入。在接收了输入的命令并执行它之后（稍后文章会进行详细解释），你的 shell 会重新回到循环，等待下一条指令。

在 shell.py，我们会以一个简单的 mian 函数开始，该函数调用了 shell_loop() 函数，如下：

def shell_loop():

    # Start the loop here

def main():

    shell_loop()

if __name__ == "__main__":

    main()

接着，在 shell_loop()，为了指示循环是否继续或停止，我们使用了一个状态标志。在循环的开始，我们的 shell 将显示一个命令提示符，并等待读取命令输入。

import sys

SHELL_STATUS_RUN = 1

SHELL_STATUS_STOP = 0

def shell_loop():

    status = SHELL_STATUS_RUN

    while status == SHELL_STATUS_RUN:

        # Display a command prompt

        sys.stdout.write('> ')

        sys.stdout.flush()

        # Read command input

        cmd = sys.stdin.readline()

之后，我们切分命令输入并进行执行（我们即将实现命令切分和执行函数）。

因此，我们的 shell_loop() 会是如下这样：

import sys

SHELL_STATUS_RUN = 1

SHELL_STATUS_STOP = 0

def shell_loop():

    status = SHELL_STATUS_RUN

    while status == SHELL_STATUS_RUN:

        # Display a command prompt

        sys.stdout.write('> ')

        sys.stdout.flush()

        # Read command input

        cmd = sys.stdin.readline()

        # Tokenize the command input

        cmd_tokens = tokenize(cmd)

        # Execute the command and retrieve new status

        status = execute(cmd_tokens)

这就是我们整个 shell 循环。如果我们使用 python shell.py 启动我们的 shell，它会显示命令提示符。然而如果我们输入命令并按回车，它会抛出错误，因为我们还没定义命令切分函数。

为了退出 shell，可以尝试输入 ctrl-c。稍后我将解释如何以优雅的形式退出 shell。

步骤 2：命令切分

当用户在我们的 shell 中输入命令并按下回车键，该命令将会是一个包含命令名称及其参数的很长的字符串。因此，我们必须切分该字符串（分割一个字符串为多个标记）。

咋一看似乎很简单。我们或许可以使用 cmd.split()，以空格分割输入。它对类似 ls -a my_folder 的命令起作用，因为它能够将命令分割为一个列表 ['ls', '-a', 'my_folder']，这样我们便能轻易处理它们了。

然而，也有一些类似 echo "Hello World" 或 echo 'Hello World' 以单引号或双引号引用参数的情况。如果我们使用 cmd.spilt，我们将会得到一个存有 3 个标记的列表 ['echo', '"Hello', 'World"'] 而不是 2 个标记的列表 ['echo', 'Hello World']。

幸运的是，Python 提供了一个名为 shlex 的库，它能够帮助我们效验如神地分割命令。（提示：我们也可以使用正则表达式，但它不是本文的重点。）

import sys

import shlex

...

def tokenize(string):

    return shlex.split(string)

...

然后我们将这些标记发送到执行进程。

步骤 3：执行

这是 shell 中核心和有趣的一部分。当 shell 执行 mkdir test_dir 时，到底发生了什么？（提示： mkdir 是一个带有 test_dir 参数的执行程序，用于创建一个名为 test_dir 的目录。）

execvp 是涉及这一步的首个函数。在我们解释 execvp 所做的事之前，让我们看看它的实际效果。

import os

...

def execute(cmd_tokens):

    # Execute command

    os.execvp(cmd_tokens[0], cmd_tokens)

    # Return status indicating to wait for next command in shell_loop

    return SHELL_STATUS_RUN

...

再次尝试运行我们的 shell，并输入 mkdir test_dir 命令，接着按下回车键。

在我们敲下回车键之后，问题是我们的 shell 会直接退出而不是等待下一个命令。然而，目标正确地被创建。

因此，execvp 实际上做了什么？

execvp 是系统调用 exec 的一个变体。第一个参数是程序名字。v 表示第二个参数是一个程序参数列表（可变参数）。p 表示环境变量 PATH 会被用于搜索给定的程序名字。在我们上一次的尝试中，它将会基于我们的 PATH 环境变量查找mkdir 程序。

（还有其他 exec 变体，比如 execv、execvpe、execl、execlp、execlpe；你可以 google 它们获取更多的信息。）

exec 会用即将运行的新进程替换调用进程的当前内存。在我们的例子中，我们的 shell 进程内存会被替换为 mkdir 程序。接着，mkdir 成为主进程并创建 test_dir 目录。最后该进程退出。

这里的重点在于我们的 shell 进程已经被 mkdir 进程所替换。这就是我们的 shell 消失且不会等待下一条命令的原因。

因此，我们需要其他的系统调用来解决问题：fork。

fork 会开辟新的内存并拷贝当前进程到一个新的进程。我们称这个新的进程为子进程，调用者进程为父进程。然后，子进程内存会被替换为被执行的程序。因此，我们的 shell，也就是父进程，可以免受内存替换的危险。

让我们看看修改的代码。

...

def execute(cmd_tokens):

    # Fork a child shell process

    # If the current process is a child process, its `pid` is set to `0`

    # else the current process is a parent process and the value of `pid`

    # is the process id of its child process.

    pid = os.fork()

    if pid == 0:

    # Child process

        # Replace the child shell process with the program called with exec

        os.execvp(cmd_tokens[0], cmd_tokens)

    elif pid > 0:

    # Parent process

        while True:

            # Wait response status from its child process (identified with pid)

            wpid, status = os.waitpid(pid, 0)

            # Finish waiting if its child process exits normally

            # or is terminated by a signal

            if os.WIFEXITED(status) or os.WIFSIGNALED(status):

                break

    # Return status indicating to wait for next command in shell_loop

    return SHELL_STATUS_RUN

...

当我们的父进程调用 os.fork()时，你可以想象所有的源代码被拷贝到了新的子进程。此时此刻，父进程和子进程看到的是相同的代码，且并行运行着。

如果运行的代码属于子进程，pid 将为 0。否则，如果运行的代码属于父进程，pid 将会是子进程的进程 id。

当 os.execvp 在子进程中被调用时，你可以想象子进程的所有源代码被替换为正被调用程序的代码。然而父进程的代码不会被改变。

当父进程完成等待子进程退出或终止时，它会返回一个状态，指示继续 shell 循环。

运行

现在，你可以尝试运行我们的 shell 并输入 mkdir test_dir2。它应该可以正确执行。我们的主 shell 进程仍然存在并等待下一条命令。尝试执行 ls，你可以看到已创建的目录。

但是，这里仍有许多问题。

第一，尝试执行 cd test_dir2，接着执行 ls。它应该会进入到一个空的 test_dir2 目录。然而，你将会看到目录并没有变为 test_dir2。

第二，我们仍然没有办法优雅地退出我们的 shell。

我们将会在 Part 2 解决诸如此类的问题。

via: https://hackercollider.com/articles/2016/07/05/create-your-own-shell-in-python-part-1/

[翻译] 使用 Python 创建你自己的 Shell：Part I的更多相关文章

[翻译] 使用 Python 创建你自己的 Shell：Part II
目录使用 Python 创建你自己的 Shell:Part II 原文链接与说明步骤 4:内置命令最后的想法使用 Python 创建你自己的 Shell:Part II 原文链接与说明 htt ...
使用 Python 创建你自己的 Shell（下）
导读在上篇中,我们已经创建了一个 shell 主循环.切分了命令输入,以及通过 fork 和 exec 执行命令.在这部分,我们将会解决剩下的问题.首先,cd test_dir2 命令无法修改我们的 ...
使用 Python 创建你自己的 Shell （上）
我很想知道一个 shell (像 bash,csh 等)内部是如何工作的.于是为了满足自己的好奇心,我使用 Python 实现了一个名为yosh(Your Own Shell)的 Shell.本文章所 ...
Python下调用Linux的Shell命令
有时候难免需要直接调用Shell命令来完成一些比较简单的操作,比如mount一个文件系统之类的.那么我们使用Python如何调用Linux的Shell命令?下面来介绍几种常用的方法: 1. os 模块 ...
python创建MySQL多实例－1
python创建MySQL多实例-1 前言什么是多实例多实例就是允许在同一台机器上创建另外一套不同配置文件的数据库,他们之间是相互独立的,主要有以下特点, 1> 不能同时使用一个端口 2&g ...
Python 创建本地服务器环境生成二维码
一. 需求公司要做一个H5手机端适配页面,因技术问题所以H5是外包的,每次前端给我们源码,我们把源码传到服务器让其他人访问看是否存在bug,这个不是很麻烦吗?有人说,可以让前端在他们的服务器上先托管 ...
Python创建Cocos2d-x 2.2方法
把创建项目做成一个批处理,当创建项目时可以省时省力很多. 操作步骤 1.在 E:\cocos2d-x-2.2.1\tools\project-creator 目录下创建 create_project. ...
Python创建list和按照索引访问list
Python创建list Python内置的一种数据类型是列表:list.list是一种有序的集合,可以随时添加和删除其中的元素.比如,列出班里所有同学的名字,就可以用一个list表示:>> ...
使用Python创建一个简易的Web Server
Python 2.x中自带了SimpleHTTPServer模块,到Python3.x中,该模块被合并到了http.server模块中.使用该模块,可以快速创建一个简易的Web服务器. 我们在C:\U ...

随机推荐

bzoj5250 [2018多省省队联测]秘密袭击
博主蒟蒻,目前还不会动态dp,所以下面说的是一个并不优秀的暴力,我会补的! 我们考虑按权值从大到小依次点亮每个点,相同权值可以同时点亮,每次点亮后,我们进行一次树形背包. 处理出$f[i][j]$表示 ...
bzoj 2724 蒲公英分块
分块,预处理出每两个块范围内的众数,然后在暴力枚举块外的进行比较那么怎么知道每一个数出现的次数呢?离散后,对于每一个数,维护一个动态数组就好了 #include<cstdio> #inc ...
优化：mysql查询最近一条记录
下策--查询出结果后将时间排序后取第一条 select * from a where create_time<="2017-03-29 19:30:36" order by ...
C++ bitset用法
概念: bitset是用来存储位的(其中的元素只有两种形式) 这个类通常用来模拟一个布尔数组,但对空间分配上进行了优化:通常,每个元素只占用一个bit ,而通常char类型是它的八倍每个位置上的位都 ...
ERP不规范，同事两行泪
最近的很多次对外交流,都聊到了ERP建设的话题,并且无一例外的不那么让人省心,回想我这么多年走过的ERP坑坑路,在这里也写下经验和总结,希望能给正在或者即将走上ERP建设路的企业一些思考和帮助. 导读 ...
Xshell访问和连接Linux
Xshell是一款强大的安全终端模拟软件,Xshell 模拟了远程主机的操作,其实质就是通过访问和连接到远程主机,在本地实现对远程主机的操作. 一.下载官网:https://www.netsara ...
[翻译 EF Core in Action 2.1] 设置一个图书销售网站的场景
Entity Framework Core in Action Entityframework Core in action是 Jon P smith 所著的关于Entityframework Cor ...
如何 DataTable格式转换json格式
1.序列化啊宝贝!! public string DataTableToJsonWithJsonNet(DataTable table) { string jsonString=string.Em ...
C#如何根据类的名词创建类的实例
这个大概分为两种情况:1-在同一程序集访问该类:2-在不同的程序集访问 A:同一程序集,使用微软的创建对象的类:System.Activator: 先通过类名,获取到类型,在使用用于创建本地或远程对象 ...
Eclipse4JavaEE安装Gradle，并导入我们的Gradle项目
第一步:下载Gradle Gradle下载链接,如下图,下载最新版本即可.下载下来的zip包,解压到一个目录即可,如F盘第二步:配置环境变量首先添加GRADLE_HOME,如下图然后在Path下 ...

[翻译] 使用 Python 创建你自己的 Shell：Part I