LyScript 内存交换与差异对比

LyScript 针对内存读写函数的封装功能并不多，只提供了内存读取和内存写入函数的封装，本篇文章将继续对API进行封装，实现一些在软件逆向分析中非常实用的功能，例如内存交换，内存区域对比，磁盘与内存镜像比较，特征码检索等功能。

LyScript项目地址：https://github.com/lyshark/LyScript

内存区域交换: 实现被加载程序内特定一块内存区域的交换，该方法实现原理就是两个变量之间的交换，只是在交换时需要逐个字节进行，调用read_memory_byte()函数实现起了很容易。

from LyScript32 import MyDebug

# 交换两个内存区域

def memory_xchage(dbg,memory_ptr_x,memory_ptr_y,bytes):

    ref = False

    for index in range(0,bytes):

        # 读取两个内存区域

        read_byte_x = dbg.read_memory_byte(memory_ptr_x + index)

        read_byte_y = dbg.read_memory_byte(memory_ptr_y + index)

        # 交换内存

        ref = dbg.write_memory_byte(memory_ptr_x + index,read_byte_y)

        ref = dbg.write_memory_byte(memory_ptr_y + index, read_byte_x)

    return ref

if __name__ == "__main__":

    dbg = MyDebug()

    dbg.connect()

    eip = dbg.get_register("eip")

    # 内存交换

    flag = memory_xchage(dbg, 6815744,6815776,4)

    print("内存交换状态: {}".format(flag))

    dbg.close()

PE文件头节点交换后如下：

内存区域对比: 可用于对比该进程内存中的特定一块区域的差异，返回是列表中的字典形式，分别传入对比内存x,y以及需要对比的内存长度，此处建议不要超过1024字节。

from LyScript32 import MyDebug

# 对比两个内存区域

def memory_cmp(dbg,memory_ptr_x,memory_ptr_y,bytes):

    cmp_memory = []

    for index in range(0,bytes):

        item = {"addr":0, "x": 0, "y": 0}

        # 读取两个内存区域

        read_byte_x = dbg.read_memory_byte(memory_ptr_x + index)

        read_byte_y = dbg.read_memory_byte(memory_ptr_y + index)

        if read_byte_x != read_byte_y:

            item["addr"] = memory_ptr_x + index

            item["x"] = read_byte_x

            item["y"] = read_byte_y

            cmp_memory.append(item)

    return cmp_memory

if __name__ == "__main__":

    dbg = MyDebug()

    dbg.connect()

    eip = dbg.get_register("eip")

    # 内存对比

    cmp_ref = memory_cmp(dbg, 6815744,6815776,4)

    for index in range(0,len(cmp_ref)):

        print("地址: 0x{:08X} -> X: 0x{:02x} -> y: 0x{:02x}".format(cmp_ref[index].get("addr"),cmp_ref[index].get("x"),cmp_ref[index].get("y")))

    dbg.close()

对比特定内存区域，返回差异字节地址：

内存与磁盘机器码比较: 通过调用read_memory_byte()函数，或者open()打开文件，等就可以得到程序磁盘与内存中特定位置的机器码参数，然后通过对每一个列表中的字节进行比较，就可得到特定位置下磁盘与内存中的数据是否一致的判断。

#coding: utf-8

import binascii,os,sys

from LyScript32 import MyDebug

# 得到程序的内存镜像中的机器码

def get_memory_hex_ascii(address,offset,len):

    count = 0

    ref_memory_list = []

    for index in range(offset,len):

        # 读出数据

        char = dbg.read_memory_byte(address + index)

        count = count + 1

        if count % 16 == 0:

            if (char) < 16:

                print("0" + hex((char))[2:])

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                print(hex((char))[2:])

                ref_memory_list.append(hex((char))[2:])

        else:

            if (char) < 16:

                print("0" + hex((char))[2:] + " ",end="")

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                print(hex((char))[2:] + " ",end="")

                ref_memory_list.append(hex((char))[2:])

    return ref_memory_list

# 读取程序中的磁盘镜像中的机器码

def get_file_hex_ascii(path,offset,len):

    count = 0

    ref_file_list = []

    with open(path, "rb") as fp:

        # file_size = os.path.getsize(path)

        fp.seek(offset)

        for item in range(offset,offset + len):

            char = fp.read(1)

            count = count + 1

            if count % 16 == 0:

                if ord(char) < 16:

                    print("0" + hex(ord(char))[2:])

                    ref_file_list.append("0" + hex(ord(char))[2:])

                else:

                    print(hex(ord(char))[2:])

                    ref_file_list.append(hex(ord(char))[2:])

            else:

                if ord(char) < 16:

                    print("0" + hex(ord(char))[2:] + " ", end="")

                    ref_file_list.append("0" + hex(ord(char))[2:])

                else:

                    print(hex(ord(char))[2:] + " ", end="")

                    ref_file_list.append(hex(ord(char))[2:])

    return ref_file_list

if __name__ == "__main__":

    dbg = MyDebug()

    connect_flag = dbg.connect()

    print("连接状态: {}".format(connect_flag))

    module_base = dbg.get_base_from_address(dbg.get_local_base())

    print("模块基地址: {}".format(hex(module_base)))

    # 得到内存机器码

    memory_hex_byte = get_memory_hex_ascii(module_base,0,100)

    # 得到磁盘机器码

    file_hex_byte = get_file_hex_ascii("d://Win32Project1.exe",0,100)

    # 输出机器码

    print("\n内存机器码: ",memory_hex_byte)

    print("\n磁盘机器码: ",file_hex_byte)

    dbg.close()

读取后输出时会默认十六个字符一次换行，输出效果如下。

我们继续增加磁盘与内存对比过程，然后就能实现对特定内存区域与磁盘区域字节码一致性的判断。

#coding: utf-8

import binascii,os,sys

from LyScript32 import MyDebug

# 得到程序的内存镜像中的机器码

def get_memory_hex_ascii(address,offset,len):

    count = 0

    ref_memory_list = []

    for index in range(offset,len):

        # 读出数据

        char = dbg.read_memory_byte(address + index)

        count = count + 1

        if count % 16 == 0:

            if (char) < 16:

                print("0" + hex((char))[2:])

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                print(hex((char))[2:])

                ref_memory_list.append(hex((char))[2:])

        else:

            if (char) < 16:

                print("0" + hex((char))[2:] + " ",end="")

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                print(hex((char))[2:] + " ",end="")

                ref_memory_list.append(hex((char))[2:])

    return ref_memory_list

# 读取程序中的磁盘镜像中的机器码

def get_file_hex_ascii(path,offset,len):

    count = 0

    ref_file_list = []

    with open(path, "rb") as fp:

        # file_size = os.path.getsize(path)

        fp.seek(offset)

        for item in range(offset,offset + len):

            char = fp.read(1)

            count = count + 1

            if count % 16 == 0:

                if ord(char) < 16:

                    print("0" + hex(ord(char))[2:])

                    ref_file_list.append("0" + hex(ord(char))[2:])

                else:

                    print(hex(ord(char))[2:])

                    ref_file_list.append(hex(ord(char))[2:])

            else:

                if ord(char) < 16:

                    print("0" + hex(ord(char))[2:] + " ", end="")

                    ref_file_list.append("0" + hex(ord(char))[2:])

                else:

                    print(hex(ord(char))[2:] + " ", end="")

                    ref_file_list.append(hex(ord(char))[2:])

    return ref_file_list

if __name__ == "__main__":

    dbg = MyDebug()

    connect_flag = dbg.connect()

    print("连接状态: {}".format(connect_flag))

    module_base = dbg.get_base_from_address(dbg.get_local_base())

    print("模块基地址: {}".format(hex(module_base)))

    # 得到内存机器码

    memory_hex_byte = get_memory_hex_ascii(module_base,0,1024)

    # 得到磁盘机器码

    file_hex_byte = get_file_hex_ascii("d://Win32Project1.exe",0,1024)

    # 输出机器码

    for index in range(0,len(memory_hex_byte)):

        # 比较磁盘与内存是否存在差异

        if memory_hex_byte[index] != file_hex_byte[index]:

            # 存在差异则输出

            print("\n相对位置: [{}] --> 磁盘字节: 0x{} --> 内存字节: 0x{}".

                  format(index,memory_hex_byte[index],file_hex_byte[index]))

    dbg.close()

代码运行后即可输出，存在差异的相对位置：

内存ASCII码解析: 通过封装的get_memory_hex_ascii得到内存机器码，然后再使用如下过程实现输出该内存中的机器码所对应的ASCII码。

from LyScript32 import MyDebug

import os,sys

# 转为ascii

def to_ascii(h):

    list_s = []

    for i in range(0, len(h), 2):

        list_s.append(chr(int(h[i:i+2], 16)))

    return ''.join(list_s)

# 转为16进制

def to_hex(s):

    list_h = []

    for c in s:

        list_h.append(hex(ord(c))[2:])

    return ''.join(list_h)

# 得到程序的内存镜像中的机器码

def get_memory_hex_ascii(address,offset,len):

    count = 0

    ref_memory_list = []

    for index in range(offset,len):

        # 读出数据

        char = dbg.read_memory_byte(address + index)

        count = count + 1

        if count % 16 == 0:

            if (char) < 16:

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                ref_memory_list.append(hex((char))[2:])

        else:

            if (char) < 16:

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                ref_memory_list.append(hex((char))[2:])

    return ref_memory_list

if __name__ == "__main__":

    dbg = MyDebug()

    dbg.connect()

    eip = dbg.get_register("eip")

    # 得到模块基地址

    module_base = dbg.get_base_from_address(dbg.get_local_base())

    # 得到指定区域内存机器码

    ref_memory_list = get_memory_hex_ascii(module_base,0,1024)

    # 解析ascii码

    break_count = 1

    for index in ref_memory_list:

        if break_count %32 == 0:

            print(to_ascii(hex(int(index, 16))[2:]))

        else:

            print(to_ascii(hex(int(index, 16))[2:]),end="")

        break_count = break_count + 1

    dbg.close()

输出效果如下，如果换成中文，那就是一个中文搜索引擎了。

内存特征码匹配: 通过二次封装get_memory_hex_ascii()实现扫描内存特征码功能，如果存在则返回True否则返回False。

from LyScript32 import MyDebug

import os,sys

# 得到程序的内存镜像中的机器码

def get_memory_hex_ascii(address,offset,len):

    count = 0

    ref_memory_list = []

    for index in range(offset,len):

        # 读出数据

        char = dbg.read_memory_byte(address + index)

        count = count + 1

        if count % 16 == 0:

            if (char) < 16:

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                ref_memory_list.append(hex((char))[2:])

        else:

            if (char) < 16:

                ref_memory_list.append("0" + hex((char))[2:])

            else:

                ref_memory_list.append(hex((char))[2:])

    return ref_memory_list

# 在指定区域内搜索特定的机器码,如果完全匹配则返回

def search_hex_ascii(address,offset,len,hex_array):

    # 得到指定区域内存机器码

    ref_memory_list = get_memory_hex_ascii(address,offset,len)

    array = []

    # 循环输出字节

    for index in range(0,len + len(hex_array)):

        # 如果有则继续装

        if len(hex_array) != len(array):

            array.append(ref_memory_list[offset + index])

        else:

            for y in range(0,len(array)):

                if array[y] != ref_memory_list[offset + index + y]:

                    return False

        array.clear()

    return False

if __name__ == "__main__":

    dbg = MyDebug()

    dbg.connect()

    eip = dbg.get_register("eip")

    # 得到模块基地址

    module_base = dbg.get_base_from_address(dbg.get_local_base())

    re = search_hex_ascii(module_base,0,100,hex_array=["0x4d","0x5a"])

    dbg.close()

特征码扫描一般不需要自己写，自己写的麻烦，而且不支持通配符，可以直接调用我们API中封装好的scan_memory_one()它可以支持??通配符模糊匹配，且效率要高许多。

LyScript 内存交换与差异对比的更多相关文章

Atitit 硬件软件的开源工作差异对比
Atitit 硬件软件的开源工作差异对比 1.1. 模块化,标准化,以及修改的便捷性1 1.2. 生产和发布成本 1 1.3. 3. 入行门槛搞2 1.4. 在软件业极度发达的今天,任何具 ...
如何在Linux上使用文件作为内存交换区(Swap Area)
交换区域(Swap Area)有什么作用? 交换分区是操作系统在内存不足(或内存较低)时的一种补充.通俗的说,如果说内存是汽油,内存条就相当于油箱,交换区域则相当于备用油箱. Ubuntu Linux ...
Linux swappiness参数设置与内存交换
swappiness参数设置与内存交换 by:授客 QQ:1033553122 简介 swappiness,Linux内核参数,控制换出运行时内存的相对权重.swappiness参数值可设置范围在0到 ...
Linux命令 swap:内存交换空间
swap 内存交换空间的概念 swap使用上的限制
SeaJS 与 RequireJS 的差异对比
这篇文章主要介绍了SeaJS 与 RequireJS 的差异对比,本文主要对CMD规范和AMD规范的弊端做了对比,并做出了一个总结,需要的朋友可以参考下 “历史不是过去,历史正在上演.随着 W3C 等 ...
Python 数据库之间差异对比
参考资料: Python 集合(set) 此脚本用于两个数据库之间的表.列.栏位.索引的差异对比. cat oracle_diff.py #!/home/dba/.pyenv/versions/3 ...
016——VUE中v-show的使用与v-if的差异对比
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
Python自动化运维——文件内容差异对比
Infi-chu: http://www.cnblogs.com/Infi-chu/ 模块:difflib 安装:Python版本大于等于2.3系统自带功能:对比文本之间的差异,而且支持输出可读性比 ...
16.VUE学习之-v-show的使用与v-if的差异对比
v-show的使用与v-if的差异对比相同点: 都可以达到隐藏和显示的效果. 不同点: v-show 会用display:none 来隐藏元素节点,推荐使用这种方式 v-if 会移除节点,可以配合v ...

随机推荐

虚拟机：KVM
1. KVM 介绍 1.0 虚拟化简史其中,KVM 全称是基于内核的虚拟机(Kernel-based Virtual Machine),它是Linux 的一个内核模块,该内核模块使得 Linux ...
134_Power BI Report Server之某消费品运营数据监控
博客:www.jiaopengzi.com 焦棚子的文章目录请点击下载附件一背景最近很久都没有更新文章了,研究了下Power BI Report Server(下文简称pbirs). 今天把pb ...
奶盖拌饭 NKOJ8457
题意:一个无向图,每次询问给出一条边,问这条边的最大值满足这条边一定在这个图的最小生成树上,如果没有上限输出-1. 思路:考场上想过的,将分为两类,(非)树边. 1.亿点性质非树边:加上这条边所构成 ...
图文详解MapReduce工作机制
job提交阶段 1.准备好待处理文本. 2.客户端submit()前,获取待处理数据的信息,然后根据参数配置,形成一个任务分配的规划. 3.客户端向Yarn请求创建MrAppMaster并提交切片等相 ...
如何在Uniapp中访问CabloyJS后端API管理系统
介绍 CabloyJS是一款免费开源的NodeJS全栈开发框架,采用前后端分离设计,具备开箱即用的后台管理系统 Cabloy-SDK是专门为Uniapp应用量身定制的前端SDK,用于便捷的访问Cabl ...
while循环结构
一.循环: 1.场景: ①.用户名和密码,反复输入 ②.计算1-100之间 ③.游戏,重生 ④.-- 2.方式 ①.while ②.for 3.while格式 while 条件:要循环执行的代码布尔 ...
Camunda如何适配国产数据库达梦
前言 camunda流程引擎官方支持的数据库有:MySQL .MariaDB .Oracle .DB2 .PostgreSQL .SQL Server.H2.对于其他类型的数据库如何支持,尤其是国产数 ...
Apache Poi 操作word，替换字符保留样式问题，runs段落混乱问题。
关于这个问题也是刚好遇到,一通搜索也没有找到类似的或者是有效的方法.下面介绍一下. 首先apache poi的引入 <dependency> <groupId>org.apac ...
【2022-06-16】Python解释器的下载安装与使用
一.Python解释器介绍什么是Python解释器? Python是一门解释型语言,解释器是Python运行必不可少的一种工具.所以,我们搭建Python环境,本质上就是对Python进行配置和定制 ...
colab简易使用
解压文件(zip文件) !unzip -o /content/drive/MyDrive/test.zip -d /content/ 解压test.zip到指定目录, 其他解压缩命令: linux-常 ...

LyScript 内存交换与差异对比

LyScript 内存交换与差异对比的更多相关文章

随机推荐

热门专题