0x01 问题提出

在一次演练中，我们通过wireshark抓取了一个如下的数据包，我们如何对其进行分析？

0x02 问题分析

流量包是如何捕获的？

首先我们从上面的数据包分析可以知道，这是个USB的流量包，我们可以先尝试分析一下USB的数据包是如何捕获的。

在开始前，我们先介绍一些USB的基础知识。USB有不同的规格，以下是使用USB的三种方式：

l USB UART

l USB HID

l USB Memory

UART或者Universal Asynchronous Receiver/Transmitter。这种方式下，设备只是简单的将USB用于接受和发射数据，除此之外就再没有其他通讯功能了。

HID是人性化的接口。这一类通讯适用于交互式，有这种功能的设备有：键盘，鼠标，游戏手柄和数字显示设备。

最后是USB Memory，或者说是数据存储。External HDD, thumb drive / flash drive,等都是这一类的。

其中使用的最广的不是USB HID 就是USB Memory了。

每一个USB设备（尤其是HID或者Memory）都有一个供应商ID（Vendor Id）和产品识别码（Product Id）。Vendor Id是用来标记哪个厂商生产了这个USB设备。Product Id用来标记不同的产品，他并不是一个特殊的数字，当然最好不同。如下图

上图是我在虚拟机环境下连接在我电脑上的USB设备列表，通过lsusb查看命令。

例如说，我在VMware下有一个无线鼠标。它是属于HID设备。这个设备正常的运行，并且通过lsusb这个命令查看所有USB设备，现在大家能找出哪一条是这个鼠标吗？？没有错，就是第四个，就是下面这条：

Bus 002 Device 002: ID 0e0f:0003 VMware, Inc. Virtual Mouse

其中，ID 0e0f:0003就是Vendor-Product Id对，Vendor Id的值是0e0f，并且Product Id的值是0003。Bus 002 Device 002代表usb设备正常连接，这点需要记下来。

我们用root权限运行Wireshark捕获USB数据流。但是通常来说我们不建议这么做。我们需要给用户足够的权限来获取linux中的usb数据流。我们可以用udev来达到我们的目的。我们需要创建一个用户组usbmon，然后把我们的账户添加到这个组中。

addgroup usbmon

gpasswd -a $USER usbmon

echo 'SUBSYSTEM=="usbmon", GROUP="usbmon", MODE="640"' > /etc/udev/rules.d/99-usbmon.rules

接下来，我们需要usbmon内核模块。如果该模块没有被加载，我们可以通过以下命令加载该模块：

modprobe usbmon

打开wireshark，你会看到usbmonX其中X代表数字。下图是我们本次的结果（我使用的是root）：

如果接口处于活跃状态或者有数据流经过的时候，wireshark的界面就会把它以波形图的方式显示出来。那么，我们该选那个呢？没有错，就是我刚刚让大家记下来的，这个X的数字就是对应这USB Bus。在本文中是usbmon0。打开他就可以观察数据包了。

通过这些，我们可以了解到usb设备与主机之间的通信过程和工作原理，我们可以来对流量包进行分析了。

如何去分析一个USB流量包？

根据前面的知识铺垫，我们大致对USB流量包的抓取有了一个轮廓了，下面我们介绍一下如何分析一个USB流量包。

USB协议的细节方面参考wireshark的wiki：https://wiki.wireshark.org/USB

我们先拿GitHub上一个简单的例子开始讲起：

我们分析可以知道，USB协议的数据部分在Leftover Capture Data域之中，在Mac和Linux下可以用tshark命令可以将 leftover capture data单独提取出来，命令如下：

tshark -r example.pcap -T fields -e usb.capdata //如果想导入usbdata.txt文件中，后面加上参数：>usbdata.txt

Windows下装了wireshark的环境下，在wireshark目录下有个tshark.exe，比如我的在D:\Program Files\Wireshark\tshark.exe

调用cmd，定位到当前目录下，输入如下命令即可：

tshark.exe -r example.pcap -T fields -e usb.capdata //如果想导入usbdata.txt文件中，后面加上参数：>usbdata.txt

有关tshark命令的详细使用参考wireshark官方文档：https://www.wireshark.org/docs/man-pages/tshark.html

运行命令并查看usbdata.txt发现数据包长度为八个字节

关于USB的特点应用我找了一张图，很清楚的反应了这个问题：

这里我们只关注USB流量中的键盘流量和鼠标流量。

键盘数据包的数据长度为8个字节，击键信息集中在第3个字节，每次key stroke都会产生一个keyboard event usb packet。

鼠标数据包的数据长度为4个字节，第一个字节代表按键，当取0x00时，代表没有按键、为0x01时，代表按左键，为0x02时，代表当前按键为右键。第二个字节可以看成是一个signed byte类型，其最高位为符号位，当这个值为正时，代表鼠标水平右移多少像素，为负时，代表水平左移多少像素。第三个字节与第二字节类似，代表垂直上下移动的偏移。

我翻阅了大量的USB协议的文档，在这里我们可以找到这个值与具体键位的对应关系：http://www.usb.org/developers/hidpage/Hut1_12v2.pdf

usb keyboard的映射表根据这个映射表将第三个字节取出来，对应对照表得到解码：

我们写出如下脚本：

mappings = { 0x04:"A",  0x05:"B",  0x06:"C", 0x07:"D", 0x08:"E", 0x09:"F", 0x0A:"G",  0x0B:"H", 0x0C:"I",  0x0D:"J", 0x0E:"K", 0x0F:"L", 0x10:"M", 0x11:"N",0x12:"O",  0x13:"P", 0x14:"Q", 0x15:"R", 0x16:"S", 0x17:"T", 0x18:"U",0x19:"V", 0x1A:"W", 0x1B:"X", 0x1C:"Y", 0x1D:"Z", 0x1E:"", 0x1F:"", 0x20:"", 0x21:"", 0x22:"",  0x23:"", 0x24:"", 0x25:"", 0x26:"", 0x27:"", 0x28:"n", 0x2a:"[DEL]",  0X2B:"    ", 0x2C:" ",  0x2D:"-", 0x2E:"=", 0x2F:"[",  0x30:"]",  0x31:"\\", 0x32:"~", 0x33:";",  0x34:"'", 0x36:",",  0x37:"." }

nums = []

keys = open('usbdata.txt')

for line in keys:

    if line[0]!='' or line[1]!='' or line[3]!='' or line[4]!='' or line[9]!='' or line[10]!='' or line[12]!='' or line[13]!='' or line[15]!='' or line[16]!='' or line[18]!='' or line[19]!='' or line[21]!='' or line[22]!='':

         continue

    nums.append(int(line[6:8],16))

    # 00:00:xx:....

keys.close()

output = ""

for n in nums:

    if n == 0 :

        continue

    if n in mappings:

        output += mappings[n]

    else:

        output += '[unknown]'

print('output :n' + output)

结果如下：

我们把前面的整合成脚本，得：

#!/usr/bin/env python

import sys

import os

DataFileName = "usb.dat"

presses = []

normalKeys = {"":"a", "":"b", "":"c", "":"d", "":"e", "":"f", "0a":"g", "0b":"h", "0c":"i", "0d":"j", "0e":"k", "0f":"l", "":"m", "":"n", "":"o", "":"p", "":"q", "":"r", "":"s", "":"t", "":"u", "":"v", "1a":"w", "1b":"x", "1c":"y", "1d":"z","1e":"", "1f":"", "":"", "":"", "":"", "":"","":"","":"","":"","":"","":"<RET>","":"<ESC>","2a":"<DEL>", "2b":"\t","2c":"<SPACE>","2d":"-","2e":"=","2f":"[","":"]","":"\\","":"<NON>","":";","":"'","":"<GA>","":",","":".","":"/","":"<CAP>","3a":"<F1>","3b":"<F2>", "3c":"<F3>","3d":"<F4>","3e":"<F5>","3f":"<F6>","":"<F7>","":"<F8>","":"<F9>","":"<F10>","":"<F11>","":"<F12>"}

shiftKeys = {"":"A", "":"B", "":"C", "":"D", "":"E", "":"F", "0a":"G", "0b":"H", "0c":"I", "0d":"J", "0e":"K", "0f":"L", "":"M", "":"N", "":"O", "":"P", "":"Q", "":"R", "":"S", "":"T", "":"U", "":"V", "1a":"W", "1b":"X", "1c":"Y", "1d":"Z","1e":"!", "1f":"@", "":"#", "":"$", "":"%", "":"^","":"&","":"*","":"(","":")","":"<RET>","":"<ESC>","2a":"<DEL>", "2b":"\t","2c":"<SPACE>","2d":"_","2e":"+","2f":"{","":"}","":"|","":"<NON>","":"\"","":":","":"<GA>","":"<","":">","":"?","":"<CAP>","3a":"<F1>","3b":"<F2>", "3c":"<F3>","3d":"<F4>","3e":"<F5>","3f":"<F6>","":"<F7>","":"<F8>","":"<F9>","":"<F10>","":"<F11>","":"<F12>"}

def main():

    # check argv

    if len(sys.argv) != 2:

        print "Usage : "

        print "        python UsbKeyboardHacker.py data.pcap"

        print "Tips : "

        print "        To use this python script , you must install the tshark first."

        print "        You can use `sudo apt-get install tshark` to install it"

        print "Author : "

        print "        Angel_Kitty <angelkitty6698@gmail.com>"

        print "        If you have any questions , please contact me by email."

        print "        Thank you for using."

        exit(1)

    # get argv

    pcapFilePath = sys.argv[1]

    # get data of pcap

    os.system("tshark -r %s -T fields -e usb.capdata > %s" % (pcapFilePath, DataFileName))

    # read data

    with open(DataFileName, "r") as f:

        for line in f:

            presses.append(line[0:-1])

    # handle

    result = ""

    for press in presses:

        Bytes = press.split(":")

        if Bytes[0] == "":

            if Bytes[2] != "":

                result += normalKeys[Bytes[2]]

        elif Bytes[0] == "": # shift key is pressed.

            if Bytes[2] != "":

                result += shiftKeys[Bytes[2]]

        else:

            print "[-] Unknow Key : %s" % (Bytes[0])

    print "[+] Found : %s" % (result)

    # clean the temp data

    os.system("rm ./%s" % (DataFileName))

if __name__ == "__main__":

    main()

效果如下：

另外贴上一份鼠标流量数据包转换脚本：

nums = []

keys = open('usbdata.txt','r')

posx = 0

posy = 0

for line in keys:

if len(line) != 12 :

     continue

x = int(line[3:5],16)

y = int(line[6:8],16)

if x > 127 :

    x -= 256

if y > 127 :

    y -= 256

posx += x

posy += y

btn_flag = int(line[0:2],16)  # 1 for left , 2 for right , 0 for nothing

if btn_flag == 1 :

    print posx , posy

keys.close()

键盘流量数据包转换脚本如下：

nums=[0x66,0x30,0x39,0x65,0x35,0x34,0x63,0x31,0x62,0x61,0x64,0x32,0x78,0x33,0x38,0x6d,0x76,0x79,0x67,0x37,0x77,0x7a,0x6c,0x73,0x75,0x68,0x6b,0x69,0x6a,0x6e,0x6f,0x70]

s=''

for x in nums:

    s+=chr(x)

print s

mappings = { 0x41:"A",  0x42:"B",  0x43:"C", 0x44:"D", 0x45:"E", 0x46:"F", 0x47:"G",  0x48:"H", 0x49:"I",  0x4a:"J", 0x4b:"K", 0x4c:"L", 0x4d:"M", 0x4e:"N",0x4f:"O",  0x50:"P", 0x51:"Q", 0x52:"R", 0x53:"S", 0x54:"T", 0x55:"U",0x56:"V", 0x57:"W", 0x58:"X", 0x59:"Y", 0x5a:"Z", 0x60:"", 0x61:"", 0x62:"", 0x63:"", 0x64:"",  0x65:"", 0x66:"", 0x67:"", 0x68:"", 0x69:"", 0x6a:"*", 0x6b:"+",  0X6c:"separator", 0x6d:"-",  0x6e:".", 0x6f:"/" }

output = ""

for n in nums:

    if n == 0 :

        continue

    if n in mappings:

        output += mappings[n]

    else:

        output += '[unknown]'

print 'output :\n' + output

上面这个例子的项目链接如下：https://files.cnblogs.com/files/ECJTUACM-873284962/UsbKeyboardDataHacker.rar

那么对于我们开篇提到的问题，我们可以模仿尝试如上这个例子：

首先我们通过tshark将usb.capdata全部导出：

tshark -r task_AutoKey.pcapng -T fields -e usb.capdata //如果想导入usbdata.txt文件中，后面加上参数：>usbdata.txt

我们用上面的python脚本将第三个字节取出来，对应对照表得到解码：

mappings = { 0x04:"A",  0x05:"B",  0x06:"C", 0x07:"D", 0x08:"E", 0x09:"F", 0x0A:"G",  0x0B:"H", 0x0C:"I",  0x0D:"J", 0x0E:"K", 0x0F:"L", 0x10:"M", 0x11:"N",0x12:"O",  0x13:"P", 0x14:"Q", 0x15:"R", 0x16:"S", 0x17:"T", 0x18:"U",0x19:"V", 0x1A:"W", 0x1B:"X", 0x1C:"Y", 0x1D:"Z", 0x1E:"", 0x1F:"", 0x20:"", 0x21:"", 0x22:"",  0x23:"", 0x24:"", 0x25:"", 0x26:"", 0x27:"", 0x28:"n", 0x2a:"[DEL]",  0X2B:"    ", 0x2C:" ",  0x2D:"-", 0x2E:"=", 0x2F:"[",  0x30:"]",  0x31:"\\", 0x32:"~", 0x33:";",  0x34:"'", 0x36:",",  0x37:"." }

nums = []

keys = open('usbdata.txt')

for line in keys:

    if line[0]!='' or line[1]!='' or line[3]!='' or line[4]!='' or line[9]!='' or line[10]!='' or line[12]!='' or line[13]!='' or line[15]!='' or line[16]!='' or line[18]!='' or line[19]!='' or line[21]!='' or line[22]!='':

         continue

    nums.append(int(line[6:8],16))

    # 00:00:xx:....

keys.close()

output = ""

for n in nums:

    if n == 0 :

        continue

    if n in mappings:

        output += mappings[n]

    else:

        output += '[unknown]'

print('output :n' + output)

运行结果如下：

output :n[unknown]A[unknown]UTOKEY''.DECIPHER'[unknown]MPLRVFFCZEYOUJFJKYBXGZVDGQAURKXZOLKOLVTUFBLRNJESQITWAHXNSIJXPNMPLSHCJBTYHZEALOGVIAAISSPLFHLFSWFEHJNCRWHTINSMAMBVEXO[DEL]PZE[DEL]IZ'

我们可以看出这是自动密匙解码，现在的问题是在我们不知道密钥的情况下应该如何解码呢？

我找到了如下这篇关于如何爆破密匙：http://www.practicalcryptography.com/cryptanalysis/stochastic-searching/cryptanalysis-autokey-cipher/

爆破脚本如下：

from ngram_score import ngram_score

from pycipher import Autokey

import re

from itertools import permutations

qgram = ngram_score('quadgrams.txt')

trigram = ngram_score('trigrams.txt')

ctext = 'MPLRVFFCZEYOUJFJKYBXGZVDGQAURKXZOLKOLVTUFBLRNJESQITWAHXNSIJXPNMPLSHCJBTYHZEALOGVIAAISSPLFHLFSWFEHJNCRWHTINSMAMBVEXPZIZ'

ctext = re.sub(r'[^A-Z]','',ctext.upper())

# keep a list of the N best things we have seen, discard anything else

class nbest(object):

    def __init__(self,N=1000):

        self.store = []

        self.N = N

    def add(self,item):

        self.store.append(item)

        self.store.sort(reverse=True)

        self.store = self.store[:self.N]

    def __getitem__(self,k):

        return self.store[k]

    def __len__(self):

        return len(self.store)

#init

N=100

for KLEN in range(3,20):

    rec = nbest(N)

    for i in permutations('ABCDEFGHIJKLMNOPQRSTUVWXYZ',3):

        key = ''.join(i) + 'A'*(KLEN-len(i))

        pt = Autokey(key).decipher(ctext)

        score = 0

        for j in range(0,len(ctext),KLEN):

            score += trigram.score(pt[j:j+3])

        rec.add((score,''.join(i),pt[:30]))

    next_rec = nbest(N)

    for i in range(0,KLEN-3):

        for k in xrange(N):

            for c in 'ABCDEFGHIJKLMNOPQRSTUVWXYZ':

                key = rec[k][1] + c

                fullkey = key + 'A'*(KLEN-len(key))

                pt = Autokey(fullkey).decipher(ctext)

                score = 0

                for j in range(0,len(ctext),KLEN):

                    score += qgram.score(pt[j:j+len(key)])

                next_rec.add((score,key,pt[:30]))

        rec = next_rec

        next_rec = nbest(N)

    bestkey = rec[0][1]

    pt = Autokey(bestkey).decipher(ctext)

    bestscore = qgram.score(pt)

    for i in range(N):

        pt = Autokey(rec[i][1]).decipher(ctext)

        score = qgram.score(pt)

        if score > bestscore:

            bestkey = rec[i][1]

            bestscore = score

    print bestscore,'autokey, klen',KLEN,':"'+bestkey+'",',Autokey(bestkey).decipher(ctext)

跑出来的结果如下：

我们看到了flag的字样，整理可得如下：

-674.914569565 autokey, klen 8 :"FLAGHERE", HELLOBOYSANDGIRLSYOUARESOSMARTTHATYOUCANFINDTHEFLAGTHATIHIDEINTHEKEYBOARDPACKAGEFLAGISJHAWLZKEWXHNCDHSLWBAQJTUQZDXZQPF

我们把字段进行分割看：

HELLO

BOYS

AND

GIRLS

YOU

ARE

SO

SMART

THAT

YOU

CAN

FIND

THE

FLAG

THAT

IH

IDE

IN

THE

KEY

BOARD

PACKAGE

FLAG

IS

JHAWLZKEWXHNCDHSLWBAQJTUQZDXZQPF

最后的flag就是flag{JHAWLZKEWXHNCDHSLWBAQJTUQZDXZQPF}

0x03 资源下载

本文涉及到的所有项目链接全部放在Github上：

https://github.com/AngelKitty/UsbMiceDataHacker

0x04 扩展阅读

深入理解USB流量数据包的抓取与分析的更多相关文章

数据包的抓取[tcpdump]的应用
[root@server ~]# yum install tcpdump [root@server ~]# yum install wireshark 1.默认情况下,直接启动tcpdump将监视第一 ...
linux使用tcpdump抓包工具抓取网络数据包，多示例演示
tcpdump是linux命令行下常用的的一个抓包工具,记录一下平时常用的方式,测试机器系统是ubuntu 12.04. tcpdump的命令格式 tcpdump的参数众多,通过man tcpdump ...
Wireshark 如何捕获网络流量数据包
转自:http://www.4hou.com/web/7465.html?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutia ...
吴裕雄--天生自然python学习笔记：WEB数据抓取与分析
Web 数据抓取技术具有非常巨大的应用需求及价值, 用 Python 在网页上收集数据,不仅抓取数据的操作简单, 而且其数据分析功能也十分强大. 通过 Python 的时lib 组件中的 urlpar ...
基于TILE-GX实现快速数据包处理框架-netlib实现分析【转】
最近在研究suricata源码,在匹配模式的时候,有tilegx mpipe mode,转载下文,了解一下. 原文地址:http://blog.csdn.net/lhl_blog/article/de ...
php中CURL技术模拟登陆抓取数据实战，抓取某校教务处学生成绩。
这两天有基友要php中curl抓取教务处成绩的源码,用于微信公众平台的开发.下面笔者只好忍痛割爱了.php中CURL技术模拟登陆抓取数据实战,抓取沈阳工学院教务处学生成绩. 首先,教务处登录需要验证码 ...
python实现列表页数据的批量抓取练手练手的
python实现列表页数据的批量抓取,练手的,下回带分页的 #!/usr/bin/env python # coding=utf-8 import requests from bs4 import B ...
SNMP报文抓取与分析(二)
SNMP报文抓取与分析(二) SNMP报文抓取与分析(二) 1.SNMP报文表示简介基本编码规则BER 标识域Tag表示长度域length表示 2.SNMP报文详细分析(以一个get-respon ...
PHP抓取及分析网页的方法详解
本文实例讲述了PHP抓取及分析网页的方法.分享给大家供大家参考,具体如下: 抓取和分析一个文件是非常简单的事.这个教程将通过一个例子带领你一步一步地去实现它.让我们开始吧! 首先,我首必须决定我们将抓 ...

随机推荐

图解get方法与filter方法
在django的数据库查找方法中,get与filter方法是查找单目数据,用图记录了这两个方法查找数据各自返回的是什么?
Python基础知识：字符串
1.Python中大写字母命名的变量,默认为常量,不可修改:列如:MYSQL_CONNECTION = '192.168.1.1' 2.字符串换行输入格式:换行用\隔开,两行分别用引号,制表符\t,换 ...
【Beta Scrum】冲刺！ 3/5
1. 今日完成情况人员学号分工是否完成完成情况胡武成 031502610 完成登录注册api,协助web端完成api N SDN课程实践加上课缘故,仅仅写完了登录注册的逻辑判断内容,但是短 ...
从研发到市场，一个C#程序员半年神奇之旅
序距离上次在博客园发布文章已经过了大约有一年了,由于最近一系列神奇的际遇,让我非常强烈意愿的提起笔来给大家描述我最近一段时间的经历,希望大家根据我的经历做一些参考,我尽量写的逻辑通顺,如果各位兄弟阅 ...
转：git合并冲突解决方法
git合并冲突解决方法 1.git merge冲突了,根据提示找到冲突的文件,解决冲突如果文件有冲突,那么会有类似的标记 2.修改完之后,执行git add 冲突文件名 3.git commit注意 ...
iText5报表_页眉与页脚
1.概述 iText5中并没有之前版本HeaderFooter对象设置页眉和页脚,可以利用PdfPageEventHelper来完成页眉页脚的设置工作.PdfPageEventHelper ...
Python字符串操作之字符串分割与组合
12.字符串的分割和组合 12.1 str.split():字符串分割函数通过指定分隔符对字符串进行切片,并返回分割后的字符串列表. 语法: str.split(s, num)[n] 参数说明: s ...
【洛谷】【计数原理+Floyed】P1037 产生数
[题目描述:] 给出一个整数 n \((n<10^{30})\) 和 k 个变换规则\((k≤15)\) . 规则: 一位数可变换成另一个一位数: 规则的右部不能为零. 例如: n=234 .有 ...
转载 JavaScript的函数声明与函数表达式的区别
1)函数声明(Function Declaration); // 函数声明 function funDeclaration(type){ return type==="Declaration ...
mac版本idea使用(二)-如何安装PlantUML画时序图、类图
在跟踪spring源码的时候,看见网上的博客好多使用了idea自带的展示类继承关系图的功能,这个地方使用了idea的diagrams-show diagram,就可以显示类的继承图,很神奇的样子,记录 ...

深入理解USB流量数据包的抓取与分析