网络抓包工具wireshark and tcpdump 及其实现基于的libpcap
最近无意中看到博客园中一篇介绍wireshark的文章,写得不错,它简单清楚介绍了wireshark的使用
简介
wireshark以前叫做Ethereal, 在大学时候的网络课程中就常看到它,它是世界上最流行的网络抓包分析工具(world's most popular network protocol analyzer),它是基于图形界面的,官网有介绍wireshark是1998年的一个项目衍生出来的,它有比较强大的特性,可以用来分析数百种网络协议。wireshark是在GNU General Public Lisence下发布的。
以下是我自己使用wireshark的一个截图, 照着上面的博客中去抓取和查看一次http请求前的tcp三次握手,下面详细显示的那行及其上下行就是我从本机浏览器访问自己博客园博客的时候产生的tcp三次握手,可以看到是先握手成功才传输的http报文

可以看到wireshark提供了一个非常友好和详细的界面,可以看到一个包从链路层ethernet,网络层ip,传输层tcp的包信息。详细的使用参加上面提到的博客
tcpdump其实和wireshark很像,区别只是tcpdump是命令行界面的,wireshark和tcpdump都共同使用 libpcap作为其底层抓包的库, tcpdump最早是由 Van Jacobson于1987年开发的,后来在1999年http://www.tcpdump.org/创立,这上面有关于tcpdump和pcap详细的文档。
tcpdump的输出
tcpdump的输出格式是和协议相关的,在协议栈的同一层会有不同的协议,比如在Transport Layer会有TCP,UDP协议。下图摘自wikipedia

对于tcpdump,-e表示输出link level header,以下是一个例子 tcpdump -i eth2 -e -n

要以看到用了-e打印出了网卡MAC地址,链路层的协议(ethertype), 网络层的协议(IPv4), 第一个length是表示链路层包的长度。然后打出的是里面的tcp packet的信息,发送端和接收端的ip地址,tcp中的Flags等,可以看到后三个包都是广播的包。最后一个是一个ARP查询的包
用tcpdump来看一下三次握手
用这样的命令形式,sudo tcpdump -i eth2 -n '(tcp[13] & 2 == 2 or tcp[13] & 16 ==16)' , 注意tcpdump是需要superviser的权限的, 输出很多,从中提了一个三次握手

上面的 -n 表示输出结果全用数字表示而不用域名和端口代表的服务名,而后面那个是传递给tcpdump中的libpcap模块的过滤expression, 关于这个过滤expression的语法,在man pcap-filter中有详细的说明,上面这个表达式的意思是 , tcp[13]是包中的tcp子包的第13个字节的值,字节数是从第0个字节开始的。而这个字节正好是Flags这个字节。 而上面Flags的字段中 S表示SYN, .(一个点)表示ACK

上图是TCP的结构,从图中可以看出,对于Flags这个字节,2表示只有SYN这一位为1, 16则是只有ACK那一位为1, 而上面的tcp[13] & 2 == 2表示SYN这一位为1, 其他位不管。在tcp协议中,只有建立连接的两个端口发的第一个包才会设置SYN位,表示起始的sequence number。从上面可以看到起始的seq num是一个随机值。
libpcap , 以及基于libpcap实现一个简单的抓包程序
安装
libpcap是一个c库,用于网络抓包和过滤,源于tcpdump项目,是从最开始tcpdump中剥离出来的一个库, tcpdump中抓包,过滤,capture file的读写的代码被提取出来成了libpcap。现在也是由tcpdump项目的开发者维护。
从tcpdump的官网上下载下来后,包里面有一个INSTALL.txt文件,也就是三步的内容,./configure; make; make install;在这个过程中我安装了flex(一个lexical analyzer generator)和yacc才成功了
写的一个简单程序
pcap实际上是从链路层抓包的,所以可以从中提出取出从链路层开始的包信息,官网里(这里)有详细的基于pcap的编程文档。这个文档中有提到基于libpcap编程的基本步骤, 如何应用过滤条件,如何拿到一个包后回调,以及在回调函数中(下面的call_back)怎样提取包的详细信息,因为是得到这个链路层包的实际内容的(以字串的形式),所以是可以提取出从链路层开始,网络程ip, 传输层如tcp的所有信息的, 基本上不同的基于libpcap的软件也就是这里不同了,怎样提取和展示包的信息。基于这个文档我写了一个简单的程序

1 #include<stdio.h>
2 #include<pcap.h>
3 #include<string>
4
5 using namespace std;
6
7 static const unsigned int ETHER_ADDR_LEN = 6;
8 void call_back(u_char * args, const struct pcap_pkthdr * header, const u_char * packet);
9 string generate_mac_address(char macChars[ETHER_ADDR_LEN]);
10
11 int main(){
12 pcap_t * handle; // Sesion handle
13 char dev[] = "eth2"; //device to sniff on
14 char errbuf[PCAP_ERRBUF_SIZE]; // error string
15 char filter_exp[] = ""; //filter expression
16 bpf_u_int32 mask; //The netmask of our sniffing device
17 bpf_u_int32 net; //The IP of our sniffing device
18
19 struct bpf_program fp; //the compiled filter expression
20
21 //查询device的mask和ip
22 if (pcap_lookupnet(dev, &net, &mask, errbuf) == -1){
23 fprintf(stderr, "Can't get netmask for device %s\n", dev);
24 net = 0;
25 mask = 0;
26 }
27
28 //obtaining packet capture descriptor
29 handle = pcap_open_live(dev, BUFSIZ, 1, 1000, errbuf);
30 if(handle == NULL){
31 fprintf(stderr, "Can't open device %s\n", dev);
32 return 2;
33 }
34
35 // before apply filter exp, compile it
36 if(pcap_compile(handle, &fp, filter_exp, 0, net) == -1){
37 fprintf(stderr, "can't parse filter %s: %s\n", filter_exp, pcap_geterr(handle));
38 return 2;
39 }
40 //apply filter to this session
41 if(pcap_setfilter(handle, &fp) == -1){
42 fprintf(stderr, "can't install filter %s: %s\n", filter_exp, pcap_geterr(handle));
43 return 2;
44 }
45
46 // now the device is prepared to sniff under the filter condition
47 struct pcap_pkthdr header; // packet header struct
48 const u_char * packet; // actual packet
49
50 //5表示积累5个包pcap_loop才返回,但每个包都会调一次call_back
51 while(!pcap_loop(handle, 5, call_back, NULL)){
52 printf("-------\n"); //每8行才会输出一次这个
53 }
54 pcap_close(handle);
55 }
56
57 struct sniff_ethernet {
58 char ether_dhost[ETHER_ADDR_LEN]; /* Destination host address */
59 char ether_shost[ETHER_ADDR_LEN]; /* Source host address */
60 u_short ether_type; /* IP? ARP? RARP? etc */
61 };
62
63 // call_back function的统一原型
64 void call_back(u_char * args, const struct pcap_pkthdr * header, const u_char * packet){
65 static int count = 0;
66 struct sniff_ethernet * ethernet; //ethernet header
67 ethernet = (struct sniff_ethernet*)(packet);
68
69 //把6字节的字符串转换成mac地址的表示形式
70 std::string source_mac_address = generate_mac_address(ethernet->ether_shost);
71 std::string dst_mac_address = generate_mac_address(ethernet->ether_dhost);
72
73 printf("wy: call_back called %d, %s->%s, packet length:%d\n", count++, source_mac_address.c_str(), dst_mac_address.c_str(), header->len);
74 }
75
76 //由字节为单位字符串生成mac地址,16进制数的字串
77 string generate_mac_address(char macChars[ETHER_ADDR_LEN]){
78 string macAddr;
79 char temp[2];
80 for(int i = 0; i < ETHER_ADDR_LEN; i++){
81 //把一个字节转化成16进制表示形式
82 sprintf(temp, "%x", macChars[i]);
83 if(i != 0){
84 macAddr.append(":");
85 }
86 macAddr.append(temp, 2);
87 }
88 return macAddr;
89 }

这个程序上面有比较详细的注释,就是把通用的基于libpcap编程的流程走了一遍,最后打印出每个包链路层from和to的MAC地址,以及每个包的长度.
对于call_back的第二个参数 struct pcap_pkthdr, 这是pcap.h中定义的一个结构体,包含了这个包的一些信息,捕获时间,包长度, 可以看到程序中的包长度就是从中提取的,定义如下
1 struct pcap_pkthdr {
2 struct timeval ts; /* time stamp */
3 bpf_u_int32 caplen; /* length of portion present */
4 bpf_u_int32 len; /* length this packet (off wire) */
5 };
上面的参数char * packet实际上是整个包在内存在的地址,为了从这当中提取出信息,必须要自己定义相应的数据结构从这个纯字符串中去提, 可以看到我照着文档中去定义了一个 struct sniff_ethernet,这个是需要自己定义的,pcap.h中是没有的,然后可以看到我如何写了一个函数 generate_mac_address把这个6字节的字符串转换成mac地址标准的表达形式。以下是程序运行输出

比较奇怪的是,我本机网卡 eth2的MAC地址是 bc:30:5b:a4:40:40, 但是程序的输出是 ff:30:5b:ff:40:40
本来想选择就用c来写这个程序,但是写到字串转换那里,对字符串的操作用c确实比较麻烦和难看,所以我还是用的c++, 我想到了陈皓的一篇文章,他感慨c的编译器gcc已经开始用c++来实现了,他列举出了c++比c优雅的地方,就我的感觉是很赞同的。
一个链接错误
很奇怪的是我编译程序遇到了一个错误, g++ -o test_pcap test_pcap.cpp -L/usr/local/lib -lpcap
错误提示是
/usr/local/lib/libpcap.so: undefined reference to `pcap_parse'
collect2: ld returned 1 exit status
google了一下,发现这个问题很普遍却都没给出一个明确的原因解释,有篇文章提到把libpcap重装也一遍,也就是cd到下载下来的包目录,make clean ; ./configure; make ; make install ; 我这样试了之后竟然好了,没有明白是为什么,网上也没有找到,在这里做一个记录吧
网络抓包工具wireshark and tcpdump 及其实现基于的libpcap的更多相关文章
- 网络抓包工具-Wireshark学习资料
wireshark一个非常牛逼的网络抓包工具.转载一系列博文 一站式学习Wireshark(一):Wireshark基本用法 一站式学习Wireshark(二):应用Wireshark观察基本网络协议 ...
- Wireshark 网络抓包工具Wireshark的使用
阅读目录 wireshark介绍 wireshark不能做的 wireshark VS Fiddler 同类的其他工具 什么人会用到wireshark wireshark 开始抓包 wireshark ...
- 网络抓包工具 wireshark 入门教程
Wireshark Wireshark(前称Ethereal)是一个网络数据包分析软件.网络数据包分析软件的功能是截取网络数据包,并尽可能显示出最为详细的网络数据包数据.Wireshark使用WinP ...
- 网络抓包工具wireshark常用封装过滤规则
过滤器的区别 捕捉过滤器(CaptureFilters):用于决定将什么样的信息记录在捕捉结果中.需要在开始捕捉前设置.显示过滤器(DisplayFilters):在捕捉结果中进行详细查找.他们可以在 ...
- 网络抓包工具Wireshark和Fidder
http://fangxin.blog.51cto.com/1125131/735178 http://blog.csdn.net/jiangwei0910410003/article/details ...
- socket和抓包工具wireshark
socket和抓包工具wireshark 最近在学习Python代码中的socket和抓包工具wireshark,故又将socket等概念又学习了一遍,温故而知新: Python代码如下: serve ...
- 抓包工具Wireshark过滤器
抓包工具WireShark分为两种过滤器: 捕捉过滤器(CaptureFilters) 显示过滤器(DisplayFilters) 捕捉过虑器语法: Protocol Direction Host ...
- 跨平台网络抓包工具-Microsoft Message Analyzer
Microsoft Message Analyzer (MMA 2013)是微软最受欢迎的Netmon的最新版本. 在Netmon网络跟踪和排除故障功能的基础上提供了更强大的跨平台网络分析追踪能力.园 ...
- Microsoft Message Analyzer (微软消息分析器,“网络抓包工具 - Network Monitor”的替代品)官方正式版现已发布
来自官方日志的喜悦 被誉为全新开始的消息分析器时代,由MMA为您开启,博客原文写的很激动,大家可以点击这里浏览:http://blogs.technet.com/b/messageanalyzer/a ...
随机推荐
- 最长递增子序列 (LIS) Longest Increasing Subsequence
问题描述: 有一个长为n的数列a0, a1,..., an-1.请求出这个序列中最长的上升子序列.请求出这个序列中最长的上升子序列. 上升子序列:对于任意i<j都满足ai<aj的子序列. ...
- [JSP]自定义EL函数以及使用
有时候在JSP页面需要进行一连串的字符串的处理,需要进行自定义EL函数. 先看EL函数的tld文件: standard.jar下面: 自定义EL函数: 1.编写EL函数(全是public static ...
- java IO与NIO
场景:IO适用于大而少,NIO适用于小而多 转载:https://www.cnblogs.com/kzfy/p/5063467.html 传统的socket IO中,需要为每个连接创建一个线程,当并发 ...
- Java时间戳转化为今天、昨天、明天(字符串格式)
原文:http://www.open-open.com/code/view/1435301895825 时间戳,相信大家一定都不陌生,服务器经常会传回来时间戳,需要我们对时间戳进行处理.各种麻烦不断, ...
- struts2 input file多文件同时通过ajax提交
<input type="file" name="files" multiple="multiple">必须是multiple才 ...
- eclipse设置每次提交代码忽略target、.settings、.svn、.project文件
- jenkins修改日志级别方法
1.jenkins日志有时候也会消耗掉很大内存,在传输时也会消耗掉大量带宽,如图,300+M的日志大小,太夸张了吧 2.修改日志级别的方法: 在配置文件里修改,重启后永久生效,配置路径:/etc/sy ...
- Ubuntu系统U盘安装以及降内核
由于项目需要,要用U盘制作一个Linux系统,支持EFI启动,并且内核版本要求是2.6.35.6.所以在选系统的时候,就必须要选安装文件里面带有EF I目录,并且该目录下面有BOOTx64.EFI和g ...
- Python中文GBK编码解决实例
http://eatsalt.blog.163.com/blog/static/879402662009420508748/ #coding:gbk l=['我'.decode('gbk'),'我'. ...
- Antivius for Linux
http://www.clamav.net/ https://www.avast.com/zh-cn/linux-server-antivirus http://www.f-prot.com/ ...