转载: Erlang Socket解析二进制数据包
转自:http://www.itkee.com/developer/detail-318.html
今天在家里闲来无事,实践了一下Erlang的Socket的功能。记录一下在过程中遇到的一些问题,以及编码的步骤。
1. 对于测试用例的介绍:
Erlang编写TCP服务器。只做一次Accept,接收到Socket
之后开始收数据。用python编写Client,连接到服务器上;发送LEN(int)+CMD(short)+BODY(binary)格式的数据
包。用于熟悉Erlang如何做拆解包,数据读取。
2. 编写简单的Erlang TCP服务器:
Erlang里面的TCP socket应该都是这个方式来编写代码。指的修改和优化的是在于可以启动更多的进程来驱动起这个应用。
%% 文件名:server.erl
%% 模块定义
-module(server).
%% 导出函数
-export([start/0]).
%% 宏定义
-define( PORT, 2345 ).
-define( HEAD_SIZE, 4 ).
%% 解数字类型用到的宏
-define( UINT, 32/unsigned-little-integer).
-define( INT, 32/signed-little-integer).
-define( USHORT, 16/unsigned-little-integer).
-define( SHORT, 16/signed-little-integer).
-define( UBYTE, 8/unsigned-little-integer).
-define( BYTE, 8/signed-little-integer).
%% 对外接口
start() ->
%% 这个地方有些有意思的东西:
%% 1.{packet,0}这个设定,可以让Erlang不再接管socket的封包了;
%% 如果被Erlang接管了,在物理网络包前面4Bytes里面写的东西不
%% 是简单的网络包的Size.
%% 2.{active,false}这个设定,可以让接受到的Socket Recv指定Size
%% 网络包,这样也就方便了拆解包的工作了。
{ok, Listen}=gen_tcp:listen( ?PORT,[ binary,
{ packet, 0 }, { reuseaddr, true }, { active, false }]),
io:format("start listen port: ~p~n", [?PORT] ),
{ok, Socket} = gen_tcp:accept(Listen),
%% 接收到客户端之后将马上关闭Listen Socket
gen_tcp:close( Listen ),
%% 开始读取数据包头
looph(Socket).
%% 读出包头
looph(Socket) ->
case gen_tcp:recv( Socket, ?HEAD_SIZE ) of
{ ok, H } ->
io:format("recv head binary=~p~n", [H] ) ,
%% 匹配出包头
<< TotalSize:?UINT >> = H ,
%% 除去包头的SIZE
BodySize = TotalSize - ?HEAD_SIZE,
%% 开始收包体
loopb(Socket,BodySize);
%% 出异常了
{ error, closed } ->
io:format("recv head fail." )
end.
%% 读出包体
loopb(Socket,BodySize) ->
case gen_tcp:recv( Socket, BodySize ) of
{ ok, B } ->
%% 模式匹配
%% 1.得出数据包中的CMD编号
%% 2.将后面部分的Buffer放到Contain里面
<< CMD:?USHORT, Contain/binary>> = B,
io:format("recv body binary = ~p~n", [B] ),
io:format("recv protocol CMD = ~p~n", [CMD] ),
io:format("recv body = ~p~n", [Contain] ),
%% 继续读取包头
looph(Socket);
%% 异常处理
{error,close} ->
io:format("recv body fail.")
end.
在编写这个代码过程中遇到的麻烦:
2.1. 不知道如何匹配出数据包头来:
<< TotalSize:?UINT >> = H
2.2. 不知道如何将一个binary匹配出来部分,将剩余部分binary放到别的里面:
<< CMD:?USHORT, Contain/binary>> = B
2.3. 在多次调试之后出来这样的错误:
{error,eaddrinuse}
端口被占用了,这个时候去关闭全部后台的.beam也是没有解决这个问题。最后重启了机器才能让这个问题解决。
2.4. Erlang中对于binary操作的熟悉:
term_to_binary和binary_to_term函数的功效:
用于将一个任意的Erlang值转化成为二进制(反向操作),这个特性可能也只有在Erlang之间打交道的时候可以用上。
list_to_binary:
这个函数非常有用,原因是它不挑食。打个比方:
1> A = "A".
"A"
2> B = list_to_binary(A).
<<"A">>
结果这个"A"字符串被好好的放在了binary里面去了。
还有一个用处就是用来连接已经生成好的一些binary的对象
10> A = << 1,2,3,4 >>.
<<1,2,3,4>>
11> B = << "A" >>.
<<"A">>
12> C = list_to_binary( [A, B] ).
<<1,2,3,4,65>>
3. 开始编写python客户端代码:
这个Socket客户端是使用的asyncore的dispatcher来做的。用起来有些像ACE里面的reactor模型。这个代码写起来非常容易了。
# -*- coding: utf-8 -*-
import socket
import asyncore
# 宏定义
MAX_RECV_CACHE = 1024
CHAT_MSG = 0x101A
# 聊天客户端
class ChatClient( asyncore.dispatcher ):
def __init__( self, host = Host, port = Port ):
asyncore.dispatcher.__init__( self )
self.create_socket( socket.AF_INET, socket.SOCK_STREAM)
self.connect( ( host, port) )
self.buffer_ = ''
self.recv_buf_ = ''
pass
# 链接成功
def handle_connect( self ):
print( "[SOCKET] handle_connect event." )
self.send_message( CHAT_MSG, "hello then world." )
self.send_message( CHAT_MSG, "this data is come from python." )
pass
# 读取内容
def handle_read( self ):
ret = self.recv( MAX_RECV_CACHE )
pass
def send_message( self, _prop_cmd, _msg ):
print( "presend size = %d"%len( _msg ) )
total_size = len( _msg ) + 4 + 2
self.buffer_ = self.buffer_ + struct.pack( "I", total_size )
self.buffer_ = self.buffer_ + struct.pack( "H", _prop_cmd )
self.buffer_ = self.buffer_ + _msg
pass
if __name__ == "__main__":
try:
client = ChatClient()
asyncore.loop()
except KeyboardInterrupt:
print( "退出." )
pass
完结。下次开始学习Erlang的OTP ETS了。
转载: Erlang Socket解析二进制数据包的更多相关文章
- C# TCP socket发送大数据包时,接收端和发送端数据不一致 服务端接收Receive不完全
简单的c# TCP通讯(TcpListener) C# 的TCP Socket (同步方式) C# 的TCP Socket (异步方式) C# 的tcp Socket设置自定义超时时间 C# TCP ...
- c#网络通信框架networkcomms内核解析之八 数据包的核心处理器
NetworkComms网络通信框架序言 本文基于networkcomms2.3.1开源版本 gplv3协议 我们先回顾一个 c#网络通信框架networkcomms内核解析之六 处理接收到的二进制 ...
- ubuntu下解析udt数据包
udt是通过udp进行端到端可靠传输的一个协议,有其默认拥塞控制算法. 之前ubuntu下wireshark的版本是1.10,不能直接解析udt数据包[1],升级到最新的2.0.0即可过滤udt数据包 ...
- 用原生socket发送HTTP数据包
分享一个写扫描器和POC时的小技巧. 有时候有的漏洞需要一些特殊的数据包,比如说畸形的HTTP头.畸形的Multipart.畸形的chunk包等,此时用编程语言自己的HTTP库可能构造不出这种数据包, ...
- python网络编程-socket发送大数据包问题
一:什么是socket大数据包发送问题 socket服务器端或者客户端在向对方发送的数据大于对方接受的缓存时,会出现第二次接受还接到上次命令发送的结果.这就出现象第一次接受结果不全,第二次接果出现第一 ...
- 学习:erlang的不定长数据包头部。
- IM通信协议逆向分析、Wireshark自定义数据包格式解析插件编程学习
相关学习资料 http://hi.baidu.com/hucyuansheng/item/bf2bfddefd1ee70ad68ed04d http://en.wikipedia.org/wiki/I ...
- Erlang 位串和二进制数据
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=25876834&id=3300393 因为在本人工作中,服务端Erla ...
- 在SQL中使用CLR提供基本函数对二进制数据进行解析与构造
二进制数据包的解析一般是借助C#等语言,在通讯程序中解析后形成字段,再统一单笔或者批量(表类型参数)提交至数据库,在通讯程序中,存在BINARY到struct再到table的转换. 现借助CLR提 ...
随机推荐
- ubuntu14.4开启ftp服务
1 更新源列表 打开"终端窗口",输入"sudo apt-get update"-->回车-->"输入当前登录用户的管理员密码" ...
- cv1.0入门
作者 群号 C语言交流中心 环境 VS2010UltimTrial1.iso http://pan.baidu.com/s/1dEL85kl VS2010Ulti ...
- WCF入门学习3-配置文件与部署iis
配置文件设置 --------------------------------------------------- 创建的时候都会有个配置文件,其实有一个WCF配置编辑器,右键就可以点出来设置. 需 ...
- XILINX XST综合的选项的含义
所谓综合,就是将HDL语言.原理图等设计输入翻译成由与.或.非门和RAM.触发器等基本逻辑单元的逻辑连接(网表),并根据目标和要求(约束条件)优化所生成的逻辑连接,生成EDF文件.完成了输入.仿真以及 ...
- 关于python调用zabbix api接口
因公司业务需要,引进了自动化运维,所用到的监控平台为zbbix3.2,最近正在学习python,计划使用python调用zabbix api接口去做些事情,如生成报表,我想最基本的是要取得zabbix ...
- Loadrunner常用操作
LoadRunner 参数化 为什么需要参数化? 大众理解:为了更加真实的模拟用户操作 底层原理: 1,应用服务,数据库会校验该值的唯一性(unique key) 2,为了避免数据库的查询缓存对性能测 ...
- C++ new操作符详解
一.new操作符的概念 我们通常讲的new是指的是new operator,其实还有另外两个概念,operator new 和 placement new. 1.new operator 我们在使用n ...
- Python 2.7.9 Demo - 005.字符串判空
#coding=utf-8 #!/usr/bin/python str1 = None; str2 = ''; str3 = ' '; if str1 == None : print("st ...
- python字符串转换成变量的几种方法
个人比较喜欢用第三种方法 var = "This is a string" varName = 'var' s= locals()[varName] s2=vars()[varNa ...
- c++之——派生类的同名成员和函数调用方式及构造析构顺序
#include<iostream> using namespace std; class Object { public: Object(), b(), c() { cout <& ...