转载: Erlang Socket解析二进制数据包
转自:http://www.itkee.com/developer/detail-318.html
今天在家里闲来无事,实践了一下Erlang的Socket的功能。记录一下在过程中遇到的一些问题,以及编码的步骤。
1. 对于测试用例的介绍:
Erlang编写TCP服务器。只做一次Accept,接收到Socket
之后开始收数据。用python编写Client,连接到服务器上;发送LEN(int)+CMD(short)+BODY(binary)格式的数据
包。用于熟悉Erlang如何做拆解包,数据读取。
2. 编写简单的Erlang TCP服务器:
Erlang里面的TCP socket应该都是这个方式来编写代码。指的修改和优化的是在于可以启动更多的进程来驱动起这个应用。
%% 文件名:server.erl
%% 模块定义
-module(server).
%% 导出函数
-export([start/0]).
%% 宏定义
-define( PORT, 2345 ).
-define( HEAD_SIZE, 4 ).
%% 解数字类型用到的宏
-define( UINT, 32/unsigned-little-integer).
-define( INT, 32/signed-little-integer).
-define( USHORT, 16/unsigned-little-integer).
-define( SHORT, 16/signed-little-integer).
-define( UBYTE, 8/unsigned-little-integer).
-define( BYTE, 8/signed-little-integer).
%% 对外接口
start() ->
%% 这个地方有些有意思的东西:
%% 1.{packet,0}这个设定,可以让Erlang不再接管socket的封包了;
%% 如果被Erlang接管了,在物理网络包前面4Bytes里面写的东西不
%% 是简单的网络包的Size.
%% 2.{active,false}这个设定,可以让接受到的Socket Recv指定Size
%% 网络包,这样也就方便了拆解包的工作了。
{ok, Listen}=gen_tcp:listen( ?PORT,[ binary,
{ packet, 0 }, { reuseaddr, true }, { active, false }]),
io:format("start listen port: ~p~n", [?PORT] ),
{ok, Socket} = gen_tcp:accept(Listen),
%% 接收到客户端之后将马上关闭Listen Socket
gen_tcp:close( Listen ),
%% 开始读取数据包头
looph(Socket).
%% 读出包头
looph(Socket) ->
case gen_tcp:recv( Socket, ?HEAD_SIZE ) of
{ ok, H } ->
io:format("recv head binary=~p~n", [H] ) ,
%% 匹配出包头
<< TotalSize:?UINT >> = H ,
%% 除去包头的SIZE
BodySize = TotalSize - ?HEAD_SIZE,
%% 开始收包体
loopb(Socket,BodySize);
%% 出异常了
{ error, closed } ->
io:format("recv head fail." )
end.
%% 读出包体
loopb(Socket,BodySize) ->
case gen_tcp:recv( Socket, BodySize ) of
{ ok, B } ->
%% 模式匹配
%% 1.得出数据包中的CMD编号
%% 2.将后面部分的Buffer放到Contain里面
<< CMD:?USHORT, Contain/binary>> = B,
io:format("recv body binary = ~p~n", [B] ),
io:format("recv protocol CMD = ~p~n", [CMD] ),
io:format("recv body = ~p~n", [Contain] ),
%% 继续读取包头
looph(Socket);
%% 异常处理
{error,close} ->
io:format("recv body fail.")
end.
在编写这个代码过程中遇到的麻烦:
2.1. 不知道如何匹配出数据包头来:
<< TotalSize:?UINT >> = H
2.2. 不知道如何将一个binary匹配出来部分,将剩余部分binary放到别的里面:
<< CMD:?USHORT, Contain/binary>> = B
2.3. 在多次调试之后出来这样的错误:
{error,eaddrinuse}
端口被占用了,这个时候去关闭全部后台的.beam也是没有解决这个问题。最后重启了机器才能让这个问题解决。
2.4. Erlang中对于binary操作的熟悉:
term_to_binary和binary_to_term函数的功效:
用于将一个任意的Erlang值转化成为二进制(反向操作),这个特性可能也只有在Erlang之间打交道的时候可以用上。
list_to_binary:
这个函数非常有用,原因是它不挑食。打个比方:
1> A = "A".
"A"
2> B = list_to_binary(A).
<<"A">>
结果这个"A"字符串被好好的放在了binary里面去了。
还有一个用处就是用来连接已经生成好的一些binary的对象
10> A = << 1,2,3,4 >>.
<<1,2,3,4>>
11> B = << "A" >>.
<<"A">>
12> C = list_to_binary( [A, B] ).
<<1,2,3,4,65>>
3. 开始编写python客户端代码:
这个Socket客户端是使用的asyncore的dispatcher来做的。用起来有些像ACE里面的reactor模型。这个代码写起来非常容易了。
# -*- coding: utf-8 -*-
import socket
import asyncore
# 宏定义
MAX_RECV_CACHE = 1024
CHAT_MSG = 0x101A
# 聊天客户端
class ChatClient( asyncore.dispatcher ):
def __init__( self, host = Host, port = Port ):
asyncore.dispatcher.__init__( self )
self.create_socket( socket.AF_INET, socket.SOCK_STREAM)
self.connect( ( host, port) )
self.buffer_ = ''
self.recv_buf_ = ''
pass
# 链接成功
def handle_connect( self ):
print( "[SOCKET] handle_connect event." )
self.send_message( CHAT_MSG, "hello then world." )
self.send_message( CHAT_MSG, "this data is come from python." )
pass
# 读取内容
def handle_read( self ):
ret = self.recv( MAX_RECV_CACHE )
pass
def send_message( self, _prop_cmd, _msg ):
print( "presend size = %d"%len( _msg ) )
total_size = len( _msg ) + 4 + 2
self.buffer_ = self.buffer_ + struct.pack( "I", total_size )
self.buffer_ = self.buffer_ + struct.pack( "H", _prop_cmd )
self.buffer_ = self.buffer_ + _msg
pass
if __name__ == "__main__":
try:
client = ChatClient()
asyncore.loop()
except KeyboardInterrupt:
print( "退出." )
pass
完结。下次开始学习Erlang的OTP ETS了。
转载: Erlang Socket解析二进制数据包的更多相关文章
- C# TCP socket发送大数据包时,接收端和发送端数据不一致 服务端接收Receive不完全
简单的c# TCP通讯(TcpListener) C# 的TCP Socket (同步方式) C# 的TCP Socket (异步方式) C# 的tcp Socket设置自定义超时时间 C# TCP ...
- c#网络通信框架networkcomms内核解析之八 数据包的核心处理器
NetworkComms网络通信框架序言 本文基于networkcomms2.3.1开源版本 gplv3协议 我们先回顾一个 c#网络通信框架networkcomms内核解析之六 处理接收到的二进制 ...
- ubuntu下解析udt数据包
udt是通过udp进行端到端可靠传输的一个协议,有其默认拥塞控制算法. 之前ubuntu下wireshark的版本是1.10,不能直接解析udt数据包[1],升级到最新的2.0.0即可过滤udt数据包 ...
- 用原生socket发送HTTP数据包
分享一个写扫描器和POC时的小技巧. 有时候有的漏洞需要一些特殊的数据包,比如说畸形的HTTP头.畸形的Multipart.畸形的chunk包等,此时用编程语言自己的HTTP库可能构造不出这种数据包, ...
- python网络编程-socket发送大数据包问题
一:什么是socket大数据包发送问题 socket服务器端或者客户端在向对方发送的数据大于对方接受的缓存时,会出现第二次接受还接到上次命令发送的结果.这就出现象第一次接受结果不全,第二次接果出现第一 ...
- 学习:erlang的不定长数据包头部。
- IM通信协议逆向分析、Wireshark自定义数据包格式解析插件编程学习
相关学习资料 http://hi.baidu.com/hucyuansheng/item/bf2bfddefd1ee70ad68ed04d http://en.wikipedia.org/wiki/I ...
- Erlang 位串和二进制数据
http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=25876834&id=3300393 因为在本人工作中,服务端Erla ...
- 在SQL中使用CLR提供基本函数对二进制数据进行解析与构造
二进制数据包的解析一般是借助C#等语言,在通讯程序中解析后形成字段,再统一单笔或者批量(表类型参数)提交至数据库,在通讯程序中,存在BINARY到struct再到table的转换. 现借助CLR提 ...
随机推荐
- 怎么使用 bat 使用日期时间重命名文件名
d: rename A.txt "A%date:~0,4%-%date:~5,2%-%date:~8,2%_%time:~0,2%-%time:~3,2%-%time:~6,2%_backu ...
- C 指针使用误区
/** *错误给指针赋常量 *知识点:指针存储内存地址 **/ #include <stdio.h>void main(){ //int *p_int = 123; //错误,不能直接给指 ...
- (转) 共享个很棒的vim配置
发现了一个很棒的vim配置方法,现在共享给大家. https://github.com/kepbod/ivim ivim - The Vim Distribution of Xiao-Ou Zha ...
- C# xml可序列化多值枚举脚本
代码: using System; using System.Collections.Generic; using System.Xml; using System.Xml.Schema; using ...
- MVC4实现AJAX需要引用的2个文件
<script src="@Url.Content("~/Scripts/jquery-1.7.1.min.js")" type="text/j ...
- :c#的remoting里,CallContext.GetData获得的对象老是空的?该怎么处理
寻求帮助:c#的remoting里,CallContext.GetData获得的对象老是空的?如题,检查了很多次了,也比对了msdn里的例子,没觉得有问题啊..为什么老是得到的null的?不知道哪里出 ...
- eclipse中maven项目部署到tomcat [转]
其实maven项目部署到tomcat的方式很多,我从一开始的打war包到tomcat/webapps目录,到使用tomcat-maven插件,到直接使用servers部署,一路来走过很多弯路. 下面就 ...
- Spring 是如何解决并发访问的线程安全性问题的
springmvc的controller是singleton的(非线程安全的),这也许就是他和struts2的区别吧!和Struts一样,Spring的Controller默认是Singleton的, ...
- Thread中的join使用
线程中的join方法就是用来等待一个线程完成它自己的全部任务之后才开启下一个进程,join(时间),则表示线程要执行完时间范围才开始下一个工作任务的执行!比如定义join(1500)必须在执行15s后 ...
- 注解Annotation的IoC:从@Autowired到@Component
注解Annotation的IoC:从@Autowired到@Component 2017-01-23 目录 1 什么是注解2 不使用注解示例 2.1 com.springioc.animal.Mon ...