Protocol buffer是Google出品的一种轻便高效的结构化数据存储格式,可对结构化数据进行序列化,并具有语言无关、平台无关等特点,在通信协议和数据存储等领域已经得到广泛的应用。目前其已经提供 C/C++、JavaPython 等语言的 API。

一、Protocol buffer和XML

在数据通信传输时,一般需要将结构化的数据序列化成流进行传送,接收方再反序列化为原始格式数据进行处理。在Web通信领域,XML应用算是最通用的了。在时间性能上,虽然XML的序列化开销还可以,但是反序列化的效率是比较差,而Protocol buffer的反序列化效率是比较高的;在空间性能上,Protobuffer采用了可变长的数据编码格式,比XML的字符格式要高效得多。Google集群要处理PB级数据,Protocolbuffer能够在时间和空间性能上有所改进,在整体效益而言就是相当可观的。

正是基于以上原因,微信和蓝牙外设的通信协议采用了Protocol buffer对消息包体进行打包。本文的目标是讲述Protobuffer在蓝牙微信协议中的应用,有助于理解微信蓝牙协议,对微信发给蓝牙外设的消息数据流进行反序列化,得到原始的结构化格式数据。因此语法也是围绕微信蓝牙协议包展开。更加详细的语法请百度相关内容或者找笔者探讨。

二、微信蓝牙外设协议通用格式

微信蓝牙使用流进行传输,在流上传输的是一个接着一个的业务逻辑的数据包。把设备发往厂商服务器或者微信服务器的请求包称为Req,回复包称为Resp,一个请求对应一个回包。把厂商服务器或者微信服务器主动发往设备的请求包称为PushReq。

包结构由定长包头和变长包体组成,其中包体即由Protocol buffer进行打包。

其中,定长包头为8个字节,bMagicNumber为0xFE;bVer为版本01;nLength为包长,包括包头和包体的长度;nCmdId为命令编码,如登陆授权,初始化,发送数据,push推送等等;nSeq为序列号,PushReq包的序列号固定为0,其他请求和回复包的序列号务必保持一致,每次请求后序列号加1.

以厂商服务器主动发数据给设备的PushReq包为例来说明变长包体,其对应定长包头的nCmdId为ECI_push_recvData = 30001。包体包括以下三个部分:

1) Push包标识

2) 自定义数据,指的是业务层自己定义的数据格式形成的数据。

3)  数据类型,如厂商自定义的数据,还是微信客户端Html5的数据等

三、Protobuffer的语法表述

Protobuffer对push_recvData包的表述如下:

Message类似C语言的struct数据结构,是Protobuffer消息定义的关键字。RecvDataPush是消息的名称。

Required前缀表示该字段必须在序列化之前赋值,optional前缀表示可以不赋值。

BasePush BasePush是message的第一个字段field,前者代表数据类型,后者是名称,其中BashPush在协议中是这样定义的:

Message BashPush{} 其意味着里面没有数据项,BashPush在打包过程中只会出现数据类型,其实也是代表着一种push标识。

Bytes Data是第二个字段field,为字符串,名称是Data。

EmDeviceDataType type是第三个字段field,为设备数据类型,其中EmDeviceDataType是一个enum类型,如下:

1,2,3代表字段在序列化后布局中的位置index,第一个位置是BashPush,接着是Data、type。

四、Protobuffer打包

Protobuffer打包有以下要素和规则:

1.使用Varints算法表示数字。Varints是一种紧凑表示数字的方法。Varints中每一个字节的最高位是有特殊含义的,如果是1,则表示后续的字节也是该数字的一部分;如果是0,则结束。所以如果表示小于128的数值可以用一个字节,如果大于等于128的数字则要用更多的字节进行表示。

2. Protobuffer有以下数据类型

Type表示对应数据类型序号,其中Varint对应的数据类型包括int32,int64,enum等等,type序号为0,其都使用Varints进行表示。String,bytes,message类型对应的type序号为2.

3. Protobuffer打包即是将message通过一系列的key-value对来表示。而key就是每个message中各字段的index(并做一定运算),value根据类型的不同会有不同的表现形式。

其中key = field<<3 | type。field即字段的index,而type是字段的数据类型序号。

而value,在数据类型为Varint时,直接为字段的赋值,按照Varints算法进行编码;在其他类型时就是“长度+原始内容编码”。

五、PushReq包分析

我们通过微信提供的AirSyncDebugger2.1.0.apk来分析Protobuffer对数据包的序列化。该APP用于微信和蓝牙外设的通信调试,其封装了微信蓝牙的协议,一般先用该APP调通蓝牙协议,再和后台服务器联调。假设我们自定义的消息内容为fe cf 00 01 00 0c 20 01 00 00 00 00,即对应第二个字段bytesData,该消息内容是上一篇文章中服务器控制亮灯所发的消息,后台服务器和蓝牙外设的消息协议是自定义的。AirSyncDebugger对PushReq包的序列化如下:

序列化过程分析如下:

固定包头(不受Protobuffer控制):

Magic : fe

Version: 01

Length : 00 1A,即包体和包体的总长度为26字节。

Cmdid : 75 31,十进制就是30001,即ECI_push_recvData包

Seq : 00 00 push包的序列号都是00 00

变长包体(Protobuffer控制打包,十六进表示):

0A: BasePush的field是1, 值类型message的序号type为2,所以是0x1<<3|0x02 = 0x0A

00 : 即值长度为0,BasePush值为空,其实就是一种标识。

12:data的field是2,值类型bytes的序号为2,所以是0x2<<3|0x2=0x12

0C:  data的长度是12

Fe cf 00 01 00 0c20 03 00 00 00 00 : data的内容,即我们自定义的消息。

18: Type的field是3,值类型enum的序号为0,所以是0x3<<3|0=0x18

00:Type的值,因为enum属于Varint的一种,所以不需要长度,直接用值表示,0代表厂商自定义数据。

六、基于微信硬件公众平台的智能控制方案开发专栏介绍

接下来嵌入式企鹅圈会将陆续公开基于微信硬件公众平台的智能控制开发技术细节,大致内容包括:

1. 物联网架构和场景分析(已发)

2. 基于微信硬件公众平台的智能控制开发流程(已发)

3. 云服务器搭建和公众号配置

4. 公众号菜单设置

5. 微信消息传递过程和微信设备接入接口协议

6. 微信硬件平台后台服务开发

7. 微信蓝牙协议和授权、绑定过程

8.Protocol buffer序列化及其在微信蓝牙协议中的应用(已发)

9. 蓝牙外设控制开发

Protocol buffer序列化及其在微信蓝牙协议中的应用的更多相关文章

  1. Protocol Buffer 序列化原理大揭秘 - 为什么Protocol Buffer性能这么好?

    前言 习惯用 Json.XML 数据存储格式的你们,相信大多都没听过Protocol Buffer Protocol Buffer 其实 是 Google出品的一种轻量 & 高效的结构化数据存 ...

  2. Protocol Buffer序列化Java框架-Protostuff

    了解Protocol Buffer 首先要知道什么是Protocol Buffer,在编程过程中,当涉及数据交换时,我们往往需要将对象进行序列化然后再传输.常见的序列化的格式有JSON,XML等,这些 ...

  3. Protocol Buffer序列化对比Java序列化.

    初识 Protocol Buff是谷歌推出的一种序列化协议. 而Java序列化协议也是一种协议. 两者的目的是, 将对象序列化成字节数组, 或者说是二进制数据, 那么他们之间有什么差异呢. proto ...

  4. Protocol Buffer序列化/反序列化---初体验(java版)

    今天闲遐时学习了 Protocol Buffer 在网上看到了许多资料,其中不泛精品,想要详细了解的请看文章结尾的友情链接,我这里就做加深印象,快速入门的一个完整的demo,仅此而已. 学完你可以得到 ...

  5. 蓝牙协议中的SBC编码

    一.从信息的传输说起  上图是一个典型的蓝牙耳机应用场景.手机上的音频信息经过编码以后通过蓝牙协议被蓝牙耳机接收,经过解码以后,蓝牙耳机成功获取手机上的音频信息,然后再转化为振动被人耳识别.这是一个 ...

  6. 蓝牙协议中的SBC编解码原理和仿真

    一.SBC的原理 SBC是subband codec的缩写,中文叫做次频带编码,也叫子带编码.其基本原理是把信号的频率分为若干子带,然后对每个子带进行编码,并根据每个子带的重要性及特点分配不同的位数( ...

  7. 以蓝牙开发的视觉解读微信Airsync协议

    微信硬件平台使用蓝牙作为近场控制的连接件,并拟定了<微信蓝牙外设协议>.这份协议更像一个标准,用于规范微信和蓝牙外设之间的数据交互场景和接口.但从开发者来看,要完全读懂这份协议,恐怕需要熟 ...

  8. Android:Google出品的序列化神器Protocol Buffer使用攻略

    习惯用 Json.XML 数据存储格式的你们,相信大多都没听过Protocol Buffer Protocol Buffer 其实 是 Google出品的一种轻量 & 高效的结构化数据存储格式 ...

  9. 微信蓝牙BLE接入调试指引 硬件篇

    1 平台框架简介 微信蓝牙BLE由三个模块组成,分别是蓝牙设备.微信和第三方服务器,如下图: 蓝牙设备与微信之间的通信是通过蓝牙GATT协议进行. 微信与第三方服器之间的通信是通过网络http 接口进 ...

随机推荐

  1. MVC埰坑日记 文件权限

    public static void DownLoadFile(string FileFullPath) { if (!string.IsNullOrEmpty(FileFullPath) & ...

  2. Python直接迭代序列比通过索引迭代序列快。

    小脚本跑一下看看时间. 原理:直接迭代序列是通过Python内置的迭代器去实现的,而如果迭代序列需要先造一个可迭代的序列出来.内置的迭代器并不是一下将所有的数据放入内存中,而是需要多少取多少. #!/ ...

  3. yzoi2226最小步数的详细解法

    Description - 问题描述 在各种棋中,棋子的走法总是一定的,如中国象棋中马走“日”.有一位小学生就想如果马能有两种走法将增加其趣味性,因此,他规定马既能按“日”走,也能如象一样走“田”字. ...

  4. js转换/Date(........)/

    eval('new ' + (datetime.replace(/\//g, ''))); 好记性不如烂笔头,记下以备后用.

  5. C#编程连接数据库,通过更改配置文件切换数据库功能。

           该实例主要应用情景:假如某公司用mysql当做数据库服务器,由于发现mysql数据库在运行中出现不稳定情况,针对这情况,厂家要求更换连接数据库方式,改用SQL server数据库,来满足 ...

  6. 转:Java程序员最常用的8个Java日志框架

    作为一名Java程序员,我们开发了很多Java应用程序,包括桌面应用.WEB应用以及移动应用.然而日志系统是一个成熟Java应用所必不可少的,在开发和调试阶段,日志可以帮助我们更好更快地定位bug:在 ...

  7. 对话Facebook人工智能实验室主任、深度学习专家Yann LeCun

    对话Facebook人工智能实验室主任.深度学习专家Yann LeCun Yann LeCun(燕乐存),Facebook人工智能实验室主任,NYU数据科学中心创始人,计算机科学.神经科学.电子电气科 ...

  8. JQuery 判断IPad、IPhone、Android是横屏还是竖屏(Window.Orientation实现)

    在ipad.iphone网页开发中,我们很可能需要判断是横屏或者竖屏.下面就来介绍如何用 jQuery 判断iPad.iPhone.Android是横屏还是竖屏的方法. 代码如下: function ...

  9. Java super与this用法解析

    1.     子类的构造函数如果要引用super的话,必须把super放在函数的首位. class Base { Base() { System.out.println("Base" ...

  10. Java 利用SWFUpload多文件上传 session 为空失效,不能验证的问题 swfUpload多文件上传

    Java 利用SWFUpload多文件上传 session 为空失效,不能验证的问题(转) 我们都知道普通的文件上传是通过表单进行文件上传的,还不能达到异步上传的目的.通过使用某些技术手段,比如jqu ...