google protocol buffer的原理和使用（一）

一、简单的介绍

Protocol buffers是一个用来序列化结构化数据的技术，支持多种语言诸如C++、Java以及Python语言。能够使用该技术来持久化数据或者序列化成网络传输的数据。相比較一些其它的XML技术而言。该技术的一个明显特点就是更加节省空间（以二进制流存储）、速度更快以及更加灵活。

通常，编写一个protocol buffers应用须要经历例如以下三步：

1、定义消息格式文件。最好以proto作为后缀名

2、使用Google提供的protocol buffers编译器来生成代码文件，一般为.h和.cc文件，主要是对消息格式以特定的语言方式描写叙述

3、使用protocol buffers库提供的API来编写应用程序

二、定义Proto文件

proto文件即消息协议原型定义文件，在该文件里我们能够通过使用描写叙述性语言，来良好的定义我们程序中须要用到数据格式。

首先我们能够通过Google在线文档上提供的一个电话簿的样例来了解下。只是略微加了点修改。

message Person {

required string name = 1;

required int32 id = 2;

optional string email = 3;

enum PhoneType {

MOBILE = 0;

HOME = 1;

WORK = 2;

}

message PhoneNumber {

required string number = 1;

optional PhoneType type = 2 [default = HOME];

}

repeated PhoneNumber phone = 4;

required bytes unsure = 5; //Add byte array here

}

message AddressBook {

repeated Person person = 1;

}

诚如你看到的一样，消息格式定义非常easy。对于每一个字段而言都有一个修饰符（required/repeated/optional）、字段类型（bool/string/bytes/int32等）和字段标签(Tag)组成。

三个修饰符从词义上能够非常清楚的弄明确。

1）对于required的字段而言，初值是必需要提供的，否则字段的便是未初始化的。

在Debug模式的buffer库下编译的话，序列化话的时候可能会失败，并且在反序列化的时候对于该字段的解析会总是失败的。所以，对于修饰符为required的字段，请在序列化的时候务必给予初始化。

2）对于optional的字段而言，假设未进行初始化。那么一个默认值将赋予该字段。当然也能够指定默认值。如上述proto定义中的PhoneType字段类型。

3）对于repeated的字段而言，该字段能够反复多个，google提供的这个addressbook样例便有个非常好的该修饰符的应用场景，即每一个人可能有多个电话号码。在高级语言里面，我们能够通过数组来实现，而在proto定义文件里能够使用repeated来修饰，从而达到同样目的。当然。出现0次也是包括在内的。

当中字段标签标示了字段在二进制流中存放的位置，这个是必须的，并且序列化与反序列化的时候同样的字段的Tag值必须相应，否则反序列化会出现意想不到的问题。

三、编译proto文件。生成特定语言数据的数据定义代码

在定义好了proto文件。就能够将该文件作为protocol buffers编译器的输入文件。编译产生特定语言的数据定义代码文件了。本文主要是针对C++语言，所以使用编译器后生成的是.h与.cc的代码文件。对于C++、Java还有Python都有各自的编译器。下载地址：http://code.google.com/p/protobuf/downloads/list

当你下载完了相应的编译器二进制文件后。就能够使用下列命令来完毕编译过程：

protoc.exe -proto_path=SRC --cpp_out=DST SRC/addressbook.proto

当中--proto_path指出proto文件所在的文件夹，--cpp_out则是生成的代码文件要放的文件夹，最后的一个參数指出proto文件的路径。如上述命令中能够看出，将SRC文件夹下的addressbook.proto编译后放在DST文件夹下。应该会生成addressbook.pb.h和addressbook.pb.cc文件(/Files/royenhome/addressbook.rar)。

通过查看头文件，能够发现针对每一个字段都会大致生成例如以下几种函数，以number为例：

// required string number = 1;

inline bool has_number() const;

inline void clear_number();

inline const ::std::string& number() const;

inline void set_number(const ::std::string& value);

inline void set_number(const char* value);

inline ::std::string* mutable_number();

能够看出。对于每一个字段会生成一个has函数(has_number)、clear清除函数(clear_number)、set函数(set_number)、get函数(number和mutable_number)。这儿解释下get函数中的两个函数的差别，对于原型为const std::string &number() const的get函数而言，返回的是常量字段，不能对其值进行改动。可是在有一些情况下，对字段进行改动是必要的。所以提供了一个mutable版的get函数，通过获取字段变量的指针，从而达到改变其值的目的。

而对于字段修饰符为repeated的字段生成的函数。则略微有一些不同，如phone字段，则编译器会为其产生例如以下的代码：

// repeated .Person.PhoneNumber phone = 4;

inline int phone_size() const;

inline void clear_phone();

inline const ::google::protobuf::RepeatedPtrField< ::Person_PhoneNumber >& phone() const;

inline ::google::protobuf::RepeatedPtrField< ::Person_PhoneNumber >* mutable_phone();

inline const ::Person_PhoneNumber& phone(int index) const;

inline ::Person_PhoneNumber* mutable_phone(int index);

inline ::Person_PhoneNumber* add_phone();

能够看出，set函数变成了add函数，这个事实上非常好理解。

上面也说过。repeated修饰的字段在高级语言中的实现可能是个数组或动态数组，所以当然通过加入的方式来加入新的字段值。而起get函数也变化非常大。这个也不用多说了。

好了。本文主要是对了解protocol buffer作了些简单的介绍，当然更具体的还是看官方文档。

google protocol buffer的原理和使用（一）的更多相关文章

google protocol buffer的原理和使用（二）
本文主要会介绍怎么使用Google Protocol的Lib来序列化我们的数据,方法非常多种,本文仅仅介绍当中的三种.其它的方法读者能够通过自行研究摸索.但总的来说,序列化数据总的来说分为下面俩步: ...
google protocol buffer的原理和使用（三）
介绍下怎么反序列化GoogleBuffer数据.并在最后提供本系列文章中所用到的代码整理供下载. 上一篇文章介绍了如何将数据序列化到了addressbook.data中.那么对于接受方而言该怎么解析出 ...
google protocol buffer的原理和使用（四）
有个电子商务的系统(如果用C++实现).当中的模块A须要发送大量的订单信息给模块B.通讯的方式使用socket. 如果订单包含例如以下属性: ----------------------------- ...
Google Protocol Buffer 的使用和原理
Google Protocol Buffer 的使用和原理 Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,很适合做数据存储或 RPC 数据交换格式.它 ...
转Google Protocol Buffer 的使用和原理
Google Protocol Buffer 的使用和原理 Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,很适合做数据存储或 RPC 数据交换格式.它 ...
Google Protocol Buffer 的使用和原理[转]
本文转自: http://www.ibm.com/developerworks/cn/linux/l-cn-gpb/ Protocol Buffers 是一种轻便高效的结构化数据存储格式,可以用于结构 ...
Google Protocol Buffer 的使用和原理（无论对存储还是数据交换，都是个挺有用的东西，有9张图做说明，十分清楚）
感觉Google Protocol Buffer无论对存储还是数据交换,都是个挺有用的东西,这里记录下,以后应该用得着.下文转自: http://www.ibm.com/developerworks/ ...
(转)Google Protocol Buffer 的使用和原理
转自:https://www.ibm.com/developerworks/cn/linux/l-cn-gpb/index.html 简介什么是 Google Protocol Buffer? ...
Google Protocol Buffer 协议
1. Protocol Buffers 简介 Protocol Buffers (ProtocolBuffer/ protobuf )是Google公司开发的一种数据描述语言,类似于XML能够将结构化 ...

随机推荐

PowerShell-第3章变量与对象
3.1 在变量中存储信息假如说变量存储了大量数据,且不用了,可以赋值为$null,则可以释放变量占用的内存空间. 3.2 访问环境变量获得所有环境变量 Get-ChildItem env: 获得某 ...
通过 PC 远程控制 Android 的应用 -- 可以将手机屏幕投射显示到电脑上
测试结果中的部分测试图:Mobizen手机界面: 电脑界面: 主界面视频全屏视频 WebKey手机界面: 电脑界面: AirMore手机界面: 电脑界面:主界面镜像全屏镜像 Airdroid手 ...
Docker存储和网络
Docker存储资源类型 docker两种存储资源类型用户在使用 Docker 的过程中,势必需要查看容器内应用产生的数据,或者需要将容器内数据进行备份,甚至多个容器之间进行数据共享,这必然会涉及到 ...
vc调试大全
一.调试基础调试快捷键 F5: 开始调试 Shift+F5: 停止调试 F10: 调试到下一句,这里是单步跟踪 F11: 调试到下一句,跟进函数内部 Shift+F11: 从当前函数中跳 ...
ci $this->load->database()
http://pengbotao.cn/codeigniter-database.html
wordpress需要FTP用户名密码的问题
wordpress安装删除插件需要FTP用户名密码的问题方法一: 服务器命令操作: 1.在wordpress目录下面wp-config.php末尾加入下面代码: if(is_admin()) { ...
linux下ln命令
转自:http://www.cnblogs.com/peida/archive/2012/12/11/2812294.html ln是linux中又一个非常重要命令,它的功能是为某一个文件在另外一个位 ...
Centos7 编译安装python3
step1:preparation $ yum install yum-utils make wget gcc $yum-builddep python step2:download $ wget h ...
sql语句中的join连接(左连接、右连接、全连接、内连接)
内部连接(inner join): select * from d_user a inner join D_ORGANIZATION b on a.COMPANY_XID=b.ID 内部链接也是排他 ...
php5.3.3版本前后变化中php-v和sbin/php-fpm -v
重装php-fpm试试,遂去http://php-fpm.org/download/想下载个新版本的php-fpm, 结果发现版本大于5.3.3的PHP内部已经集成了php-fpm,不用再另行安装了. ...

google protocol buffer的原理和使用（一）

google protocol buffer的原理和使用（一）的更多相关文章

随机推荐

热门专题