如何使用maven进行avro序列化

maven导入avro：

<dependency>

    <groupId>org.apache.avro</groupId>

    <artifactId>avro</artifactId>

    <version>1.7.7</version>

</dependency>

maven导入avro的构建插件：

<build>

    <plugins>

        <plugin>

            <groupId>org.apache.avro</groupId>

            <artifactId>avro-maven-plugin</artifactId>

            <version>1.7.7</version>

            <executions>

                <execution>

                    <phase>generate-sources</phase>

                    <goals>

                        <goal>schema</goal>

                        <goal>protocol</goal>

                        <goal>idl-protocol</goal>

                    </goals>

                    <configuration>

                        <!-- 源目录，用于存放 avro的schema文件及protocol文件 ,如果没加如下配置，那么默认从/src/main/avro下面找avsc文件，生成的java文件放到target/generated-sources/avro下面-->

                        <sourceDirectory> ${project.basedir}/src/main/avro/</sourceDirectory>

                        <outputDirectory> ${project.basedir}/src/main/java/</outputDirectory>

                    </configuration>

                </execution>

            </executions>

        </plugin>

        <plugin>

            <groupId>org.apache.maven.plugins</groupId>

            <artifactId>maven-compiler-plugin</artifactId>

            <configuration>

                <source>1.7</source>

                <target>1.7</target>

            </configuration>

        </plugin>

    </plugins>

</build>

在${project.basedir}/src/main/avro/ 下导入json文件，就是所谓的数据schema

{

   "namespace":"user_machine_learning",

   "type":"record",

   "name":"product",

   "fields":[

          {"name":"product_id","type":"string","default":"null"},

          {"name":"company_name","type":"string","default":"null"},

          {"name":"product_info","type":"string","default":"null"},

          {"name":"direction","type":"string","default":"null"}

    ]

}

maven和schema构建好之后需要进行install，然后就会在 ${project.basedir}/src/main/avro/ 目录下产生构建好的序列化代码，这个代码只需要使用java进行调用即可

使用java进行序列化和反序列化的操作：

public class Test_avro {

    public static void main(String[] args) throws IOException {

        //TODO 序列化操作

        product pro = product.newBuilder().build();

        pro.setProductId("1");

        pro.setCompanyName("这是一个测试");

        pro.setProductInfo("测试的详细说明");

        pro.setDirection("1");

        //将生成的数据保存到本地文件中

        File file = new File("/Users/niutao/Desktop/avro_test/user.avro");

        DatumWriter<product> productDatumWriter = new SpecificDatumWriter<product>(product.class);

        DataFileWriter<product> dataFileWriter = new DataFileWriter<product>(productDatumWriter);

        dataFileWriter.create(product.getClassSchema() , file);

        dataFileWriter.append(pro);

        dataFileWriter.close();

        //TODO 反序列

        DatumReader<product> productDatumReader = new SpecificDatumReader<product>(product.class);

        DataFileReader<product> productDataFileReader = new DataFileReader<product>(file , productDatumReader);

        product pro_reader = null;

        while (productDataFileReader.hasNext()){

            pro_reader = productDataFileReader.next();

            System.out.println(pro_reader);

        }

    }

}

如何使用maven进行avro序列化的更多相关文章

Avro序列化与反序列化
4.Avro实现序列化的步骤 1.创建maven工程,引入pom文件(定义属性和依赖信息,以及定义Avro插件) 2.根据Avro插件的要求,更改maven工程结构,需要创建一个source/main ...
avro序列化详细操作
Intellij 15.0.3 Maven avro 1.8.0 Avro是一个数据序列化系统. 它提供以下: 1 丰富的数据结构类型 2 快速可压缩的二进制数据形式 3 存储持久数据的文件容器 4 ...
hadoop深入研究:(十六)——Avro序列化与反序列化
转载请写明来源地址:http://blog.csdn.net/lastsweetop/article/details/9773233 所有源码在github上,https://github.com/l ...
Kafka 生产消费 Avro 序列化数据
https://unmi.cc/kafka-produce-consume-avro-data/ https://unmi.cc/apache-avro-serializing-deserializi ...
序列化之protobuf与avro对比(Java)
最近在做socket通信中用到了关于序列化工具选型的问题,在调研过程中开始趋向于用protobuf,可以省去了编解码的过程.能够实现快速开发,且只需要维护一份协议文件即可. 但是调研过程中发现了pro ...
Hadoop基础-Apache Avro串行化的与反串行化
Hadoop基础-Apache Avro串行化的与反串行化作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Apache Avro简介 1>.Apache Avro的来源 ...
Kafka Schema Registry | 学习Avro Schema
1.目标在这个Kafka Schema Registry教程中,我们将了解Schema Registry是什么以及为什么我们应该将它与Apache Kafka一起使用.此外,我们将看到Avro架构演 ...
常见的序列化框架及Protobuf序列化原理
原文链接:https://www.jianshu.com/p/657fbf347934 https://www.cnblogs.com/javazhiyin/p/11375553.html https ...
Flink资料（4） -- 类型抽取和序列化
类型抽取和序列化本文翻译自Type Extraction and Serialization Flink处理类型的方式比较特殊,包括它自己的类型描述,一般类型抽取和类型序列化框架.该文档描述这些概念 ...

随机推荐

copy之深浅拷贝
深浅拷贝深拷贝全部复制浅拷贝只复制第一层 __author__ = 'Perfect' # -*- coding: utf-8 -*- import copy # copy.copy() #浅拷贝 ...
python操作三大主流数据库(4)python操作mysql④python服务端flask和前端bootstrap框架结合实现新闻展示
python操作mysql④python服务端flask和前端bootstrap框架结合实现新闻展示参考文档http://flask.pocoo.org/docs/0.11/http://flask ...
VUE 多页面配置(一)
1. 概述 1.1 说明项目开发过程中会遇到需要多个主页展示情况,故在vue单页面的基础上进行配置多页面开发以满足此需求. 2. 实例 2.1 页面配置 2.1.1 默认首页使用vue脚手架搭建后 ...
CSS 三角形与圆形
1. 概述 1.1 说明通过边框(border)的宽度与边框圆角(border-radius)来设置所需的三角形与圆形. 1.2 边框宽高都为0时,边框设置的不同结果也不同,如下: 1.四个边框都 ...
liunx contos 7.4 安装redis集群
前前后后安装了几次redis集群,基本上每次安装都会采坑,耗时伤神. 安装redis依赖gcc环境,安装前先检查liunx上面有没有安装GCC 命令:gcc -v 上传redis-4.0.1.tar. ...
Confluence 6 MBeans
你可以使用下面的 Confluence MBeans 来实时查看你 Confluence 实例运行的实时信息. CacheStatistics 这个 MBean 显示了 Confluence 有关的 ...
基于vue-cli3的vue项目移动端样式适配，lib-flexible和postcss-px2rem
1,安装 flexible和 postcss-px2rem(命令行安装) npm install lib-flexible --save npm install postcss-px2rem --sa ...
MySQL外键使用详解
一.基本概念 1.MySQL中“键”和“索引”的定义相同,所以外键和主键一样也是索引的一种.不同的是MySQL会自动为所有表的主键进行索引,但是外键字段必须由用户进行明确的索引.用于外键关系的字段必须 ...
PDF文件编辑技巧之PDF书签怎么设置
纸质的文件想要添加书签就直接拿笔书写就可以,Word文件怎么添加书签相信大家也都知道,那么PDF文件的书签要怎么设置的呢,是不是有很多小伙伴不知道该怎么做呢,不要担心,今天小编就来跟大家分享一下在PD ...
怎么加密接口防止，API外部调用？
服务器端与客户端各自会存储一个TOKEN,这个TOKEN我们为了防止反编译是用C语言来写的一个文件并做了加壳和混淆处理.在客户端访问服务器API任何一个接口的时候,客户端需要带上一个特殊字段,这个字段 ...

如何使用maven进行avro序列化

如何使用maven进行avro序列化的更多相关文章

随机推荐

热门专题