Doris github地址欢迎加Star

本文使用的GO是1.17.2

Doris 0.15.0 release版

Doris的数据导入有各种语言的版本,但是GO语言版本的基本见不到,简单学了一下,写了一个简单的Stream Load入库的示例,仅供参考

示例中使用的表结构:

CREATE TABLE IF NOT EXISTS user_info
(
user_id LARGEINT NOT NULL COMMENT "用户id",
username varchar(50) NOT NULL COMMENT "用户名",
city VARCHAR(20) COMMENT "用户所在城市",
age SMALLINT COMMENT "用户年龄",
sex TINYINT COMMENT "用户性别",
phone LARGEINT COMMENT "电话",
address VARCHAR(500) COMMENT "地址",
register_time datetime COMMENT "用户注册时间"
)
Unique KEY(user_id, username)
DISTRIBUTED BY HASH(user_id) BUCKETS 3
PROPERTIES (
"replication_num" = "3"
);

下面是GO的示例代码,其中支持从文件导入,从内存数据导入,同时提供了获取BE节点列表的方法,你在导入的时候可以从这里随机获取一个BE节点IP及端口,直连BE进行导入

package main
import (
"container/list"
"encoding/base64"
"encoding/json"
"fmt"
"github.com/gofrs/uuid"
"io/ioutil"
"log"
"net/http"
"strconv"
"strings"
) type StreamLoad struct {
url string
dbName string
tableName string
data string
userName string
password string
} //实现Doris用户认证信息
func auth(load StreamLoad) string {
s := load.userName + ":" + load.password
b := []byte(s) sEnc := base64.StdEncoding.EncodeToString(b)
fmt.Printf("enc=[%s]\n", sEnc) sDec, err := base64.StdEncoding.DecodeString(sEnc)
if err != nil {
fmt.Printf("base64 decode failure, error=[%v]\n", err)
} else {
fmt.Printf("dec=[%s]\n", sDec)
}
return sEnc
} //使用Stream load将文件数据导入到Doris对应的数据表中
func batch_load_file(load StreamLoad, file string) {
client := &http.Client{}
//生成要访问的url
url := "http://10.220.146.10:8030/api/test_2/user_info/_stream_load"
//fmt.Formatter(.Format(url,load.dbName,l))
fileContext, err := ioutil.ReadFile(file)
if err != nil {
log.Println("Failed to Read the File", file, err)
}
record := strings.NewReader(string(fileContext))
//提交请求
reqest, err := http.NewRequest(http.MethodPut, url, record) //增加header选项
reqest.Header.Add("Authorization", "basic "+auth(load))
reqest.Header.Add("EXPECT", "100-continue")
var u1 = uuid.Must(uuid.NewV4())
reqest.Header.Add("label", u1.String())
reqest.Header.Add("column_separator", ",") if err != nil {
panic(err)
}
//处理返回结果
response, _ := client.Do(reqest)
if response.StatusCode == 200 {
body, _ := ioutil.ReadAll(response.Body)
responseBody := ResponseBody{}
jsonStr := string(body)
err := json.Unmarshal([]byte(jsonStr), &responseBody)
if err != nil {
fmt.Println(err.Error())
}
if responseBody.Status == "Success" {
//如果有被过滤的数据,打印错误的URL
if responseBody.NumberFilteredRows > 0 {
fmt.Printf("Error Data : %s ", responseBody.ErrorURL)
} else {
fmt.Printf("Success import data : %d", responseBody.NumberLoadedRows)
}
}
fmt.Println(string(body))
} defer response.Body.Close()
} //内存流数据,通过Stream Load导入Doris表中
func batch_load_data(load StreamLoad, data string) {
client := &http.Client{}
//生成要访问的url
url := "http://10.220.146.10:8030/api/test_2/user_info/_stream_load"
//fmt.Formatter(.Format(url,load.dbName,l))
record := strings.NewReader(data)
//提交请求
reqest, err := http.NewRequest(http.MethodPut, url, record) //增加header选项
reqest.Header.Add("Authorization", "basic "+auth(load))
reqest.Header.Add("EXPECT", "100-continue")
var u1 = uuid.Must(uuid.NewV4())
reqest.Header.Add("label", u1.String())
reqest.Header.Add("column_separator", ",") if err != nil {
panic(err)
}
//处理返回结果
response, _ := client.Do(reqest)
if response.StatusCode == 200 {
body, _ := ioutil.ReadAll(response.Body)
responseBody := ResponseBody{}
jsonStr := string(body)
err := json.Unmarshal([]byte(jsonStr), &responseBody)
if err != nil {
fmt.Println(err.Error())
}
if responseBody.Status == "Success" {
//如果有被过滤的数据,打印错误的URL
if responseBody.NumberFilteredRows > 0 {
fmt.Printf("Error Data : %s ", responseBody.ErrorURL)
} else {
fmt.Printf("Success import data : %d", responseBody.NumberLoadedRows)
}
} else {
fmt.Printf("Error Message : %s \n", responseBody.Message)
fmt.Printf("Error Data : %s ", responseBody.ErrorURL)
}
//fmt.Println(jsonStr)
}
defer response.Body.Close()
} //获取BE列表
func get_doris_be_list() *list.List {
var load StreamLoad
load.userName = "root"
load.password = ""
client := &http.Client{}
//生成要访问的url
url := "http://10.220.146.10:8030/api/backends?is_alive=true"
//提交请求
reqest, err := http.NewRequest("GET", url, nil)
//增加header选项
reqest.Header.Add("Authorization", "basic "+auth(load))
if err != nil {
panic(err)
}
//处理返回结果
response, _ := client.Do(reqest)
bes := list.New()
if response.StatusCode == 200 {
body, _ := ioutil.ReadAll(response.Body)
backends := Backend{}
jsonStr := string(body)
err := json.Unmarshal([]byte(jsonStr), &backends)
if err != nil {
fmt.Println(err.Error())
}
for _, beinfo := range backends.Data.Backends {
be := beinfo.IP + ":" + strconv.Itoa(beinfo.HTTPPort)
bes.PushBack(be)
}
}
defer response.Body.Close()
return bes
} //Stream load返回消息结构体
type ResponseBody struct {
TxnID int `json:"TxnId"`
Label string `json:"Label"`
Status string `json:"Status"`
Message string `json:"Message"`
NumberTotalRows int `json:"NumberTotalRows"`
NumberLoadedRows int `json:"NumberLoadedRows"`
NumberFilteredRows int `json:"NumberFilteredRows"`
NumberUnselectedRows int `json:"NumberUnselectedRows"`
LoadBytes int `json:"LoadBytes"`
LoadTimeMs int `json:"LoadTimeMs"`
BeginTxnTimeMs int `json:"BeginTxnTimeMs"`
StreamLoadPutTimeMs int `json:"StreamLoadPutTimeMs"`
ReadDataTimeMs int `json:"ReadDataTimeMs"`
WriteDataTimeMs int `json:"WriteDataTimeMs"`
CommitAndPublishTimeMs int `json:"CommitAndPublishTimeMs"`
ErrorURL string `json:"ErrorURL"`
} //获取BE列表返回结构体
type Backend struct {
Msg string `json:"msg"`
Code int `json:"code"`
Data struct {
Backends []struct {
IP string `json:"ip"`
HTTPPort int `json:"http_port"`
IsAlive bool `json:"is_alive"`
} `json:"backends"`
} `json:"data"`
Count int `json:"count"`
} func main() {
var load StreamLoad
load.userName = "root"
load.password = ""
//auth_info := auth(load)
//fmt.Println(auth_info)
//backends := get_doris_be_list()
//for e := backends.Front(); e != nil; e = e.Next() {
// fmt.Println(e.Value)
//}
data := "10001,张***,西安,30,1,133****760,陕西省**********,2021-03-12 12:34:12"
batch_load_data(load, data)
//batch_load_file(/load, "/Users/zhangfeng/Downloads/test.csv")
}

 

使用GO语言通过Stream Load实现Doris数据导入的更多相关文章

  1. Bulk Load-HBase数据导入最佳实践

    一.概述 HBase本身提供了非常多种数据导入的方式,通常有两种经常使用方式: 1.使用HBase提供的TableOutputFormat,原理是通过一个Mapreduce作业将数据导入HBase 2 ...

  2. R语言基础入门之二:数据导入和描述统计

    by 写长城的诗 • October 30, 2011 • Comments Off This post was kindly contributed by 数据科学与R语言 - go there t ...

  3. MySQL Load Data InFile 数据导入数据库

    常用如下: Load Data InFile 'C:/Data.txt' Into Table `TableTest` Lines Terminated By '\r\n'; 这个语句,字段默认用制表 ...

  4. R语言XML格式数据导入与处理

    数据解析 XML是一种可扩展标记语言,它被设计用来传输和存储数据.XML是各种应用程序之间进行数据传输的最常用的工具.它与Access,Oracle和SQL Server等数据库不同,数据库提供了更强 ...

  5. mysql 开发进阶篇系列 50 表的数据导入(load data infile,mysqlimport )

    一.概述 上篇讲到的表的数据导出(select .. into outfile 或者mysqldump),这篇继续讲表的数据导入,导入也同样有二个方法,分别是load data infile... 和 ...

  6. Java中使用Oracle的客户端 load data和sqlldr命令执行数据导入到数据库中

    Windows环境下测试代码: import java.io.BufferedReader; import java.io.File; import java.io.FileNotFoundExcep ...

  7. go语言入门教程百度网盘 mysql图形化操作与数据导入

    mysql图形化操作与数据导入 @author:Davie 版权所有:北京千锋互联科技有限公司 数据库存储技术 数据库(Database)是按照数据结构来组织.存储和管理数据的仓库.每个数据库都有一个 ...

  8. MySQL 之 LOAD DATA INFILE 快速导入数据

    SELECT INTO OUTFILE > help select; Name: 'SELECT' Description: Syntax: SELECT [ALL | DISTINCT | D ...

  9. Mysql load data infile 命令导入含中文csv源数据文件 【错误代码 1300】

    [1]Load data infile 命令导入含中文csv源数据文件 报错:Invalid utf8 character string: '??֧' (1)问题现象 csv格式文件源数据: 导入SQ ...

随机推荐

  1. ctf之计算器

    题目信息如下: 打开环境,发现是一道简单的计算题 只能输入一位数字 F12查看源码发现作者将最大长度设置为1,我们将最大长度修改了即可 输入答案即可得到flag

  2. Windows 8下完美使用Virtual PC 2007(virtual pc 2007 64 win8 兼容性)

    Windows 8下完美使用Virtual PC 2007(virtual pc 2007 64 win8 兼容性) 一.从微软的官方网站下载Virtual PC 2007 SP1英文版,文件名为se ...

  3. Session Cookie Token Json-Web-Token

    什么是认证(Authentication) 通俗地讲就是验证当前用户的身份,证明"你是你自己"(比如:你每天上下班打卡,都需要通过指纹打卡,当你的指纹和系统里录入的指纹相匹配时,就 ...

  4. C#中的类型转换-自定义隐式转换和显式转换

    目录 前言 基础知识 示例代码 实际应用 问题 答案 报错 用户定义的转换必须是转换成封闭类型,或者从封闭类型转换 参考 其他 应用和设计 读音 参考 前言 有时我们会遇到这么一种情况:在json数据 ...

  5. 对redis数据库的初步认识

    由于之前接触的都是关系型数据库,对于非关系型数据库总是不了解,趁着外出做项目的机会,正好初步认识了redis数据库 redis分为存储分为几个存储的数据类型 string类型,hash类型,list链 ...

  6. java字节流和字符流,以及java文件操作

    A.首先说字节流:1.字节流在操作的时候不会用到缓冲区(也就是内存)2.字节流可用于任何类型的对象,包括二进制对象3.字节流处理单元为1个字节,操作字节和字节数组.InputStream是所有字节输入 ...

  7. requests库获取响应流进行转发

    遇到了一个问题,使用requests进行转发 requests响应流的时候,出现各种问题,问题的描述没有记录,不过Debug以下终于解决了问题.......下面简单的描述解决方案 response = ...

  8. 为什么要使用 rabbitmq?

    1.在分布式系统下具备异步,削峰,负载均衡等一系列高级功能; 2.拥有持久化的机制,进程消息,队列中的信息也可以保存下来. 3.实现消费者和生产者之间的解耦. 4.对于高并发场景下,利用消息队列可以使 ...

  9. 阐述final、finally、finalize的区别?

    - final:修饰符(关键字)有三种用法:如果一个类被声明为final,意味着它不能再派生出新的子类,即不能被继承,因此它和abstract是反义词.将变量声明为final,可以保证它们在使用中不被 ...

  10. 什么叫线程安全?servlet 是线程安全吗?

    线程安全是编程中的术语,指某个函数.函数库在多线程环境中被调用时,能够 正确地处理多个线程之间的共享变量,使程序功能正确完成. Servlet 不是线程安全的,servlet 是单实例多线程的,当多个 ...