BERT 服务化 bert-as-service

bert-as-service 用 BERT 作为句子编码器, 并通过 ZeroMQ 服务托管, 只需两行代码就可以将句子映射成固定长度的向量表示;

准备

windows10 + python3.5 + tensorflow1.2.1

安装流程

安装 tensorflow, 参考
安装 bert-as-service

bert-as-service, 依赖于 python≥3.5 AND tensorflow≥1.10;

pip install bert-serving-server

pip instlal bert-serving-client

下载中文 bert 预训练的模型

BERT-Base, Uncased	12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Large, Uncased	24-layer, 1024-hidden, 16-heads, 340M parameters
BERT-Base, Cased	12-layer, 768-hidden, 12-heads , 110M parameters
BERT-Large, Cased	24-layer, 1024-hidden, 16-heads, 340M parameters
BERT-Base, Multilingual Cased (New)	104 languages, 12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Base, Multilingual Cased (Old)	102 languages, 12-layer, 768-hidden, 12-heads, 110M parameters
BERT-Base, Chinese	Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameters

启动 bert-as-serving 服务

bert-serving-start -model_dir /tmp/english_L-12_H-768_A-12/ -num_worker=2  //模型路径自改

usage: xxxx\Anaconda3\envs\py35\Scripts\bert-serving-start -model_dir D:\env\bert\chinese_L-12_H-768_A-12 -num_worker=2

                 ARG   VALUE

__________________________________________________

           ckpt_name = bert_model.ckpt

         config_name = bert_config.json

                cors = *

                 cpu = False

          device_map = []

       do_lower_case = True

  fixed_embed_length = False

                fp16 = False

 gpu_memory_fraction = 0.5

       graph_tmp_dir = None

    http_max_connect = 10

           http_port = None

        mask_cls_sep = False

      max_batch_size = 256

         max_seq_len = 25

           model_dir = D:\env\bert\chinese_L-12_H-768_A-12

no_position_embeddings = False

    no_special_token = False

          num_worker = 2

       pooling_layer = [-2]

    pooling_strategy = REDUCE_MEAN

                port = 5555

            port_out = 5556

       prefetch_size = 10

 priority_batch_size = 16

show_tokens_to_client = False

     tuned_model_dir = None

             verbose = False

                 xla = False

I:[35mVENTILATOR[0m:freeze, optimize and export graph, could take a while...

I:[36mGRAPHOPT[0m:model config: D:\env\bert\chinese_L-12_H-768_A-12\bert_config.json

I:[36mGRAPHOPT[0m:checkpoint: D:\env\bert\chinese_L-12_H-768_A-12\bert_model.ckpt

I:[36mGRAPHOPT[0m:build graph...

I:[36mGRAPHOPT[0m:load parameters from checkpoint...

I:[36mGRAPHOPT[0m:optimize...

I:[36mGRAPHOPT[0m:freeze...

I:[36mGRAPHOPT[0m:write graph to a tmp file: C:\Users\Memento\AppData\Local\Temp\tmpo07002um

I:[35mVENTILATOR[0m:bind all sockets

I:[35mVENTILATOR[0m:open 8 ventilator-worker sockets

I:[35mVENTILATOR[0m:start the sink

I:[32mSINK[0m:ready

I:[35mVENTILATOR[0m:get devices

W:[35mVENTILATOR[0m:no GPU available, fall back to CPU

I:[35mVENTILATOR[0m:device map:

                worker  0 -> cpu

                worker  1 -> cpu

I:[33mWORKER-0[0m:use device cpu, load graph from C:\Users\Memento\AppData\Local\Temp\tmpo07002um

I:[33mWORKER-1[0m:use device cpu, load graph from C:\Users\Memento\AppData\Local\Temp\tmpo07002um

I:[33mWORKER-0[0m:ready and listening!

I:[33mWORKER-1[0m:ready and listening!

I:[35mVENTILATOR[0m:all set, ready to serve request!

用 python 模拟调用 bert-as-service 服务

bc = BertClient(ip="localhost", check_version=False, check_length=False)

vec = bc.encode(['你好', '你好呀', '我很好'])

print(vec)

输出结果:

[[ 0.2894022  -0.13572647  0.07591158 ... -0.14091237  0.54630077

  -0.30118054]

 [ 0.4535432  -0.03180456  0.3459639  ... -0.3121457   0.42606848

  -0.50814617]

 [ 0.6313594  -0.22302179  0.16799903 ... -0.1614125   0.23098437

  -0.5840646 ]]

亮点

BERT 服务化 bert-as-service的更多相关文章
1. 干货 | 蚂蚁金服是如何实现经典服务化架构往 Service Mesh 方向的演进的？
  干货 | 蚂蚁金服是如何实现经典服务化架构往 Service Mesh 方向的演进的? https://www.sohu.com/a/235575064_99940985 干货 | 蚂蚁金服是如何实现 ...
2. 【译】BERT表示的可解释性分析
  目录从词袋模型到BERT 分析BERT表示不考虑上下文的方法考虑语境的方法结论本文翻译自Are BERT Features InterBERTible? 从词袋模型到BERT Mikol ...
3. 采用Google预训bert实现中文NER任务
  本博文介绍用Google pre-training的bert(Bidirectional Encoder Representational from Transformers)做中文NER(Name ...
4. 5. BERT算法原理解析
  1. 语言模型 2. Attention Is All You Need(Transformer)算法原理解析 3. ELMo算法原理解析 4. OpenAI GPT算法原理解析 5. BERT算法原 ...
5. 用深度学习做命名实体识别(六)-BERT介绍
  什么是BERT? BERT,全称是Bidirectional Encoder Representations from Transformers.可以理解为一种以Transformers为主要框架的双 ...
6. 图示详解BERT模型的输入与输出
  一.BERT整体结构 BERT主要用了Transformer的Encoder,而没有用其Decoder,我想是因为BERT是一个预训练模型,只要学到其中语义关系即可,不需要去解码完成具体的任务.整体架 ...
7. Google BERT摘要
  1.BERT模型 BERT的全称是Bidirectional Encoder Representation from Transformers,即双向Transformer的Encoder,因为dec ...
8. bert 硬件要求
  https://github.com/google-research/bert BERT ***** New May 31st, 2019: Whole Word Masking Models *** ...
9. pytorch bert 源码解读
  https://daiwk.github.io/posts/nlp-bert.html 目录概述 BERT 模型架构 Input Representation Pre-training Tasks ...
随机推荐
1. 【bzoj 2597】[Wc2007]剪刀石头布（图论--网络流最小费用最大流）
  题目:在一些一对一游戏的比赛(如下棋.乒乓球和羽毛球的单打)中,我们经常会遇到A胜过B,B胜过C而C又胜过A的有趣情况,不妨形象的称之为剪刀石头布情况.有的时候,无聊的人们会津津乐道于统计有多少这样的 ...
2. python爬取网易翻译和MD5加密
  一.程序需要知识 1.python中随机数的生成 # 生成 0 ~ 9 之间的随机数 # 导入 random(随机数) 模块 import random print(random.randint(0, ...
3. HDU 3537 Daizhenyang's Coin 翻硬币博弈
  题意: 给你n个硬币,你可以从中拿出来1.2.3个硬币,它们不一定要连续,你只需要保证拿出来的硬币中那个下标最大的硬币一定要是正面朝上,最后谁不能操作,谁就输了题解: 翻硬币游戏结论: 局面的SG ...
4. 吉哥系列故事——完美队形II（马拉车算法）
  吉哥又想出了一个新的完美队形游戏! 假设有n个人按顺序站在他的面前,他们的身高分别是h[1], h[2] ... h[n],吉哥希望从中挑出一些人,让这些人形成一个新的队形,新的队形若满足以下三点要求 ...
5. Link/Cut Tree CodeForces - 614A 暴力+爆 long long 处理
  题意: 给你一个区间[l,r],让你从小到大输出k^x,设y=k^x,要保证y在区间[l,r]中题解: 就算k是最小的2也不需要枚举多少次就到long long的极限了,所以暴力没商量,根本不会TL ...
6. 【非原创】LightOJ - 1284 Lights inside 3D Grid【概率期望】
  学习博客: 戳这里戳这里戳这里戳这里题意: 在一个三维的空间,每个点都有一盏灯,开始全是关的, 现在每次随机选两个点,把两个点之间的全部点,开关都按一遍:问k次过后开着的灯的期望数量: 题解: ...
7. Kattis amazingadventures Amazing Adventures（费用流路径）题解
  题意: 在一个\(100*100\)的方格中,要求从\(b\)走到\(g\),途中经过\(c\)但不经过\(u\),并且不能走已经做过的路.如果可以,就求出路径. 思路: 拆点建费用流,看能不能从\( ...
8. 多线程（四） AQS底层原理分析
  J.U.C 简介 Java.util.concurrent 是在并发编程中比较常用的工具类,里面包含很多用来在并发场景中使用的组件.比如线程池.阻塞队列.计时器.同步器.并发集合等等.并发包的作者 ...
9. HDU 4649 Professor Tian（概率DP）题解
  题意:一个表达式,n + 1个数,n个操作,每个操作Oi和数Ai+1对应,给出每个操作Oi和数Ai+1消失的概率,给出最后表达式值得期望.只有| , ^,&三个位操作思路:显然位操作只对当前 ...
10. R语言学习2：绘图
  本系列是一个新的系列,在此系列中,我将和大家共同学习R语言.由于我对R语言的了解也甚少,所以本系列更多以一个学习者的视角来完成. 参考教材:<R语言实战>第二版(Robert I.Kaba ...

BERT 服务化 bert-as-service

准备

安装流程

亮点

BERT 服务化 bert-as-service的更多相关文章

随机推荐

热门专题