transformer模型转torchscript格式

from transformers import BertModel, BertTokenizer, BertConfig

import torch

enc = BertTokenizer.from_pretrained("bert-base-uncased")

# 输入文本tokenize

text = "[CLS] Who was Jim Henson ? [SEP] Jim Henson was a puppeteer [SEP]"

tokenized_text = enc.tokenize(text)

# 将一个token置为mask

masked_index = 8

tokenized_text[masked_index] = '[MASK]'

indexed_tokens = enc.convert_tokens_to_ids(tokenized_text)

segments_ids = [0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1]

# 创建虚拟输入

tokens_tensor = torch.tensor([indexed_tokens])

segments_tensors = torch.tensor([segments_ids])

dummy_input = [tokens_tensor, segments_tensors]

# 初始化模型时将torchscript参数置为True

config = BertConfig(vocab_size_or_config_json_file=32000, hidden_size=768,

    num_hidden_layers=12, num_attention_heads=12, intermediate_size=3072, torchscript=True)

# 初始化模型

model = BertModel(config)

# 模型置为eval模式

model.eval()

# 也可以从pretrained初始化模型

model = BertModel.from_pretrained("bert-base-uncased", torchscript=True)

# 创建trace

traced_model = torch.jit.trace(model, [tokens_tensor, segments_tensors])

torch.jit.save(traced_model, "traced_bert.pt")

# 加载模型

loaded_model = torch.jit.load("traced_model.pt")

loaded_model.eval()

all_encoder_layers, pooled_output = loaded_model(dummy_input)

# 使用traced model进行推理

traced_model(tokens_tensor, segments_tensors)

transformer模型转torchscript格式的更多相关文章

文本分类实战（八）—— Transformer模型
1 大纲概述文本分类这个系列将会有十篇左右,包括基于word2vec预训练的文本分类,与及基于最新的预训练模型(ELMo,BERT等)的文本分类.总共有以下系列: word2vec预训练词向量 te ...
详解Transformer模型（Atention is all you need）
1 概述在介绍Transformer模型之前,先来回顾Encoder-Decoder中的Attention.其实质上就是Encoder中隐层输出的加权和,公式如下: 将Attention机制从Enc ...
transformer模型解读
最近在关注谷歌发布关于BERT模型,它是以Transformer的双向编码器表示.顺便回顾了<Attention is all you need>这篇文章主要讲解Transformer编码 ...
transformer模型简介
Transformer模型由<Attention is All You Need>提出,有一个完整的Encoder-Decoder框架,其主要由attention(注意力)机制构成.论文地 ...
Transformer模型---decoder
一.结构 1.编码器 Transformer模型---encoder - nxf_rabbit75 - 博客园 2.解码器 (1)第一个子层也是一个多头自注意力multi-head self-atte ...
Transformer模型---encoder
一.简介论文链接:<Attention is all you need> 由google团队在2017年发表于NIPS,Transformer 是一种新的.基于 attention 机制 ...
Transformer模型总结
Transformer改进了RNN最被人诟病的训练慢的缺点,利用self-attention机制实现快速并行. 它是由编码组件.解码组件和它们之间的连接组成. 编码组件部分由一堆编码器(6个 enco ...
NLP与深度学习（四）Transformer模型
1. Transformer模型在Attention机制被提出后的第3年,2017年又有一篇影响力巨大的论文由Google提出,它就是著名的Attention Is All You Need[1]. ...
Transformer模型详解
2013年----word Embedding 2017年----Transformer 2018年----ELMo.Transformer-decoder.GPT-1.BERT 2019年----T ...

随机推荐

一款适用于windows10的反间谍工具
Free antispy tool for Windows 10 前言看标题的话,可能觉得"我要这款工具能干啥?",我刚开始也有这种疑惑,但后来我对于这款软件仔细想了想,这款还是 ...
自导自演的面试现场之--你竟然不了解MySQL的组提交？
Hi,大家好!我是白日梦!本文是MySQL专题的第 26 篇. 下文还是白日梦以自导自演的方式,围绕"组提交"展开本话题.看看你能抗到第几问吧换一种写作风格,自导自演面试现场!感 ...
5行代码！完成bat病毒制作！！！
这个病毒的功能是删除当前目录下.cpp类型的代码. copy %0 "%userprofile%\AppData\Roaming\Microsoft\Windows\Start Menu\P ...
pip软件包管理工具介绍及基本使用
pip软件包管理工具介绍及基本使用一分耕耘,一分收获,要收获得好,必须耕耘得好.-- 徐特立一.pip软件包管理工具介绍: 定义:pip是Python包管理工具作用:对Python包的查找.下载 ...
对用pyinstaller打包的exe程序进行反编译，获得源码
参考文章: 1.https://www.cnblogs.com/DirWang/p/12018949.html#PyInstallerExtractor 2.https://msd.misuland. ...
1、MyBatis教程之环境准备和简介
1.环境准备 jdk 8 + MySQL 5.7.19 maven-3.6.1 IDEA 学习前需要掌握: JDBC MySQL Java 基础 Maven Junit Idea快捷键一键格式化代碼 ...
（三）SpringBoot启动过程的分析-创建应用程序上下文
-- 以下内容均基于2.1.8.RELEASE版本紧接着上一篇(二)SpringBoot启动过程的分析-环境信息准备,本文将分析环境准备完毕之后的下一步操作:ApplicationContext的创 ...
javascript是一种什么样的语言
javascript是一种动态类型.弱类型.基于原型的语言,内置支持类型.它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在HTML网页上使用,用来给HTM ...
ES 分页方案
ES 中,存在三种常见的分页方案: FROM, SIZE Search-After Scroll 下面将依次比较三种方案之间的 trede-off,并给出相应建议的应用场景. 常见分页,FROM, S ...
[GDKOI2021] 提高组 Day 2 总结
[ G D K O I 2021 ] 提高组 D a y 2 总结不明的感觉今天的题比昨天的简单些,感觉今天爆炸的可能性很低. 嗯,于是乎,就很自信地打完了比赛.然后下午 ...

transformer模型转torchscript格式

transformer模型转torchscript格式的更多相关文章

随机推荐

热门专题