测试【子牙-writing】大模型

参考：姜子牙大模型系列 | 写作模型ziya-writing开源！开箱即用，快来认领专属你的写作小助手吧

封神榜：https://github.com/IDEA-CCNL/Fengshenbang-LM

姜子牙大模型：https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1.1

子牙-writing大模型：

https://huggingface.co/IDEA-CCNL/Ziya-Writing-LLaMa-13B-v1 【老版】

https://huggingface.co/IDEA-CCNL/Ziya-Writing-13B-v2	【最新】

安装环境：一张4090（24G），需量化

引言

ziya-writing模型基于底座模型ziya-llama-13B-pretrain-v1，使用了高质量的中文写作指令数据进行SFT，同时人工标注了大量排序数据进行RLHF。经过两个阶段的精心训练，使得ziya-writing具备了优秀的写作能力。

安装

下载模型

git lfs install

git clone https://huggingface.co/IDEA-CCNL/Ziya-Writing-13B-v2.git

安装环境

pip install -r requirement.txt

# requirement.txt

transformers>=4.28.1

bitsandbytes>=0.39.0

torch>=1.12.1

numpy>=1.24.3

llama-cpp-python>=0.1.62

测试

使用量化8bit

简单

from transformers import AutoTokenizer

from transformers import LlamaForCausalLM

import torch

# device = torch.device("cuda")

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

path = '/home/trimps/llm_model/Ziya-Writing-13B-v2'

query="帮我写一份去西安的旅游计划"

model = LlamaForCausalLM.from_pretrained(path, load_in_8bit=True,torch_dtype=torch.float16)

# 量化

# model = model.quantize(8).cuda()  

tokenizer = AutoTokenizer.from_pretrained(path, use_fast=False)

inputs = '<human>:' + query.strip() + '\n<bot>:'

input_ids = tokenizer(inputs, return_tensors="pt").input_ids.to(device)

generate_ids = model.generate(

            input_ids,

            max_new_tokens=2048,

            do_sample = True,

            top_p = 0.85,

            temperature = 0.85,

            repetition_penalty=1.,

            eos_token_id=2,

            bos_token_id=1,

            pad_token_id=0)

output = tokenizer.batch_decode(generate_ids)[0]

print(output)

Web

import json,time

import torch

import streamlit as st

from transformers import AutoModelForCausalLM, AutoTokenizer

from transformers.generation.utils import GenerationConfig

from transformers import LlamaForCausalLM

st.set_page_config(page_title="Ziya-Writing")

st.title("Ziya-Writing")

path = '/home/trimps/llm_model/Ziya-Writing-13B-v2'

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

@st.cache_resource

def init_model():

    model = LlamaForCausalLM.from_pretrained(path, load_in_8bit=True,torch_dtype=torch.float16)

    tokenizer = AutoTokenizer.from_pretrained(path, use_fast=False)

    return model, tokenizer

# 执行模型

def exec_model(model, tokenizer,prompt):

    inputs = '<human>:' + prompt.strip() + '\n<bot> '

    input_ids = tokenizer(inputs, return_tensors="pt").input_ids.to(device)

    generate_ids = model.generate(

                input_ids,

                max_new_tokens=1024,

                do_sample = True,

                top_p = 0.85,

                temperature = 0.85,

                repetition_penalty=1.,

                eos_token_id=2,

                bos_token_id=1,

                pad_token_id=0)

    # print(tokenizer.batch_decode(generate_ids)[0].split('<bot>')[1].strip('</s>'))

    output = tokenizer.batch_decode(generate_ids)[0].split('<bot>')[1].strip('</s>')

    return output

def main():

    model, tokenizer = init_model()

    with st.chat_message("assistant", avatar=''):

        st.markdown("您好，我是Ziya-Writing大模型，很高兴为您服务")

    if prompt := st.chat_input("Shift + Enter 换行, Enter 发送"):

        with st.chat_message("user", avatar='‍'):

            st.markdown(prompt)

        print(f"[user] {prompt}", flush=True)

        start = time.time()

        with st.chat_message("assistant", avatar=''):

            placeholder = st.empty()

            response= exec_model(model, tokenizer,prompt)

            if torch.backends.mps.is_available():

                torch.mps.empty_cache()

            placeholder.markdown(response)

        end = time.time()

        st.write("时间：{}s".format(end-start))

        print(response)

if __name__ == "__main__":

    main()

PS：

感觉写作能力和通用的模型差不多，比如同体量的（百川2-13B）
一张4090跑起来声音快要炸了。

测试【子牙-writing】大模型的更多相关文章

【测试分析】HTSM模型
◆版权声明:本文出自胖喵~的博客,转载必须注明出处. 转载请注明出处:http://www.cnblogs.com/by-dream/p/5508428.html 概述 HTSM全称Heuristic ...
让Quality Center走下神坛--测试管理工具大PK（转）
让Quality Center走下神坛--测试管理工具QC/ALM 和 RQM.Jira.TP.SCTM大PK 在写完了<让QTP走下神坛>之后,现在来谈谈测试管理工具,献给所有正在或打算 ...
DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...
无插件的大模型浏览器Autodesk Viewer开发培训-武汉-2014年8月28日 9:00 – 12:00
武汉附近的同学们有福了,这是全球第一次关于Autodesk viewer的教室培训. :) 你可能已经在各种场合听过或看过Autodesk最新推出的大模型浏览器,这是无需插件的浏览器模型,支持几十种数 ...
Android渗透测试Android渗透测试入门教程大学霸
Android渗透测试Android渗透测试入门教程大学霸第1章 Android渗透测试 Android是一种基于Linux的自由及开放源代码的操作系统,主要用于移动设备,如智能手机.平板等.目前 ...
PowerDesigner 学习：十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...
测试TextKit渲染大文本的效率
测试TextKit渲染大文本的效率 TextKit可以用来做精美的电子书,而电子书通常都是txt格式的,那么渲染txt格式的文本的效率如何呢? 以下来进行测试. #import "RootV ...
PowerDesigner 15学习笔记：十大模型及五大分类
个人认为PowerDesigner 最大的特点和优势就是1)提供了一整套的解决方案,面向了不同的人员提供不同的模型工具,比如有针对企业架构师的模型,有针对需求分析师的模型,有针对系统分析师和软件架构师 ...
华为高级研究员谢凌曦：下一代AI将走向何方？盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
文心大模型api使用
文心大模型api使用首先,我们要获取硅谷社区的连个key 复制两个api备用获取Access Token 获取access_token示例代码之后就会输出作文创作作文创作:作文创作接口基于文 ...

随机推荐

Centos模板机配置
icentos7标准化配置挂载光盘 mkdir /media/cdrom mount /dev/sr0 /media/cdrom vi /etc/yum.repo.d/ 配置本地yum源 vim l ...
大便系统怎样安装RPM包
alien包转换工具如果我们有很喜欢的RPM包,而又没有deb版本. 怎么办~? 可以同过alien来转换或者直接安装,这个小家伙可是个很方便的东西! 基本命令如下: 首先通过apt-get ins ...
孤立森林（IForest）代码实现及与PyOD对比
孤立森林(Isolation Forest)是经典的异常检测算法(论文网址).本文用python对其进行实现,以及与常用的异常检测包PyOD进行效果对比. 简单来说,孤立森林(IForest)中包含若 ...
Integrating JDBC with Hibernate
One of the powerful things about Hibernate is that you do not typically need to manually write SQL: ...
ASP.NET Core 9.0 中新增的MapStaticAssets() 中间件
前言在Core 9.0版本中新增的内容不算多,除了内置OpenAPI 外应该就属MapStaticAssets中间件最有价值了,最初MapStaticAssets主要是为了解决Blazor静态资源 ...
manim边做边学--曲面
Surface类是Manim中专为创建和操控复杂的三维表面而打造的. 在实际应用中,无论是创建数学教学中的几何模型,还是模拟物理现象中的曲面变化,甚至是构建复杂的动画场景中的三维元素,Surface类 ...
java 死锁问题排查
排查过程 1.识别死锁现象通常,死锁会表现为应用程序挂起,不响应用户请求或 cpu 使用率下降. 2.收集线程转储当应用出现不响应时,可以使用以下方法收集线程转储: jstack -l 进程ID ...
E. Photoshoot for Gorillas
题意给定一个整数 \(T\),代表共有\(T\)组测试用例,对于每组测试用例: 给定四个整数 \(n,m,k和w(1 \leq n,m \leq 2 * 10^5, 1 \leq w \leq n ...
influxdb group by(1d) 查询注意事项
转载请注明出处: 在 InfluxDB 中,默认的时区是 UTC(协调世界时).所有的时间戳在数据写入时默认视为 UTC.这意味着如果没有在插入数据时指定其他时区,InfluxDB 会将所有时间数据处 ...
angr-ctf
angr 的项目地址 https://github.com/jakespringer/angr_ctf angr实战 00 拖到IDA 就是输入正确的指令才能通关这次试一下用angr来解题 goah ...

测试 【子牙-writing】 大模型

引言

安装

测试

简单

Web

测试 【子牙-writing】 大模型的更多相关文章

随机推荐

热门专题

测试【子牙-writing】大模型

测试【子牙-writing】大模型的更多相关文章