使用Ollama

应用

查看运行中的模型

ollama ps

停止模型

方法1: kill -9 端口号

方法2: 关闭ollama的窗口

API调用模型

启动模型
单次调用模型

from ollama import Client

import time

def llm(model, message):

  client = Client(host='http://localhost:11434')

  response = client.chat(model=model, messages=[

    {

      'role': 'user',

      'content': message,

    },

  ])

  return response['message']['content']

start = time.time()

res = llm('qwen2', '您好，请介绍一下自己')

end = time.time()

print(res)

print(f'time: {end-start} s')

多次调用模型

import json

import requests

model = "qwen2"

def chat(messages):

    r = requests.post(

        "http://0.0.0.0:11434/api/chat",

        json={"model": model, "messages": messages, "stream": True},

    )

    r.raise_for_status()

    output = ""

    for line in r.iter_lines():

        body = json.loads(line)

        if "error" in body:

            raise Exception(body["error"])

        if body.get("done") is False:

            message = body.get("message", "")

            content = message.get("content", "")

            output += content

            print(content, end="", flush=True)

        if body.get("done", False):

            message["content"] = output

            return message

def main():

    messages = []

    while True:

        user_input = input("Enter a prompt: ")

        if not user_input:

            exit()

        print()

        messages.append({"role": "user", "content": user_input})

        message = chat(messages)

        messages.append(message)

        print("\n\n")

if __name__ == "__main__":

    main()

对接langchain

安装langchain

pip install langchain

pip install -U langchain-community

langchain启动模型

from langchain.llms import Ollama

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

print(ollama("你好，请介绍自己"))

文档问答【RAG】

加载文档

LangChain 的 WebBaseLoader 来从任何网页加载文本。

from langchain.document_loaders import WebBaseLoader

loader = WebBaseLoader("https://www.gutenberg.org/files/1727/1727-h/1727-h.htm")

data = loader.load()

选择向量库和嵌入模型

向量库：pip install chromadb

嵌入模型：ollama run nomic-embed-text

from langchain.document_loaders import WebBaseLoader

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.embeddings import OllamaEmbeddings

from langchain.vectorstores import Chroma

from langchain.chains import RetrievalQA

from langchain.llms import Ollama

# 链接模型

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

# 加载文档

loader = WebBaseLoader("https://www.ruanyifeng.com/blog/2024/07/weekly-issue-308.html")

data = loader.load()

# print(data)

# 文档分割

text_splitter=RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)

all_splits = text_splitter.split_documents(data)

# 文档存到向量库

oembed = OllamaEmbeddings(base_url="http://localhost:11434", model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=oembed)

通过相似度搜索匹配

from langchain.document_loaders import WebBaseLoader

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.embeddings import OllamaEmbeddings

from langchain.vectorstores import Chroma

from langchain.chains import RetrievalQA

from langchain.llms import Ollama

# 链接模型

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

# 加载文档

loader = WebBaseLoader("https://www.ruanyifeng.com/blog/2024/07/weekly-issue-308.html")

data = loader.load()

# print(data)

# 文档分割

text_splitter=RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)

all_splits = text_splitter.split_documents(data)

# 文档存到向量库

oembed = OllamaEmbeddings(base_url="http://localhost:11434", model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=oembed)

# 相似度匹配

question="请问找不到工作，还能读博么？"

docs = vectorstore.similarity_search(question)

print(f'匹配长度：{len(docs)}')

print(f'匹配内容：{docs}')

将问题和文档的相关部分拼接在一起，叫做链，发送给模型

from langchain.document_loaders import WebBaseLoader

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.embeddings import OllamaEmbeddings

from langchain.vectorstores import Chroma

from langchain.chains import RetrievalQA

from langchain.llms import Ollama

# 链接模型

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

# 加载文档

loader = WebBaseLoader("https://www.ruanyifeng.com/blog/2024/07/weekly-issue-308.html")

data = loader.load()

# print(data)

# 文档分割

text_splitter=RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)

all_splits = text_splitter.split_documents(data)

# 文档存到向量库

oembed = OllamaEmbeddings(base_url="http://localhost:11434", model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=oembed)

# 相似度匹配

question="请问找不到工作，还能读博么？"

docs = vectorstore.similarity_search(question)

print(f'匹配长度：{len(docs)}')

print(f'匹配内容：{docs}')

# 将搜索结果与问题拼接

qachain=RetrievalQA.from_chain_type(ollama, retriever=vectorstore.as_retriever())

res = qachain.invoke({"query": question})

print(res['result'])

随机推荐

C# 串口读取并转换字符串
public string ReadString() { ASCIIEncoding ascii = new ASCIIEncoding(); byte[] readBuffer = new byte ...
Air780E如何发送SMS？一文详解！
今天一起来学习使用合宙低功耗4G模组Air780E发送SMS短消息: 一.SMS简介 SMS(短消息服务,ShortMessageService)功能主要用于在蜂窝网络中传输短消息. 在4G网络中 ...
nvidia公司的机器人仿真环境的历史发展介绍（Isaac-Gym、Isaac-Sim）
相关: NVIDIA机器人仿真项目 -- Isaac Gym - Preview Release 本文说下NVIDIA公司的机器人仿真项目的一些历史发展. NVIDIA公司的产品最初只有显卡,但是卖着 ...
Mysql 通用分页
第一步,建立数据库: create table student( id int primary key auto_increment, code varchar(50), name varchar(5 ...
Linux之远程挂载SSHFS
SSHFS(Secure SHell FileSystem)是一个客户端,可以让我们通过 SSH 文件传输协议(SFTP)挂载远程的文件系统并且在本地机器上和远程的目录和文件进行交互. SFTP 是一 ...
使用阿里的ARTHAS跟踪方法耗时
使用命令跟踪一个方法的耗时在arthas 命令行下输入命令 trace 类全路径监控的方法 trace com.redxun.bpm.core.service.BpmInstServiceImpl ...
oracle中id自增长（转）
首先,你要有一张表! CREATE TABLE example( ID Number(4) NOT NULL PRIMARY KEY, NAME VARCHAR(25), PHONE VARCHAR( ...
树莓派4B 多屏 QT程序窗口全屏 QScreen 只能获取1个屏幕
直接运行程序时,窗口全屏, 并且QScreen 只能获取1个屏幕,这是由于QT默认使用了EGLFS.(坑了一下午) 所以必须采用命令方式打开程序. ./程序名称 -platform xcb
openEuler欧拉安装Gitlab
1. 安装GitLab wget https://packages.gitlab.com/install/repositories/gitlab/gitlab-ce/script.rpm.sh sud ...
Shiro简单入门+个人理解
身为一个刚刚进入开发行业的学生,进入公司就开始了Shiro框架的应用,特此在这里写下收获. Shiro是apache旗下一个开源安全框架,它将软件系统的安全认证相关的功能抽取出来,实现用户身份认证,权 ...

使用Ollama

推荐

应用

随机推荐

热门专题