使用Ollama

应用

查看运行中的模型

ollama ps

停止模型

方法1: kill -9 端口号

方法2: 关闭ollama的窗口

API调用模型

启动模型
单次调用模型

from ollama import Client

import time

def llm(model, message):

  client = Client(host='http://localhost:11434')

  response = client.chat(model=model, messages=[

    {

      'role': 'user',

      'content': message,

    },

  ])

  return response['message']['content']

start = time.time()

res = llm('qwen2', '您好，请介绍一下自己')

end = time.time()

print(res)

print(f'time: {end-start} s')

多次调用模型

import json

import requests

model = "qwen2"

def chat(messages):

    r = requests.post(

        "http://0.0.0.0:11434/api/chat",

        json={"model": model, "messages": messages, "stream": True},

    )

    r.raise_for_status()

    output = ""

    for line in r.iter_lines():

        body = json.loads(line)

        if "error" in body:

            raise Exception(body["error"])

        if body.get("done") is False:

            message = body.get("message", "")

            content = message.get("content", "")

            output += content

            print(content, end="", flush=True)

        if body.get("done", False):

            message["content"] = output

            return message

def main():

    messages = []

    while True:

        user_input = input("Enter a prompt: ")

        if not user_input:

            exit()

        print()

        messages.append({"role": "user", "content": user_input})

        message = chat(messages)

        messages.append(message)

        print("\n\n")

if __name__ == "__main__":

    main()

对接langchain

安装langchain

pip install langchain

pip install -U langchain-community

langchain启动模型

from langchain.llms import Ollama

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

print(ollama("你好，请介绍自己"))

文档问答【RAG】

加载文档

LangChain 的 WebBaseLoader 来从任何网页加载文本。

from langchain.document_loaders import WebBaseLoader

loader = WebBaseLoader("https://www.gutenberg.org/files/1727/1727-h/1727-h.htm")

data = loader.load()

选择向量库和嵌入模型

向量库：pip install chromadb

嵌入模型：ollama run nomic-embed-text

from langchain.document_loaders import WebBaseLoader

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.embeddings import OllamaEmbeddings

from langchain.vectorstores import Chroma

from langchain.chains import RetrievalQA

from langchain.llms import Ollama

# 链接模型

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

# 加载文档

loader = WebBaseLoader("https://www.ruanyifeng.com/blog/2024/07/weekly-issue-308.html")

data = loader.load()

# print(data)

# 文档分割

text_splitter=RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)

all_splits = text_splitter.split_documents(data)

# 文档存到向量库

oembed = OllamaEmbeddings(base_url="http://localhost:11434", model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=oembed)

通过相似度搜索匹配

from langchain.document_loaders import WebBaseLoader

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.embeddings import OllamaEmbeddings

from langchain.vectorstores import Chroma

from langchain.chains import RetrievalQA

from langchain.llms import Ollama

# 链接模型

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

# 加载文档

loader = WebBaseLoader("https://www.ruanyifeng.com/blog/2024/07/weekly-issue-308.html")

data = loader.load()

# print(data)

# 文档分割

text_splitter=RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)

all_splits = text_splitter.split_documents(data)

# 文档存到向量库

oembed = OllamaEmbeddings(base_url="http://localhost:11434", model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=oembed)

# 相似度匹配

question="请问找不到工作，还能读博么？"

docs = vectorstore.similarity_search(question)

print(f'匹配长度：{len(docs)}')

print(f'匹配内容：{docs}')

将问题和文档的相关部分拼接在一起，叫做链，发送给模型

from langchain.document_loaders import WebBaseLoader

from langchain.text_splitter import RecursiveCharacterTextSplitter

from langchain.embeddings import OllamaEmbeddings

from langchain.vectorstores import Chroma

from langchain.chains import RetrievalQA

from langchain.llms import Ollama

# 链接模型

ollama = Ollama(base_url='http://localhost:11434',model="qwen2")

# 加载文档

loader = WebBaseLoader("https://www.ruanyifeng.com/blog/2024/07/weekly-issue-308.html")

data = loader.load()

# print(data)

# 文档分割

text_splitter=RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)

all_splits = text_splitter.split_documents(data)

# 文档存到向量库

oembed = OllamaEmbeddings(base_url="http://localhost:11434", model="nomic-embed-text")

vectorstore = Chroma.from_documents(documents=all_splits, embedding=oembed)

# 相似度匹配

question="请问找不到工作，还能读博么？"

docs = vectorstore.similarity_search(question)

print(f'匹配长度：{len(docs)}')

print(f'匹配内容：{docs}')

# 将搜索结果与问题拼接

qachain=RetrievalQA.from_chain_type(ollama, retriever=vectorstore.as_retriever())

res = qachain.invoke({"query": question})

print(res['result'])

随机推荐

为什么通常在发送数据埋点请求的时候要用GIF
为什么通常在发送数据埋点请求的时候使用的是 1x1 像素的透明 gif 图片? 能够完成整个 HTTP 请求+响应(尽管不需要响应内容) 触发 GET 请求之后不需要获取和处理数据.服务器也不需要发送 ...
Model-Agnostic Meta-Learning (MAML) 理解
模型不可知元学习(Model-Agnostic Meta-Learning, MAML)的目标是使模型每次的梯度更新更有效.提升模型的学习效率.泛化能力等,它可以被看做一种对模型进行预训练的方法,适用 ...
vue中去掉地址栏中的#
mode设置成history就可以了
Yii2 中配置方法汇总
1.默认框架接收的是x-www-format-unencode格式的数据,如果想要接收text/json格式的数据,会为空,这个时候需要在配置文件中添加对应的配置项 config > main. ...
Graylog之基本使用
文档:https://docs.graylog.org/en/3.0/ Graylog Sidecar是一个轻量级配置管理系统,适用于不同的日志收集器,也称为后端.Graylog节点充当包含日志收集器 ...
Mybatis【9】-- Mybatis占位符#{}和拼接符${}有什么区别？
代码直接放在Github仓库[https://github.com/Damaer/Mybatis-Learning ],可直接运行,就不占篇幅了. 目录 1.#{}占位符 2.${}拼接符 3.#{} ...
Input报错“Form elements must have labels: Element has no title attribute Element has no placeholde”
喵~ 项目开发难免会遇到些不解的问题,以下总结的是简化版,重在复现问题,解决问题. 写表单时,如果只是单独写了input元素,发现在后台管理会飘红.感觉很奇怪,明明没有写错语法,为什么会飘红呢? 1. ...
oracle客户端安装先决条件检查出现PRVF-7531错误
场景:在局域网内,远程一台客户机进行客户端安装度娘后,说一般情况下,由于操作系统未开启默认共享,导致Oracle无法检查环境的可用性. 查看server服务正常开启. 通过net share将c进行 ...
uniapp 坑 - sslVerify不支撑离线打包
uniapp 打包为Android的apk时,由于适用https和自签证书,离线打包不支撑sslVerify,导致出现Trust anchor for certification path not f ...
acode连接termux
在acode中安装AcodeX - Terminal插件在termux中运行 curl -sL https://raw.githubusercontent.com/bajrangCoder/acod ...

使用Ollama

推荐

应用

随机推荐

热门专题