1、概述

  Ollama 是一款开源跨平台大模型工具,主要用于在本地便捷部署和运行大型语言模型(LLM),核心目标是降低用户使用大模型的门槛,同时保障数据隐私。核心功能与特点如下:

(1)本地部署,隐私保护
  1. 支持在 Windows、MacOS、Linux 等系统本地运行模型,无需依赖云端,数据交互全程在本地完成,避免隐私泄露。
  2. 适合对数据敏感的场景(如企业内部、科研)。
(2)丰富模型库,开箱即用
  1. 预集成主流开源模型,如 Llama 3、DeepSeek-R1、Qwen、Mistral 等,覆盖文本生成、代码开发、多语言翻译等场景。
  2. 支持模型量化(如 7B/13B 参数模型),降低显存需求,普通电脑(8GB + 内存)即可运行轻量模型。
(3)极简交互,命令行与 API 双支持
  1. 命令行: 通过 ollama run [模型名] 一键下载并启动模型,支持流式对话(如 ollama run yi:6b-chat)。
  2. API 接口:默认开放 11434 端口,兼容 OpenAI API 格式,可无缝对接 LangChain 等工具,方便开发集成。
(4)自定义模型 
  1. 通过 Modelfile 配置参数(温度、上下文长度、系统提示等),创建个性化模型(如 FROM llama2 PARAMETER temperature 0.7)。

2、安装与基础命令

(1)安装(Github:https://github.com/ollama/ollam

  • 官网下载:ollama.com(Windows、Mac支持一键安装包)。
  • 命令行安装(Linux):curl -fsSL https://ollama.com/install.sh | sh。

(2)常用命令

拉取模型:ollama pull llama3:13b
运行对话:ollama run llama3:13b(首次自动下载)
列出模型:ollama list
停止服务:ollama stop
查看帮助:ollama --help

3、本地部署大语言模型和云端部署大语言模型对比

4、典型使用场景

  • 开发者测试:快速验证模型性能,无需申请云端 API 权限。
  • 本地化应用:离线聊天机器人、内部文档问答系统(如医疗、法律领域)。
  • 科研与教学:自定义模型训练,分析模型行为(如参数窃取实验)。
  • 隐私优先场景:避免敏感数据上传云端(如企业代码、用户对话)。

5、安全风险与加固建议

(1)安全风险

  2025 年 3 月,国家网络安全通报中心指出 Ollama 默认配置存在三大风险:

  1. 未授权访问:11434 端口默认开放且无认证,攻击者可直接调用模型、删除文件。
  2. 数据泄露:通过 /api/show 接口获取模型敏感信息(如 License)。
  3. 历史漏洞:可利用 CVE-2024 系列漏洞执行恶意操作(如数据投毒)。

(2)加固建议

  • 限制端口监听:修改配置仅允许本地访问(ollama serve --listen localhost:11434)。
  • 配置防火墙:禁止公网访问 11434 端口。
  • 启用 API 密钥:通过环境变量 OLLAMA_API_KEY 认证(需版本 ≥0.5.12)。
  • 及时更新:修复漏洞,避免使用默认配置暴露公网。

6、优缺点总结

  • 优点:轻量易用、模型丰富、隐私性强,适合快速原型开发。
  • 缺点:默认配置不安全(需手动加固),多模型并行依赖 GPU 显存,复杂场景需结合 vLLM 等框架优化。

7、总结

  Ollama 是本地大模型的 “瑞士军刀”,用一行命令即可开启私有化 AI 体验,但需注意安全配置,适合追求便捷与隐私的开发者和企业。

8、参考文章

大模型-ollama(运行框架) 、 Ollama使用指南【超全版】

Ollama——大语言模型本地部署的极速利器的更多相关文章

  1. 本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

    OpenAI公司基于GPT模型的ChatGPT风光无两,眼看它起朱楼,眼看它宴宾客,FaceBook终于坐不住了,发布了同样基于LLM的人工智能大语言模型LLaMA,号称包含70亿.130亿.330亿 ...

  2. Hugging News #0324: 🤖️ 黑客松结果揭晓、一键部署谷歌最新大语言模型、Gradio 新版发布,更新超多!

    每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新.社区活动.学习资源和内容更新.开源库和模型更新等,我们将其称之为「Hugging Ne ...

  3. pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例)

    pytorch在有限的资源下部署大语言模型(以ChatGLM-6B为例) Part1知识准备 在PyTorch中加载预训练的模型时,通常的工作流程是这样的: my_model = ModelClass ...

  4. 保姆级教程:用GPU云主机搭建AI大语言模型并用Flask封装成API,实现用户与模型对话

    导读 在当今的人工智能时代,大型AI模型已成为获得人工智能应用程序的关键.但是,这些巨大的模型需要庞大的计算资源和存储空间,因此搭建这些模型并对它们进行交互需要强大的计算能力,这通常需要使用云计算服务 ...

  5. arcgis api for javascript本地部署加载地图

    最近开始学习arcgis api for javascript,发现一头雾水,决定记录下自己的学习过程. 一.下载arcgis api for js 4.2的library和jdk,具体安装包可以去官 ...

  6. virtual judge 本地部署方案

    这是一种将自己的电脑当作服务器来部署一个vj的方法,我也是参考前辈们的做法稍作了改动,如果在服务器上部署的话需要在细节上稍作改动: 一.什么是Virtual Judge? vj的工作原理什么?  vj ...

  7. 【Tomcat】使用tomcat manager 管理和部署项目,本地部署项目到服务器

    在部署tomcat项目的时候,除了把war文件直接拷贝到tomcat的webapp目录下,还有一种方法可以浏览器中管理和部署项目,那就是使用tomcat manager. 默认情况下,tomcat m ...

  8. Kubernetes 学习笔记(二):本地部署一个 kubernetes 集群

    前言 前面用到过的 minikube 只是一个单节点的 k8s 集群,这对于学习而言是不够的.我们需要有一个多节点集群,才能用到各种调度/监控功能.而且单节点只能是一个加引号的"集群&quo ...

  9. vue + ArcGIS 地图应用系列一:arcgis api本地部署(开发环境)

    封面 1. 下载 ArcGIS API for JavaScript 官网地址: https://developers.arcgis.com/javascript/3/ 下载地址:http://lin ...

  10. Window10环境下,Stable Diffusion的本地部署与效果展示

    Diffusion相关技术最近也是非常火爆,看看招聘信息,岗位名称都由AI算法工程师变成了AIGC算法工程师,本周跟大家分享一些Diffusion算法相关的内容. Window10环境下,Stable ...

随机推荐

  1. DevNow x Notion

    前言 Notion 应该是目前用户量比较大的一个在线笔记软件,它的文档系统也非常完善,支持多种文档格式,如 Markdown.富文本.表格.公式等. 早期我也用过一段时间,后来有点不习惯,就换到了 O ...

  2. [转]在MyBatis中使用pageHelper5.1.9分页插件实现物理分页

    pagehelper的GIT地址:https://github.com/pagehelper/Mybatis-PageHelper/ 废话少说,直接给出中文官方链接: 1.如何使用分页插件 2.HOW ...

  3. WxPython跨平台开发框架之模块字段权限的管理

    在我的很多Winform开发项目中,统一采用了权限管理模块来进行各种权限的控制,包括常规的功能权限(工具栏.按钮.菜单权限),另外还可以进行字段级别的字段权限控制,字段权限是我们在一些对权限要求比较严 ...

  4. Verilog4_时序逻辑电路

    时序逻辑电路概述 时序逻辑电路分类: 按照触发器的动作特点: 同步时序逻辑电路: 所有触发器的状态变化都是在同一个时钟信号作用下同时发生的 异步时序逻辑电路: 没有统一的时钟脉冲信号,各触发器状态的变 ...

  5. Solution Set -「AGC 004~006」C~F

    目录 「AGC 004C」AND Grid 「AGC 004D」Teleporter 「AGC 004E」Salvage Robots 「AGC 004F」Namori ^ 「AGC 005C」Tre ...

  6. ClickHouse-2接口

    客户端 ClickHouse提供了两个网络接口(两个都可以选择包装在TLS中以增加安全性): HTTP, 包含文档,易于使用. Native TCP,简单,方便使用. 在大多数情况下,建议使用适当的工 ...

  7. 深入解析 Spring AI 系列:分析 Spring AI 可观测性

    今天我们将讨论之前略过的可观测性部分的代码.在这里,我想简单说明一下,当时这部分代码属于必须编写的固定模板,因此在最初的讨论中我们直接跳过了它.虽然这部分代码乍看之下可能显得比较复杂,但实际上它的核心 ...

  8. 缓冲流的使用:BufferedInputStream、BufferedOutputStream、BufferedReader、BufferedWriter

    处理流之一 :缓冲流    当读取数据时,数据按块读入缓冲区,其后的读操作则直接访问缓冲区 当使用BufferedInputStream读取字节文件时,BufferedInputStream会一次 ...

  9. BackupBuddy pg walkthrough Intermediate

    nmap ┌──(root㉿kali)-[~/lab] └─# nmap -p- -A 192.168.189.43 Starting Nmap 7.94SVN ( https://nmap.org ...

  10. linux下自建NAS教程

    NAS,英文全名Network Attached Storage,翻译过来是:网络附接存储. 引用维基百科定义 网络附接存储(英语:Network Attached Storage,缩写:NAS)[1 ...