AI大模型完全本地化部署指南—

本文将从基础硬件购置开始讲起，真正意义上从零开始，最终通过Ollama、LangChain、DeepSeek的一系列交互，输出本地大模型的第一声啼鸣，带你走进另一片广阔的世界。update:2025-02-23

硬件方面

主板选型：

主机组装：

P40显卡拆解，改散热：

kali显卡驱动安装

软件方面

ollama服务端配置

ollama安装没什么难度，建议直接参考官网https://ollama.com，根据安装提示一直按下一步即可，安装模型命令是ollama pull 模型名称。

ollama服务端执行export OLLAMA_HOST=0.0.0.0:11434;ollama serve ;开启外部网络访问支持。启动后可执行ollam list查看本地已部署模型信息，以下是我之前安装过的。

conda虚拟环境部署

软件环境部署：

  conda create -n LangChainP312 python==3.12

  conda activate LangChainP312

  pip install --upgrade langchain

  pip install --upgrade langchain-ollama

开发工具vs code，官网是https://code.visualstudio.com/Download，ubuntu系列linux执行`sudo dpkg -i xxx.deb`即可，windows安装步骤仍是各种下一步下一步，最后左侧安装一下python代码支持。

然后新建一个py文档开始写代码，注意和conda环境关联方法：快捷键CTRL SHIFT P选择interpreter，指定conda环境LangChainP312。

客户端langchain代码编写

from langchain_ollama import OllamaLLM

#更多参数配置，可以在OllamaLLM函数名位置右键或者F12跳转到源码位置

model = OllamaLLM(model="deepseek-r1:1.5b",base_url="http://192.168.50.171:11434")

response= model.invoke("如何学习人工智能")

print(response)

然后CTRL+F5就可以运行代码了，运行效果如下：

AI大模型完全本地化部署指南——从零硬件开始的更多相关文章

AI大模型学习了解
# 百度文心上线时间:2019年3月官方介绍:https://wenxin.baidu.com/ 发布地点: 参考资料: 2600亿!全球最大中文单体模型鹏城-百度·文心发布 # 华为盘古上线时 ...
最新版大数据平台安装部署指南，HDP-2.6.5.0，ambari-2.6.2.0
一.服务器环境配置 1 系统要求名称地址操作系统 root密码 Master1 10.1.0.30 Centos 7.7 Root@bidsum1 Master2 10.1.0.105 Cent ...
华为高级研究员谢凌曦：下一代AI将走向何方？盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
保姆级教程：用GPU云主机搭建AI大语言模型并用Flask封装成API，实现用户与模型对话
导读在当今的人工智能时代,大型AI模型已成为获得人工智能应用程序的关键.但是,这些巨大的模型需要庞大的计算资源和存储空间,因此搭建这些模型并对它们进行交互需要强大的计算能力,这通常需要使用云计算服务 ...
zz独家专访AI大神贾扬清：我为什么选择加入阿里巴巴？
独家专访AI大神贾扬清:我为什么选择加入阿里巴巴? Natalie.Cai 拥有的都是侥幸,失去的都是人生关注她 5 人赞同了该文章本文由「AI前线」原创,原文链接:独家专访AI大神贾扬清:我 ...
阿里开源新一代 AI 算法模型，由达摩院90后科学家研发
最炫的技术新知.最热门的大咖公开课.最有趣的开发者活动.最实用的工具干货,就在<开发者必读>! 每日集成开发者社区精品内容,你身边的技术资讯管家. 每日头条阿里开源新一代 AI 算法模型 ...
搭乘“AI大数据”快车，肌肤管家，助力美业数字化发展
经过疫情的发酵,加速推动各行各业进入数据时代的步伐.美业,一个通过自身技术.产品让用户变美的行业,在AI大数据的加持下表现尤为突出. 对于美妆护肤企业来说,一边是进入存量市场,一边是疫后的复苏期,一边 ...
DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...
大数据存储:MongoDB实战指南——常见问题解答
锁粒度与并发性能怎么样? 数据库的读写并发性能与锁的粒度息息相关,不管是读操作还是写操作开始运行时,都会请求相应的锁资源,如果请求不到,操作就会被阻塞.读操作请求的是读锁,能够与其它读操作共享,但是当 ...
IBM Rational ClearCase 部署指南
引言随着时间的推移,可视化设计与软件配置管理(SCM)已经逐渐成为现代软件项目成功的关键因素.IBM Rational 是 IBM Rational XDE 和 IBM Rational Clear ...

随机推荐

【JDBC第6章】数据库事务理论
第6章:数据库事务 6.1 数据库事务介绍事务:一组逻辑操作单元,使数据从一种状态变换到另一种状态. 事务处理(事务操作):保证所有事务都作为一个工作单元来执行,即使出现了故障,都不能改变这种执行方 ...
【Ubuntu】在Ubuntu上安装微信
[Ubuntu]在Ubuntu上安装微信零.说明微信官网最近发布了Linux的测试版本,实际使用下来与Windows版本相差不多,本文介绍如何在Ubuntu(Debian系)上安装Linux版本的 ...
nodejs集群
nodejs集群单个 Node.js 实例运行在单个线程中. 为了充分利用多核系统,有时需要启用一组 Node.js 进程去处理负载任务. 集群中的Master 现在让我们详细了解Master的职责 ...
🎀dubbo 2.7.2 启动报错【Unsupported generic type false】排查
1.问题现象 dubbo服务启动时抛出异常Unsupported generic type false,但不影响服务正常发布. Caused by: java.lang.IllegalArgument ...
WPF静态资源StaticResource和动态资源DynamicResource有什么区别，x:Static又是什么意思？
什么叫WPF的资源(Resource) 资源是保存在可执行文件中的一种不可执行数据.WPF中资源用ResourceDictionary类表示,这个类就是一个字典,字典的key和value都是objec ...
Golang服务可观测和思路分享
省流中医四诊"望闻问切"与程序诊断有异曲同工之妙.在Golang问题排查中,我们需要建立系统化的诊断思维:通过观察表象(望).收集信息(闻).追溯根源(问).精准施治(切)四个维 ...
python满足任意一个条件均认为假设有效（执行if内脚本）if any的用法
下方代码,判断sta内是否包含s数组内的数字,只要包含任意一个输入ok,否则输出no s=['3','8','9'] sta='59' if s[0] in sta or s[1] in sta or ...
js判断对象任意深度的key属性是否存在，js的iset方法
方法一: 支持纯对象的obj // isset.js module.exports = (obj, keyPath) => { const keys = keyPath.split('.') ...
centos7-NFS-网络文件系统
NFS(network file system)网络文件系统 pdf文档下载链接 https://files.cnblogs.com/files/duxingren/NFS.zip 服务器192.16 ...
Vue相关笔记
Promise基本使用 Promise是异步编程的一种解决方案,用于一个异步操作的最终完成(或失败)及其结果值的表示,比传统的回调函数方案更加合理. var promise = new Promise ...

AI大模型完全本地化部署指南——从零硬件开始