一、环境搭建

1.安装cuda，本人使用的是12.1版本,下载地址：https://developer.nvidia.com/cuda-12-1-1-download-archive

2.安装conda3，https://blog.csdn.net/m0_73634846/article/details/136378350

3.准备代码环境

原文： https://mp.weixin.qq.com/s/PQVrlr5FoVb89Mivzi7pLA

顺序执行：

git clone https://github.com/Ucas-HaoranWei/GOT-OCR2.0.git

conda create -n got python=3.10 -y #创建虚拟环境

conda activate got #激活虚拟环境

pip install -e . # 使用项目里面pyproject.toml安装依赖

安装 Flash-Attention：

pip install ninja

pip install flash-attn --no-build-isolation

ps：以上是官方的安装教程，但是其实会遇到很多问题，以下进行逐一说明，不保证能解决所有问题，但是大部分问题都能解决

二、问题序列：

1.python安装cuda出现错误提示：AssertionError: Torch not compiled with CUDA enabled

https://blog.csdn.net/qq_44750293/article/details/129685556

问题本质是pytorch无法调用cuda，原因是国内加速镜像默认会安装cpu版本，安装gpu版本即可，及torch.cuda.is_available输出为false即代表安装的版本为cpu版本，安装gpu版本后即可输出为true

###1、torch.cuda.is_available()显示false解决方法:

	使用pytorch官方推荐的版本安装：

		https://pytorch.org/

		例如cuda12.1的安装命令：

			conda:	conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

			pip:

				pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 （亲测有效，这个需要下载2小时+）

				阿里云加速(使用这个最快，推荐，只需要下载2min+)：

					pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 -f https://mirrors.aliyun.com/pytorch-wheels/cu121

2.遇到deepspeed安装报错

Python｜Windows 安装 DeepSpeed 安装方法及报错 Unable to pre-compile async_io 处理:

	https://blog.csdn.net/Changxing_J/article/details/139789110

配置visual studio

运行Anaconda Powershell Prompt，执行 Set-Item Env:\DS_BUILD_OPS 0，切换到deepspeed目录，再次执行 ：  .\build_win.bat

3.pip错误

ERROR: Could not find a version that satisfies the requirement setuptools_scm (from versions: none)

	尝试切换pip源试试，pip install -i 源地址

4.conda错误

在VS界面激活anaconda，但是报错”CondaError: Run 'conda init' before 'conda activate'“，该如何解决？

	打开Anaconda Prompt

	conda init

	conda activate 环境

5.遇到依赖C++环境的库错误解决

【报错】fatal error C1189

visual studio 版本过高或过低导致，目前2019版本兼容性相对较好

https://blog.csdn.net/thisjuly/article/details/136260069

6.flash_attn安装后执行失败，本质是编译的包不对

text-generation-webui加载codellama报错DLL load failed while importing flash_attn_2_cuda: 找不到指定的模块。：

https://blog.csdn.net/dandandancpop/article/details/134729988

解决： https://github.com/Dao-AILab/flash-attention/releases ，在此链接中下载与本地cuda与torch且python相对应的版本即可，cuda12.1下载cu123亲测可用，cp310为python3.10，cp311为python3.11其他同理

7.本地无法启动大模型

因为默认的源是hugging-face,但是国内无法访问，国内可使用modelscope（魔塔社区）的模型

hugging-face模型下载不成功？

	https://zhuanlan.zhihu.com/p/722248326?utm_campaign=shareopn&utm_medium=social&utm_psn=1824225242303819776&utm_source=wechat_session

	使用modelscope提供的模型

8.cudnn部署

https://blog.csdn.net/retainenergy/article/details/126183711

cuDNN下载链接：https://developer.nvidia.com/rdp/cudnn-archive ，本人使用的8.9.7，安装链接中进行配置即可

三、需要用到的资源下载链接（只上传了下载很慢的资源）：

通过网盘分享的文件：GOT-OCR大模型部署相关

链接: https://pan.baidu.com/s/1s18O0kS3apBvs-L35KB-qw?pwd=y4ht 提取码: y4ht

初探AI之got-ocr2.0大模型本地部署与遇到的各种坑处理的更多相关文章

【转载】NeurIPS 2018 | 腾讯AI Lab详解3大热点：模型压缩、机器学习及最优化算法
原文:NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩.机器学习及最优化算法导读 AI领域顶会NeurIPS正在加拿大蒙特利尔举办.本文针对实验室关注的几个研究热点,模型压缩.自 ...
华为高级研究员谢凌曦：下一代AI将走向何方？盘古大模型探路之旅
摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦.谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的"前世今生",以及它背后的艰难 ...
AI大模型学习了解
# 百度文心上线时间:2019年3月官方介绍:https://wenxin.baidu.com/ 发布地点: 参考资料: 2600亿!全球最大中文单体模型鹏城-百度·文心发布 # 华为盘古上线时 ...
DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍
DeepSpeed Chat: 一键式RLHF训练,让你的类ChatGPT千亿大模型提速省钱15倍 1. 概述近日来,ChatGPT及类似模型引发了人工智能(AI)领域的一场风潮. 这场风潮对数字世 ...
三分钟快速上手TensorFlow 2.0 （下）——模型的部署、大规模训练、加速
前文:三分钟快速上手TensorFlow 2.0 (中)——常用模块和模型的部署 TensorFlow 模型导出使用 SavedModel 完整导出模型不仅包含参数的权值,还包含计算的流程(即计算 ...
三分钟快速上手TensorFlow 2.0 （中）——常用模块和模型的部署
本文学习笔记参照来源:https://tf.wiki/zh/basic/basic.html 前文:三分钟快速上手TensorFlow 2.0 (上)——前置基础.模型建立与可视化 tf.train. ...
AI时代，还不了解大数据？
如果要问最近几年,IT行业哪个技术方向最火?一定属于ABC,即AI + Big Data + Cloud,也就是人工智能.大数据和云计算. 这几年,随着互联网大潮走向低谷,同时传统企业纷纷进行数字化转 ...
二手车价格预测 | 构建AI模型并部署Web应用 ⛵
作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 机器学习实战系列:https://www.showmeai.tech/t ...
文心大模型api使用
文心大模型api使用首先,我们要获取硅谷社区的连个key 复制两个api备用获取Access Token 获取access_token示例代码之后就会输出作文创作作文创作:作文创作接口基于文 ...
千亿参数开源大模型 BLOOM 背后的技术
假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,"一朝看尽长安花"似乎近在眼前 -- 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM ...

随机推荐

支持AMD GPU —— 如何运行docker环境下的Jax环境
相关: 支持NVIDIA GPU -- 如何运行docker环境下的Jax环境官方给出的安装主页: https://hub.docker.com/r/rocm/jax 安装命令: docker pu ...
华为高性能计算（HPC）文档——技术支持>智能计算解决方案>高性能计算>HPC
链接地址: https://support.huawei.com/enterprise/zh/server-solutions/hpc-pid-253585671 ================== ...
讲师招募 | Apache DolphinScheduler Meetup诚邀您共建开源！
随着Apache DolphinScheduler在全球范围内的快速发展,我们的用户群体和社区活动也在不断扩大. 为了进一步丰富我们的社区内容,分享更多有价值的知识和经验,我们诚挚地邀请您加入我们,成 ...
项目管理工具Maven的简单配置示例
Maven是一个强大的项目管理工具,它基于项目对象模型(POM)的概念,通过一小段描述信息来管理项目的构建.报告和文档.以下是一些关于Maven的具体例子,涵盖了项目配置.依赖管理.插件使用等方面: ...
3. EMC EMS EMI
1. 定义 1.1 EMC(Electromagnetic Compatibility) 电磁兼容性(EMC)是指系统正常工作的能力,不受其正常环境中电磁现象的干扰,不产生干扰其他设备的电干扰. 1. ...
Camera | 2.MIPI、CSI基础
瑞芯微专栏上一篇我们讲解了camera的一些基础概念和知识. 我们说了,现在的手机由于高分辨率的要求,现在基本上都是基于MIPI.CSI协议来实现的, 本篇讲解MIPI.CSI的一些基础知识. 摄像 ...
ArgoWorkflow教程(二)---快速构建流水线：Workflow & Template 概念
上一篇我们部署了 ArgoWorkflow,并创建了一个简单的流水线做了个 Demo.本篇主要分析 ArgoWorkflow 中流水线相关的概念,了解概念后才能更好使用 ArgoWorkflow. 本 ...
Redis实战11-实现优惠券秒杀下单
本篇,咱们来实现优惠券秒杀下单功能.通过本篇学习,我们将会有如下收获: 1:优惠券领券业务逻辑: 2:分析在高并发情况下,出现超卖问题产生的原因: 3:解决超卖问题两种方案:版本号法及CAS法 4:乐 ...
mysql vs mongodb
Comments MongoDB 是NoSQL 数据库,适合存JSON格式数据,MySQL是关系型数据库,适合存table格式数据 MongoDB扩展性更好,MySQL支持主从和cluster但是感觉 ...
Typora mac激活
typora mac版本激活我也是第一次使用mac电脑,在安装时基本上都是付费的,在mac下载使用typora是试用一段时间后是需要付费购买的,苦无能力有限只能绕一下,感谢网上的各位大佬的分享来源 ...

初探AI之got-ocr2.0大模型本地部署与遇到的各种坑处理