DeepSeek 全面指南,95% 的人都不知道的9个技巧(建议收藏)
大家好,我是汤师爷~
最近,DeepSeek这款AI工具爆火国内外。
虽然许多人都开始尝试使用它,但有人吐槽说,没想象中那么牛。
其实问题不在工具,很多人的使用姿势就搞错了,用大炮打蚊子,白白浪费DeepSeek的强大功能。
接下来,我将为大家分享9个实用技巧,你会发现DeepSeek远比想象中更强大。
DeepSeek的三种模式
DeepSeek有三大适用模式:基础模型(V3)、深度思考(R1)、联网搜索。
1. 基础模型(V3)
基础模型(V3)是DeepSeek的标配,没有勾选默认就是基础模型。V3版自去年12月升级后,性能大幅提升,堪比业内顶尖模型如GPT-4、Claude-3.5等。
它的作用相当简单,回答日常的百科类问题,帮助用户快速获取信息。
不管是查询常见知识、处理简单的文本生成任务,V3都能迅速给出答案。它的优点就是高效、便捷,几乎没有什么门槛,适用于大部分场景。
尤其是在用户并不要求复杂推理、深度分析的情况下,V3就显得尤为合适。比如你只想问一个简单的问题,或者需要一个快速的解答,V3足够应付。简单、直接,是它的最大特点。
2. 深度思考(R1)
R1作为DeepSeek的深度推理模型,专门用来解决那些需要复杂推理和深度思考的问题。它处理的任务更具挑战性,比如数理逻辑推理、编程代码分析等。
R1模型有660B的参数,并采用了后训练+RL强化学习方法,擅长从多个角度分析问题,并给出经过严密推理后的解答。
R1决定是一位专家,能够为你提供精确、深刻的推理和分析。因此,如果你的问题涉及到复杂的推理,R1便是不二的选择。
3. 联网搜索
联网搜索模式是DeepSeek的AI搜索功能,基于RAG(检索增强生成),这一模式让DeepSeek不仅能依赖它自己的知识库,还能根据互联网实时搜索相关内容来回答问题。
换句话说,联网搜索不仅让模型能够回答2024年7月以后的问题,还可以利用网络上的最新信息来补充自己的回答。
如何对标其他模型?
DeepSeek的三个核心模式,能够与chatGPT对标,为我们提供更清晰的选择。
1. V3对标GPT-4o
DeepSeek的V3模型堪比GPT-4o,二者的设计理念和应用场景非常相似。V3采用了Moe架构,拥有671B的参数量,能够在百科知识领域提供快速响应。
2. R1对标o1
R1是DeepSeek的深度推理模型,和OpenAI的o1模型非常类似。二者都在处理推理、深度思考以及复杂逻辑问题时,展现出了非凡的能力。
R1采用了660B的参数,并且在强化学习和后训练方面表现出色。R1更擅长逻辑推理和复杂问题的解答,在这一点上,R1已经超越了o1模型。
知识库的更新时间
目前,DeepSeek的预训练数据已经更新到2024年7月。
但对于之后的新闻或技术动态,DeepSeek的联网搜索模式就显得尤为重要,它能够根据网络实时获取最新信息,弥补知识库的空白。
告别提示词
很多AI熟手可能会囤一堆提示词模板,但是,DeepSeek 完全不用准备提示词,只要简单明了地描述你的需求,DeepSeek 就能理解并给出精准的答案。
举个例子,如果你想让 DeepSeek 帮你写一段蛇年拜年祝福语,直接告诉它这个需求,它就能立刻生成多个风格的版本。
与DeepSeek的对话,尽量使用简单、直白的语言。越是接地气的表达,DeepSeek就越能发挥其最大潜力。
避免过于正式、结构化的表述,简单、直白、带点口语化的语言往往能够获得最自然、流畅的答案。
DeepSeek的理解能力非常强,不需要过多的引导,给它一个清晰的问题,它就能提供精准的答复。
“小学生”沟通技巧
与DeepSeek对话时,有时我们可能觉得AI的回答过于抽象。
这其实源于传统AI模型过于注重结构化表达,结果都是“八股文”的回答,我们可以借助DeepSeek的“小学生”沟通技巧。
可以给它一个提示:“我是一名小学生,请用小学生能听懂的话解释什么是大模型。”
通过持续追问,获取详细答案
运用持续追问的技巧,能够帮你快速搞清楚一个复杂问题,大致步骤如下:
- 提出一个概括性的问题
- 基于回答内容进行深入追问
- 继续挖掘具体细节
- 将对话信息整理成清单格式
例如,我先问DeepSeek:“如何写好提示词?”
对于如何提供上下文,我还是不明白,我可以继续追问DeepSeek。
最后我让DeepSeek把对话整理成详细的清单格式。
活用联网搜索
联网搜索是DeepSeek的一大亮点,它让模型在回答时不仅仅依赖预训练数据,还能实时从网络上检索最新的信息。
你可以问到2024年7月以后发生的事件,或者某些新兴技术领域的问题,DeepSeek都能通过联网搜索为你提供更准确、及时的回答。
例如,你问DeepSeek:“2025年春晚有哪些节目?”它可以在网络上找到最相关的资料,并结合大语言模型的能力生成确的回答。
但是,最近DeepSeek受国外网络攻击,联网搜索暂不可用了,尴尬~
上传附件功能
除了联网搜索,DeepSeek还支持上传附件功能,这为用户提供了更多个性化的体验。
通过上传附件,你可以将自己的私密资料、知识库、甚至是一些需要深度推理的材料直接交给DeepSeek,让它基于这些专有的文件进行分析和推理。
上传附件最多支持50个文件,每个文件最大100MB,数据量较大的文件,DeepSeek也能处理自如。
R1的三个开放特性
对于深度思考(R1)模型,DeepSeek做到了三个重要的开放特性,让R1不仅仅是一个“黑盒”模型,它的思维过程、训练技术和模型参数都是透明开放的。
1. 思维链全开放
R1的思维链是完全开放的,用户可以看到模型进行推理时的每一步逻辑。
这不仅是一个回答,而是一个完整的思考过程。通过这种方式,用户能获得最终答案,还能够理解AI是如何得出这个结论的。
2. 训练技术全部公开
DeepSeek采用了RL(强化学习)技术,通过极少的标注数据提高了推理能力。
所有的训练技术,包括模型的后训练过程和数据增强方法,都是公开的。
这让广大网友都能深入理解模型的训练过程,并且可以根据需要进行调整和优化。
3. 开源模型
DeepSeek还将R1的部分模型进行开源。虽然R1模型本身的参数高达660B,通常只有大公司才能使用,但DeepSeek也为社区提供了更小的开源模型,让更多的开发者和研究者可以使用。
最小的模型只有1.5B参数,适合个人开发者进行实验和开发。
这格局太顶了,帮助全球的开发者共同推动AI的发展。
以上9个技巧,希望能帮助你更好地使用DeepSeek。欢迎大家在评论区分享你的使用技巧,一起探讨、学习。
本文已收录于,我的技术网站:tangshiye.cn 里面有,AI 编程、算法 Leetcode 详解、面试八股文、BAT面试真题、简历模版、架构设计,等经验分享。
DeepSeek 全面指南,95% 的人都不知道的9个技巧(建议收藏)的更多相关文章
- 99% 的人都不知道的 Kubernetes 网络疑难杂症排查方法
原文链接:Kubernetes 网络疑难杂症排查分享 大家好,我是 roc,来自腾讯云容器服务 (TKE) 团队,经常帮助用户解决各种 K8S 的疑难杂症,积累了比较丰富的经验,本文分享几个比较复杂的 ...
- 很多人都不知道的监听微信、支付宝等移动app及浏览器的返回、后退、上一页按钮的事件方法
版权声明:本文为博主原创文章,未经博主允许不得转载. 在实际的应用中,我们常常需要实现在移动app和浏览器中点击返回.后退.上一页等按钮实现自己的关闭页面.调整到指定页面或执行一些其它操作的 需求,那 ...
- 大部分人都不知道的8个python神操作
01 print 打印带有颜色的信息 大家知道 Python 中的信息打印函数 Print,一般我们会使用它打印一些东西,作为一个简单调试. 但是你知道么,这个 Print 打印出来的字体颜色是可以设 ...
- 90%的人都不知道的Node.js 依赖关系管理(上)
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 原文参考:https://dzone.com/articles/nodejs-dependency-mana ...
- 90%的人都不知道的Node.js 依赖关系管理(下)
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 原文参考:https://dzone.com/articles/node-dependency-manage ...
- 关于 junit4 90% 的人都不知道的特性,详解 junitperf 的实现原理
前言 上一节介绍了 https://github.com/houbb/junitperf 的入门使用. 这一节我们从源码的角度,剖析一下其实现方式. 性能测试该怎么做? Junit Rules jun ...
- 99%的Python用户都不知道的f-string隐秘技巧
f-string想必很多Python用户都基础性的使用过,作为Python3.6版本开始引入的特性,通过它我们可以更加方便地向字符串中嵌入自定义内容,但f-string真正蕴含的功能远比大多数用户知道 ...
- 你所不知道的 CSS 阴影技巧与细节 滚动视差?CSS 不在话下 神奇的选择器 :focus-within 当角色转换为面试官之后 NPOI 教程 - 3.2 打印相关设置 前端XSS相关整理 委托入门案例
你所不知道的 CSS 阴影技巧与细节 关于 CSS 阴影,之前已经有写过一篇,box-shadow 与 filter:drop-shadow 详解及奇技淫巧,介绍了一些关于 box-shadow ...
- 你所不知道的 CSS 阴影技巧与细节
关于 CSS 阴影,之前已经有写过一篇,box-shadow 与 filter:drop-shadow 详解及奇技淫巧,介绍了一些关于 box-shadow 的用法. 最近一个新的项目,CSS-Ins ...
- 【CSS】346- 你所不知道的 CSS 阴影技巧与细节
偷懒了1个多礼拜,在工作饱和的情况下,怎么坚持学习?今天的分享来自@Coco国服第一切图仔,我们聊聊CSS属性box-shadow- 关于 CSS 阴影,之前已经有写过一篇,box-shadow 与 ...
随机推荐
- Navicat Premium 16下载与安装
1.可以通过以下两种方式下载 a.官网下载地址 https://www.navicat.com.cn/download/navicat-premium b.百度网盘下载地址 链接:https://pa ...
- php操作sqlite3
距离上次接触sqlite3已经快一年了,去年这篇文章讲跟着菜鸟教程学python操作sqlite3,https://www.cnblogs.com/lizhaoyao/p/13717381.html ...
- 使用Tomcat插件开发WEB应用
在Eclipse中,可以安装Tomcat插件,实现WEB应用的开发调试工作,Tomcat插件还可以支持WEB应用的热部署. 一.安装配置Tomcat插件 可以通过拷贝安装和Links方式安装Tomca ...
- python爬虫利器之Playwright
Playwright 是微软在 2020 年初开源的新一代自动化测试工具,它的功能类似于 Selenium.Pyppeteer 等,都可以驱动浏览器进行各种自动化操作.它的功能也非常强大,对市面上的主 ...
- VUE3 使用资源路径加载
1.使用场景 有些情况下,我需要使用组件路径动态的方式加载组件. 2.实现方法 import { defineAsyncComponent } from 'vue'; /** * 根据view组件路径 ...
- idea springboot 微服务批量启动
概要 在使用IDEA开发微服务的时候,微服务比较多,启动起来比较麻烦,下面介绍一下使用批量启动微服务的方法. 方法 编辑当前项目根目录下的 .idea\workspace.xml 文件. 找到 < ...
- 基于CPLD/FPGA的呼吸灯效果实现(附全部verilog源码)
一.功能介绍 此设计可以让你的FPGA板子上那颗LED具有呼吸效果,像智能手机上的呼吸灯一样.以下源码已上板验证通过,大家可直接使用. 二.呼吸灯Verilog源码 ps1. 带★号处可根据需要进行修 ...
- 【Amadeus原创】IPAD忘记密码重置恢复出厂设置
打开iTunes,确保您的 iPad 没有连接到电脑. 按住顶部按钮,直到出现关机滑块.拖移这个滑块以将 iPad 关机. 在按住主屏幕按钮的同时,将 iPad 连接到电脑.继续按住主屏幕按钮,直到看 ...
- [solon]Solon开发实战之权限认证
本项目采用权限认证框架sa-token(sa-token-solon-plugin) pom.xml <!-- 鉴权--> <dependency> <groupId&g ...
- linux tc命令进行网络限速、丢包、延迟设置(简单使用)
linux自带tc命令版本不是很低的linux系统都自带tc如果你的系统不带这个命令,建议使用类似括号中的命令进行安装 (yum -y install iproute) TC 中使用下列的缩写表示相应 ...