推荐一枚宝藏Up主,顺便聊聊感想
众所周知,B站是学习网站
最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。
值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的例子类比)。
Up主的名字:新石器公园

推荐一看。
接下来聊聊感想
我是怎么发现这枚宝藏Up主的呢?
源于最近使用metaso.cn搜了一下2024年热点研究方向:

然后挑了几个计算机领域比较相近的研究方向,挨个儿去B站搜索相关领域的视频,顺其自然就找到啦,然后科普视频就看得停不下来,感触比较深的是:
从去年开始,大模型爆发,很明显的一个现象是,随着国内相关政策的不断完善,开源生态也越来越成熟,产业界的跟进落地速度与也越来越快,相关的产品层出不穷。不过,大多数开发人员更关注上层使用,而对底层的细节关注比较少,比如下面几个问题看看你是否能够回答:
1. 大模型的参数是指什么?它和传统的神经网络有什么不同?
2. transformer的自注意力机制是指什么?
3. 扩散模型底层原理是怎样的?大模型为什么能生成视频?
向下扩展到底层技术:
1. 之前频频上新闻的室温超导技术,究竟有啥用?
2. 量子计算机是科学还是玄学?它如何提高计算效率?又会与大模型擦出怎样的火花?
3. 忆阻器与常见的模电器件有何不同?
这些问题,在Up主的科普视频都有解答,对于概念理解而言,是非常好的入门渠道。如果你说,这和我有啥关系?这难道不是科学家要关心的嘛?那向上扩展到应用层,看看以下问题你能否回答:
1. 大模型在工业中是如何发挥作用的?比如之前华为用在了采矿,现在又用在了炼钢,究竟是怎么做的?
2. 大模型在计算机业界,最常用的架构是怎样的?除了RAG,还有其他形式吗?大模型效果评价体系有哪些?
3. 内容向量化是指什么?维度又是什么含义?选取多少维度比较合适?
4. 文本的语义切分怎么做,才能保证效果最优?传统的chunk+overlap是否还有优化空间?用大模型直接做语义切分怎么样?
5. prompt调优有哪些手段?如何评估它们的效果?
是不是发现很多知识明明用了,但是不清楚背后的原理?或者知道原理但不知道如何表达出来?
其实,这都属于知识体系构建不完整的一种体现,很多知识都是一个个孤岛,没有连点成线,更别提连线成面了。
所以,我们要做的是:
1. 在工作之余,花点时间了解平时用到的技术底层原理,慢慢提升认知。这是向下扎根的过程;
2.多关注行业发展趋势,多接触业务领域人员,了解他们对于技术演化趋势的看法,这也很重要,往往决定了技术是否能够搭载产品被推广出去。这是向上生长的过程。
既然谈到了知识体系的构建,那就
再聊聊信息收集和处理的方法
最近逛知乎偶然看到的一个话题:

于是有幸拜读了回答的一篇长文,该文从各种角度分析了信息的获取、处理以及分析方式,具体可以去知乎查看,本文不再展开。
还有一本北大博士论文神作,名叫《中县干部》,网上有资源,可以学习下。
总体而言,可以理解为文章讲述了一套概念:找到渠道、了解各类实体、获取各类实体之间的交互关系,并持续关注实体交互关系的动态变化。这与计算机科学中常常提到的知识图谱或者图数据库的构建和更新操作非常相似。
你看,这个世界的很多东西都是相通的,所以多多思考,任督二脉就慢慢打通了。
时间有限,今天就先聊到这里吧,希望能给大家带来一些启发。
推荐一枚宝藏Up主,顺便聊聊感想的更多相关文章
- IE10 CSS Hack(顺便聊聊IE11的CSS Hack)
一.特性检测:@cc_on 我们可以用IE私有的条件编译(conditional compilation)结合条件注释来提供针对ie10的Hack:该脚本里面的IE排除条件注释,以确保IE6-9不承认 ...
- mysql+mycat搭建稳定高可用集群,负载均衡,主备复制,读写分离
数据库性能优化普遍采用集群方式,oracle集群软硬件投入昂贵,今天花了一天时间搭建基于mysql的集群环境. 主要思路 简单说,实现mysql主备复制-->利用mycat实现负载均衡. 比较了 ...
- 【DNS】简单聊聊DNS如何工作
随便聊聊 我们知道,网络上传输的数据包是一层一层的包起来的,典型的是mac地址层,ip层,tcp/udp层,应用层数据 这么几个层,那用户在浏览器中打开www.baidu.com数据包如何传到baid ...
- 聊聊CSS postproccessors
阿里妈妈 @一丝 准备发布其CSSGrace,即CSS后处理插件,于是顺便聊聊CSS postprocessors. 从Rework说起 Rework是TJ大神开发的CSS预处理框架.但为什么会出 ...
- 企业级-Mysql双主互备高可用负载均衡架构(基于GTID主从复制模式)(原创)
前言: 原理与思想 这里选用GTID主从复制模式Mysql主从复制模式,是为了更加确保主从复制的正确性.健康性与易配性.这里做的是两服务器A,B各有Mysql实例331 ...
- 一般来说,主方法main()结束的时候线程结束
suspend()是将一个运行时状态进入阻塞状态(注意不释放锁标记).恢复状态的时候用resume().Stop()指释放全部. 这几个方法上都有Deprecated标志,说明这个方法不推荐使用. 一 ...
- Hibernate主键生成策略详解
转载自:http://blog.csdn.net/wanghuan203/article/details/7562395 hibernate提供的主键生成策略,使我们可以在实体类的映射xml文件中设定 ...
- 从实例看hibernate的主键生成策略
学习了hibernate会发现.hibernate中有实体类.实体类的映射文件.可是我们怎么样才干知道实体类的主键是如何的生成方式呢?hibernate提供的主键生成策略帮我们完美地解答了这个疑问.以 ...
- 推荐一款疫情期间适合在家办公的远程工具,仅需IP和密码轻松实现远程管理
这段时间,受疫情影响,很多企业都开启了居家办公模式.但疫情突发,大多数人的办公资料没有拷贝打包,对于居家办公的人,尤其是运维人员来说,很难完成顺利完成工作. 像向日葵.teamviewer之类的远程软 ...
- 深入分析mysql为什么不推荐使用uuid或者雪花id作为主键
前言:在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建 ...
随机推荐
- 后台生成单个Word文档
在实际项目开发中经常会遇到一种场景,客户希望点击页面上的生成文件按钮,执行程序动态填充数据到Word模板,直接在后台生成Word文档,而无需显示Word文档.目前网上有一些针对此需求的方案,但每个方案 ...
- 『手撕Vue-CLI』编码规范检查
前言 这篇为什么是编码规范检查呢?因为这是一个很重要的环节,一个好的编码规范可以让代码更加清晰易读,在官方的 VUE-CLI 也是有着很好的编码规范的,所以我也要加入这个环节. 其实不管在哪个项目中, ...
- 搭建内网yum仓库
服务器配置: 1. 创建yum仓库的目录,rpm包上传到这里. mkdir /soft/x86 -p 2. 修改yum缓存配置: sed -i 's#keepcache=0#keepcache=1#g ...
- Dockerfile PHP镜像制作
1 PHP镜像制作: 1.1 php-dockerfile FROM centos:7 LABEL maintainer www.chenleilei.net RUN yum install -y c ...
- MySQL学习笔记-多表查询(下)
多表查询(下) 一. 联合查询 联合查询:将多次查询结果合并,形成新的查询结果集 select {字段列表} from {表A} ... union [all] select {字段列表} from ...
- 初入JavaScript
js是轻量级 弱类型 脚本语言 html是 超文本 标记语言 脚本语言和标记语言的主要区别 标记语言,可以通过浏览器直接执行 脚本语言,必须要通过编译,浏览器内核的编译,才能正常运行 简单理解,脚本语 ...
- 前端传参中文需要utf-8转一下给后端
const Msg = this.form.Msg.replace( (/%(u[0-9A-F]{4})|(%[0-9A-F]{2})/gm, $0 => { return escape($0) ...
- undefined,null 和 undeclared 有什么区别?
a.null表示"没有对象",即该处不应该有值,转为数值时为0.典型用法是:作为函数的参数,表示该函数的参数不是对象.作 为对象原型链的终点. b.undefined表 ...
- __proto__和[[Prototype]]的区别
__proto__和[[Prototype]]的区别 先看下面这一段代码: const obj1 = Object.create(null); // very plain object obj1.__ ...
- AIGC底层技术介绍
1.AIGC概述 AIGC,全称Artificial Intelligence Generated Content,即人工智能生成内容.这是一种新兴的人工智能技术,其核心思想是利用人工智能模型,根据给 ...