众所周知,B站是学习网站

最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。

值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的例子类比)。

Up主的名字:新石器公园

推荐一看。

接下来聊聊感想

我是怎么发现这枚宝藏Up主的呢?

源于最近使用metaso.cn搜了一下2024年热点研究方向:

然后挑了几个计算机领域比较相近的研究方向,挨个儿去B站搜索相关领域的视频,顺其自然就找到啦,然后科普视频就看得停不下来,感触比较深的是:

从去年开始,大模型爆发,很明显的一个现象是,随着国内相关政策的不断完善,开源生态也越来越成熟,产业界的跟进落地速度与也越来越快,相关的产品层出不穷。不过,大多数开发人员更关注上层使用,而对底层的细节关注比较少,比如下面几个问题看看你是否能够回答:

1. 大模型的参数是指什么?它和传统的神经网络有什么不同?

2. transformer的自注意力机制是指什么?

3. 扩散模型底层原理是怎样的?大模型为什么能生成视频?

向下扩展到底层技术:

1. 之前频频上新闻的室温超导技术,究竟有啥用?

2. 量子计算机是科学还是玄学?它如何提高计算效率?又会与大模型擦出怎样的火花?

3. 忆阻器与常见的模电器件有何不同?

这些问题,在Up主的科普视频都有解答,对于概念理解而言,是非常好的入门渠道。如果你说,这和我有啥关系?这难道不是科学家要关心的嘛?那向上扩展到应用层,看看以下问题你能否回答:

1. 大模型在工业中是如何发挥作用的?比如之前华为用在了采矿,现在又用在了炼钢,究竟是怎么做的?

2. 大模型在计算机业界,最常用的架构是怎样的?除了RAG,还有其他形式吗?大模型效果评价体系有哪些?

3. 内容向量化是指什么?维度又是什么含义?选取多少维度比较合适?

4. 文本的语义切分怎么做,才能保证效果最优?传统的chunk+overlap是否还有优化空间?用大模型直接做语义切分怎么样?

5. prompt调优有哪些手段?如何评估它们的效果?

是不是发现很多知识明明用了,但是不清楚背后的原理?或者知道原理但不知道如何表达出来?

其实,这都属于知识体系构建不完整的一种体现,很多知识都是一个个孤岛,没有连点成线,更别提连线成面了。

所以,我们要做的是:

1. 在工作之余,花点时间了解平时用到的技术底层原理,慢慢提升认知。这是向下扎根的过程;

2.多关注行业发展趋势,多接触业务领域人员,了解他们对于技术演化趋势的看法,这也很重要,往往决定了技术是否能够搭载产品被推广出去。这是向上生长的过程。

既然谈到了知识体系的构建,那就

再聊聊信息收集和处理的方法

最近逛知乎偶然看到的一个话题:

于是有幸拜读了回答的一篇长文,该文从各种角度分析了信息的获取、处理以及分析方式,具体可以去知乎查看,本文不再展开。

还有一本北大博士论文神作,名叫《中县干部》,网上有资源,可以学习下。

总体而言,可以理解为文章讲述了一套概念:找到渠道、了解各类实体、获取各类实体之间的交互关系,并持续关注实体交互关系的动态变化。这与计算机科学中常常提到的知识图谱或者图数据库的构建和更新操作非常相似。

你看,这个世界的很多东西都是相通的,所以多多思考,任督二脉就慢慢打通了。

时间有限,今天就先聊到这里吧,希望能给大家带来一些启发。

推荐一枚宝藏Up主,顺便聊聊感想的更多相关文章

  1. IE10 CSS Hack(顺便聊聊IE11的CSS Hack)

    一.特性检测:@cc_on 我们可以用IE私有的条件编译(conditional compilation)结合条件注释来提供针对ie10的Hack:该脚本里面的IE排除条件注释,以确保IE6-9不承认 ...

  2. mysql+mycat搭建稳定高可用集群,负载均衡,主备复制,读写分离

    数据库性能优化普遍采用集群方式,oracle集群软硬件投入昂贵,今天花了一天时间搭建基于mysql的集群环境. 主要思路 简单说,实现mysql主备复制-->利用mycat实现负载均衡. 比较了 ...

  3. 【DNS】简单聊聊DNS如何工作

    随便聊聊 我们知道,网络上传输的数据包是一层一层的包起来的,典型的是mac地址层,ip层,tcp/udp层,应用层数据 这么几个层,那用户在浏览器中打开www.baidu.com数据包如何传到baid ...

  4. 聊聊CSS postproccessors

      阿里妈妈 @一丝 准备发布其CSSGrace,即CSS后处理插件,于是顺便聊聊CSS postprocessors. 从Rework说起 Rework是TJ大神开发的CSS预处理框架.但为什么会出 ...

  5. 企业级-Mysql双主互备高可用负载均衡架构(基于GTID主从复制模式)(原创)

    前言:          原理与思想        这里选用GTID主从复制模式Mysql主从复制模式,是为了更加确保主从复制的正确性.健康性与易配性.这里做的是两服务器A,B各有Mysql实例331 ...

  6. 一般来说,主方法main()结束的时候线程结束

    suspend()是将一个运行时状态进入阻塞状态(注意不释放锁标记).恢复状态的时候用resume().Stop()指释放全部. 这几个方法上都有Deprecated标志,说明这个方法不推荐使用. 一 ...

  7. Hibernate主键生成策略详解

    转载自:http://blog.csdn.net/wanghuan203/article/details/7562395 hibernate提供的主键生成策略,使我们可以在实体类的映射xml文件中设定 ...

  8. 从实例看hibernate的主键生成策略

    学习了hibernate会发现.hibernate中有实体类.实体类的映射文件.可是我们怎么样才干知道实体类的主键是如何的生成方式呢?hibernate提供的主键生成策略帮我们完美地解答了这个疑问.以 ...

  9. 推荐一款疫情期间适合在家办公的远程工具,仅需IP和密码轻松实现远程管理

    这段时间,受疫情影响,很多企业都开启了居家办公模式.但疫情突发,大多数人的办公资料没有拷贝打包,对于居家办公的人,尤其是运维人员来说,很难完成顺利完成工作. 像向日葵.teamviewer之类的远程软 ...

  10. 深入分析mysql为什么不推荐使用uuid或者雪花id作为主键

    前言:在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建 ...

随机推荐

  1. 阿里云sdk调用

    slb调用 环境包安装 pip install alibabacloud_credentials  --trusted-host mirrors.aliyun.com  -i  http://mirr ...

  2. 从 p12 格式 SSL 证书解出 pem 格式公钥私钥给 Postman 使用

    目的 Postman 的(非 Chrome 扩展版的)app 并不能读取系统中的客户端证书,这种调试要发送客户端证书的 https 请求的时候就得自己另外设置.系统直接导出证书有 cer 和 p12 ...

  3. PhiData 一款开发AI搜索、agents智能体和工作流应用的AI框架

    引言 在人工智能领域,构建一个能够理解并响应用户需求的智能助手是一项挑战性的任务.PhiData作为一个开源框架,为开发者提供了构建具有长期记忆.丰富知识和强大工具的AI助手的可能性.本文将介绍Phi ...

  4. Pandas学习之路【3】

    新增列的一些操作 1.新增一个列,直接给列赋值 # 取所有行,新增的列为new_col df.loc[:, 'new_col'] = 100 2.使用df.apply方法给新增的列赋值 def get ...

  5. 使用 Microsoft Edge WebDriver 自动执行和测试 WebView2 应用 Selenium

    https://learn.microsoft.com/zh-cn/microsoft-edge/webview2/how-to/webdriver

  6. dotnet c# samples core nativeaot NativeLibrary

    如何在 System.Text.Json 中使用源生成 https://learn.microsoft.com/zh-cn/dotnet/standard/serialization/system-t ...

  7. matplotlib学习:搞明白plt. /ax./ fig

    原文章一:https://zhuanlan.zhihu.com/p/93423829,原文章二:https://jishuin.proginn.com/p/763bfbd23e20    感谢作者的讲 ...

  8. ReplayKit2:声音回调时间戳问题

    一.ReplayKit2 框架回调中 视频.micphone声音.系统声音三路回调 - (void)processSampleBuffer:(CMSampleBufferRef)sampleBuffe ...

  9. itest work 开源接口测试&敏捷测试管理平台 9.5.0 GA_u3,优化及修复关键 BUG

    (一)itest work 简介 itest work (爱测试)  一站式工作站让测试变得简单.敏捷,"好用.好看,好敏捷" ,是itest wrok 追求的目标.itest w ...

  10. 如何保留 Excel 表头和第一行数据并追加 CSV 数据

    准备工作 在开始之前,确保你的 Python 环境中已经安装了 openpyxl 和 pandas 库.可以使用以下命令进行安装: pip install openpyxl pandas 第一步:编写 ...