众所周知,B站是学习网站

最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。

值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的例子类比)。

Up主的名字:新石器公园

推荐一看。

接下来聊聊感想

我是怎么发现这枚宝藏Up主的呢?

源于最近使用metaso.cn搜了一下2024年热点研究方向:

然后挑了几个计算机领域比较相近的研究方向,挨个儿去B站搜索相关领域的视频,顺其自然就找到啦,然后科普视频就看得停不下来,感触比较深的是:

从去年开始,大模型爆发,很明显的一个现象是,随着国内相关政策的不断完善,开源生态也越来越成熟,产业界的跟进落地速度与也越来越快,相关的产品层出不穷。不过,大多数开发人员更关注上层使用,而对底层的细节关注比较少,比如下面几个问题看看你是否能够回答:

1. 大模型的参数是指什么?它和传统的神经网络有什么不同?

2. transformer的自注意力机制是指什么?

3. 扩散模型底层原理是怎样的?大模型为什么能生成视频?

向下扩展到底层技术:

1. 之前频频上新闻的室温超导技术,究竟有啥用?

2. 量子计算机是科学还是玄学?它如何提高计算效率?又会与大模型擦出怎样的火花?

3. 忆阻器与常见的模电器件有何不同?

这些问题,在Up主的科普视频都有解答,对于概念理解而言,是非常好的入门渠道。如果你说,这和我有啥关系?这难道不是科学家要关心的嘛?那向上扩展到应用层,看看以下问题你能否回答:

1. 大模型在工业中是如何发挥作用的?比如之前华为用在了采矿,现在又用在了炼钢,究竟是怎么做的?

2. 大模型在计算机业界,最常用的架构是怎样的?除了RAG,还有其他形式吗?大模型效果评价体系有哪些?

3. 内容向量化是指什么?维度又是什么含义?选取多少维度比较合适?

4. 文本的语义切分怎么做,才能保证效果最优?传统的chunk+overlap是否还有优化空间?用大模型直接做语义切分怎么样?

5. prompt调优有哪些手段?如何评估它们的效果?

是不是发现很多知识明明用了,但是不清楚背后的原理?或者知道原理但不知道如何表达出来?

其实,这都属于知识体系构建不完整的一种体现,很多知识都是一个个孤岛,没有连点成线,更别提连线成面了。

所以,我们要做的是:

1. 在工作之余,花点时间了解平时用到的技术底层原理,慢慢提升认知。这是向下扎根的过程;

2.多关注行业发展趋势,多接触业务领域人员,了解他们对于技术演化趋势的看法,这也很重要,往往决定了技术是否能够搭载产品被推广出去。这是向上生长的过程。

既然谈到了知识体系的构建,那就

再聊聊信息收集和处理的方法

最近逛知乎偶然看到的一个话题:

于是有幸拜读了回答的一篇长文,该文从各种角度分析了信息的获取、处理以及分析方式,具体可以去知乎查看,本文不再展开。

还有一本北大博士论文神作,名叫《中县干部》,网上有资源,可以学习下。

总体而言,可以理解为文章讲述了一套概念:找到渠道、了解各类实体、获取各类实体之间的交互关系,并持续关注实体交互关系的动态变化。这与计算机科学中常常提到的知识图谱或者图数据库的构建和更新操作非常相似。

你看,这个世界的很多东西都是相通的,所以多多思考,任督二脉就慢慢打通了。

时间有限,今天就先聊到这里吧,希望能给大家带来一些启发。

推荐一枚宝藏Up主,顺便聊聊感想的更多相关文章

  1. IE10 CSS Hack(顺便聊聊IE11的CSS Hack)

    一.特性检测:@cc_on 我们可以用IE私有的条件编译(conditional compilation)结合条件注释来提供针对ie10的Hack:该脚本里面的IE排除条件注释,以确保IE6-9不承认 ...

  2. mysql+mycat搭建稳定高可用集群,负载均衡,主备复制,读写分离

    数据库性能优化普遍采用集群方式,oracle集群软硬件投入昂贵,今天花了一天时间搭建基于mysql的集群环境. 主要思路 简单说,实现mysql主备复制-->利用mycat实现负载均衡. 比较了 ...

  3. 【DNS】简单聊聊DNS如何工作

    随便聊聊 我们知道,网络上传输的数据包是一层一层的包起来的,典型的是mac地址层,ip层,tcp/udp层,应用层数据 这么几个层,那用户在浏览器中打开www.baidu.com数据包如何传到baid ...

  4. 聊聊CSS postproccessors

      阿里妈妈 @一丝 准备发布其CSSGrace,即CSS后处理插件,于是顺便聊聊CSS postprocessors. 从Rework说起 Rework是TJ大神开发的CSS预处理框架.但为什么会出 ...

  5. 企业级-Mysql双主互备高可用负载均衡架构(基于GTID主从复制模式)(原创)

    前言:          原理与思想        这里选用GTID主从复制模式Mysql主从复制模式,是为了更加确保主从复制的正确性.健康性与易配性.这里做的是两服务器A,B各有Mysql实例331 ...

  6. 一般来说,主方法main()结束的时候线程结束

    suspend()是将一个运行时状态进入阻塞状态(注意不释放锁标记).恢复状态的时候用resume().Stop()指释放全部. 这几个方法上都有Deprecated标志,说明这个方法不推荐使用. 一 ...

  7. Hibernate主键生成策略详解

    转载自:http://blog.csdn.net/wanghuan203/article/details/7562395 hibernate提供的主键生成策略,使我们可以在实体类的映射xml文件中设定 ...

  8. 从实例看hibernate的主键生成策略

    学习了hibernate会发现.hibernate中有实体类.实体类的映射文件.可是我们怎么样才干知道实体类的主键是如何的生成方式呢?hibernate提供的主键生成策略帮我们完美地解答了这个疑问.以 ...

  9. 推荐一款疫情期间适合在家办公的远程工具,仅需IP和密码轻松实现远程管理

    这段时间,受疫情影响,很多企业都开启了居家办公模式.但疫情突发,大多数人的办公资料没有拷贝打包,对于居家办公的人,尤其是运维人员来说,很难完成顺利完成工作. 像向日葵.teamviewer之类的远程软 ...

  10. 深入分析mysql为什么不推荐使用uuid或者雪花id作为主键

    前言:在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建 ...

随机推荐

  1. CentOS7离线部署JDK

    一. 下载JDK 官网地址: https://www.oracle.com/java/technologies/downloads/#java18 网盘地址: 链接:https://pan.baidu ...

  2. C 语言编程 — 基本语法

    目录 文章目录 目录 前文列表 C 语言 C 语言的版本 C 语言的特点 C 语言的优点 C 语言的缺点 搭建编程环境 基本语法 前文列表 <程序编译流程与 GCC 编译器> C 语言 C ...

  3. MindSpore梯度进阶操作

    技术背景 在MindSpore深度学习框架中,我们可以使用mindspore.grad对函数式编程的函数直接计算自动微分,也可以使用mindspore.ops.GradOperation求解Cell类 ...

  4. Chart.js (v2.9.4)概要介绍

    chart.js是一个非常优秀的开源图表插件,扩展非常灵活,同时也提供了大量的钩子函数,给与用户添加自定义插件,实现个性化的需求. 具体的优势特点,这里不详述,网上大把资料,现开始正式深入了解这个插件 ...

  5. 解决”将公司Linux服务器上的脚本导出到windows上打开串行的“问题

    目录 一.前期准备 二.回车转换 一.前期准备 1.在linux服务器上写一个简单的脚本. [root@node5 ~]# vim linux脚本.sh [root@node5 ~]# cat lin ...

  6. android studio 安装与配置

    android  studio  下载地址:http://www.android-studio.org/ 找一个存储空间,我在D盘上,建好如下目录 : 找到刚才在载的文件    android-stu ...

  7. sqlserver 把 某一列的所有值 变成 in 里面的内容

    SELECT  STUFF(( SELECT  ','+'''' +convert(VARCHAR, cDefine3)+'''' from rdrecord08 where dDate>'20 ...

  8. 006. Gitlab组件介绍

    Gitlab组件 [root@master tools]# gitlab-ctl status #检查服务状态 run: gitaly: (pid 26704) 2201s; run: log: (p ...

  9. C#开源实用的工具类库,集成超过1000多种扩展方法

    前言 今天大姚给大家分享一个C#开源(MIT License).免费.实用且强大的工具类库,集成超过1000多种扩展方法增强 .NET Framework 和 .NET Core的使用效率:Z.Ext ...

  10. 安装图形化界面时候报错 Transaction check error: file /boot/efi/EFI/centos from install of fwupdate-efi-12-5.el7.centos.x86_64 conflicts with file from package grub2-common-1:2.02-0.65.el7.centos.2.noarch

    报错 Transaction check error:file /boot/efi/EFI/centos from install of fwupdate-efi-12-5.el7.centos.x8 ...