非洲 AI 不发达,看看这份PPT,受益匪浅

非洲有大量的工程+机器学习人才,他们渴望学习、努力工作和进步。

大家好,我是老章

看到我关注的一位博主在首届非洲 @LangChainAI 聚会上的一个演示PPT,主题是“使用 LangChain 构建生产就绪的 LLM 应用程序” 。

很好奇在非洲推广AI、LLM会讲些什么,但是没有找到视频,只有一份PPT。

这里就截取其中几张,稍微扩展看看都有哪些内容。

PPT地址:https://docs.google.com/presentation/d/1LB_0NO-7WUXe0HM37ZHi8QHb-yRPWso4-UBBQBDEWo8/edit#slide=id.g2a3bfdd56cb_0_61

如果需要原版可以微信(mindszhang)找我要一下

这里介绍了多模态的重要性,因为大量信息包含在图像(视频也可以视作图像)和表格中。

PPT中有个来源链接:https://cloudedjudgement.substack.com/p/clouded-judgement-111023

这篇文章由Jamin Ball撰写,涵盖了关于OpenAI和Datadog近期发展的分析以及软件即服务(SaaS)公司的市场表现和估值,作者预测2024年将是AI应用的爆发之年

这张片子标题是“纯RAG会失败”,RAG(检索增强生成)这个前几天我在介绍吴恩达新课中有介绍。

配图是pdf chatbot 的架构图,这个项目是一个使用GPT-4和LangChain创建的聊天机器人,专门设计来处理和回应关于大型PDF文档的查询。用户可以通过这个聊天机器人提出问题,它会通过理解和检索PDF文档中的内容来回答这些问题。项目的技术栈包括LangChain、Pinecone、Typescript、OpenAI和Next.js。LangChain是一个框架,用于构建可扩展的AI/LLM应用程序和聊天机器人。Pinecone是一个向量存储系统,用于存储嵌入向量和文本形式的PDF文档,以便于后续检索相似文档。

项目地址:https://github.com/mayooear/gpt4-pdf-chatbot-langchain

标题:各种多模态RAG解决方案

介绍了利用多向量检索器来达到这个效果的方法:

  • Option 1:

    使用多模态嵌入(如 CLIP)来嵌入图像和文本

    利用相似性搜索检索图像和文本

    将原始图像和文本块传递给多模态大语言模型以合成答案
  • Option 2:

    使用多模态大语言模型(如 GPT-4V、LLaVA 或 FUYU-8b)从图像中生成文本摘要

    嵌入并检索文本

    将文本块传递给大语言模型以合成答案
  • Option 3:

    使用多模态大语言模型(如 GPT-4V、LLaVA 或 FUYU-8b)从图像中生成文本摘要

    将图像摘要嵌入并与原始图像的引用一起检索

    将原始图像和文本块传递给多模态大语言模型以合成答案

标题:多模态RAG基准测试,介绍三种方案基准测试的表现。

数据来源:https://smith.langchain.com/public/b738420f-3cd5-46c4-a0e1-894aff3cf37e/d

这页PPT重点介绍第三种方案并付了示例代码。

  • 使用 Unstructured 来解析文档(PDFs)中的图像、文本和表格。
  • 使用带有 Chroma 的多向量检索器来存储原始文本和图像以及它们的摘要以便检索。
  • 使用 GPT-4V 进行图像摘要(用于检索)以及从图像和文本(或表格)的联合审查中合成最终答案。

示例代码:https://github.com/langchain-ai/langchain/blob/master/cookbook/Multi_modal_RAG.ipynb

这里演示了利用 Chroma 实现了多模态 RAG,并且整合了多模态 OpenCLIP 的嵌入功能以及 OpenAI 的 GPT-4V 技术。

示例代码:https://github.com/langchain-ai/langchain/tree/master/templates/rag-chroma-multi-modal

后面几张PPT演示了示例代码的执行结果,使用自然语言检索相关图片。

怎么样?非洲AI真的不发达吗?

非洲 AI 不发达,看看这份PPT,受益匪浅的更多相关文章

  1. AI的博弈论,一份插图教程

    介绍 我想先问一个简单的问题--你能认出下图中的两个人吗? 我肯定你说对了.对于我们这些早期数学发烧友来说,电影<美丽心灵>(A Beautiful Mind)已经深深地印在了我们的记忆中 ...

  2. 如何做一份能忽悠投资人的PPT

    游侠近日发布的一款电动汽车引发全民吐槽,被人们嘲讽为“靠一份PPT忽悠投资人”.这类情形可以回溯至去年的锤子手机发布会.如今,吐槽的开始散去,我们可以静下心来吸收点干货,我们对比了锤子手机发布会的PP ...

  3. 我是小白,做PPT像流水账,怎么做一份重点突出的PPT?

    1.PPT的封面不要只写标题,还要在显眼的位置写上你的核心观点.比如,你之前做的PPT封面标题是<A产品市场前景分析>,现在不妨加上一个副标题<红海市场中需要找到更多本产品卖点> ...

  4. [办公自动化]一次制作、多场合多次使用的PPT

    面试或汇报总结时,你可能需要制作一份PPT来介绍自己.但是这些场合你不一定能讲完所有的内容. 你可以尝试分1分钟.3分钟.5分钟.10分钟的版本来准备. 使用同一份PPT. 没错. 在office20 ...

  5. 张小龙《微信背后的产品观》之PPT完整文字版

    微信回顾 433天,一亿用户 成为移动互联网的新入口 启动(2010年11月19日) 用户数突破1亿 1.0 1月26日 2.0 5月10日 语音对讲 2.5 8月3日 查看那附近的人 3.0 10月 ...

  6. 怎样做出优秀的扁平化设计风格 PPT 或 Keynote 幻灯片演示文稿?(装)

    不知道你有没有想过,为什么很人多的扁平化 PPT 是这个样子: 或者是这样: 然而,还有一小撮人的扁平化 PPT 却拥有那么高颜值: 为什么会产生这么大的差距呢?丑逼 PPT 应该如何逆袭成为帅逼呢? ...

  7. 《工作型PPT设计之道》培训心得

    参加包翔老师的“工作型PPT设计之道>培训,颇多心得,后来为部门新员工和同组同事做了转化培训,将心得整理成一份PPT讲义,效果颇佳.现将主要心得整理于此.因时间仓促,24条心得有拼凑之嫌,有待今 ...

  8. C# 实现对PPT文档加密、解密以及重置密码的操作

    工作中我们会使用到各种各样的文档,其中,PPT起着不可或缺的作用.一份PPT文档里可能包含重要商业计划.企业运营资料或者公司管理资料等.因此,在竞争环境里,企业重要资料的保密工作就显得尤为重要,而对于 ...

  9. 不容错过的超赞项目管理PPT

    不容错过的超赞项目管理PPT(转载) 大公司的一个好处,是各个领域都有牛人,可以为你提供经验分享交流.腾讯庞大的培训体系更是保证了:如果你想学点什么东西,你总可以学到.腾讯内部资源30页PPT曝光 — ...

  10. [转]一文读懂《梁宁·产品思维30讲》最精华内容(含全套PPT)

    http://chuansong.me/n/2294260949029 8 年前,我的主业是产品经理,产品思维改变了我认识世界的方式,让我明白司空见惯的设计,也有其底层逻辑. 几年后我接触培训.运营自 ...

随机推荐

  1. WebGL初接触

    有感于在不少jd中看到关于WebGL的内容,想起来之前在高程中还没看完的canvas,就匆匆把剩余的一点看完了,高程中的内容还是皮毛,就属于很基础的.概念性的东西. WebGL 画布的3D上下文.不是 ...

  2. 旋转矩阵(leetcode4.7每日打卡)

    给你一幅由 N × N 矩阵表示的图像,其中每个像素的大小为 4 字节.请你设计一种算法,将图像旋转 90 度. 不占用额外内存空间能否做到?   示例 1: 给定 matrix = [  [1,2, ...

  3. 全面的.NET微信网页开发之JS-SDK使用步骤、配置信息和接口请求签名生成详解

    JSSDK使用步骤 步骤一:绑定安全域名: 先登录微信公众平台进入"公众号设置"的"功能设置"里填写"JS接口安全域名". 步骤二:引入JS ...

  4. [UOJ216][UNR#2 2A] Jakarta Skyscrapers

    印尼首都雅加达市有 $10^{18}$ 座摩天楼,它们排列成一条直线,我们从左到右依次将它们编号为 $1$ 到 $10^{18}$ .除了这 $10^{18}$ 座摩天楼外,雅加达市没有其他摩天楼. ...

  5. 重磅:谷歌发布最强大AI模型【Google Gemini】

    一.前言 北京时间 2023年12 月 13 日Google 发布了最新的 Gemini Pro模型,并且提供了 API 访问. 一个更好的消息是:Gemini Pro 可免费使用.赶紧体验起来吧~ ...

  6. CompletableFuture进阶

    CompletableFuture进阶 1.异步任务的交互 异步任务交互指将异步任务获取结果的速度相比较,按一定的规则( 先到先用 )进行下一步处理. 1.1 applyToEither applyT ...

  7. javaScript正则截取自定义标签-javascript-zheng-ze-jie-qu-zi-ding-yi-biao-qian

    title: javaScript正则截取自定义标签 date: 2021-12-29 17:31:48.448 updated: 2021-12-29 17:31:48.448 url: https ...

  8. Ubuntu 下建立 eclipse 启动图标,解决ADT没有菜单栏问题(转载)

    原文地址 怎么在这应用程序里边建立图标$sudo gedit /usr/share/applications/Eclipse.desktop输入以下代码 [Desktop Entry]Name=Ecl ...

  9. 放弃JavaFx开发学习

    放弃JavaFx开发学习 一开始学学习JavaFx是想用java写个小游戏,后来学者JavaFx越来越深,发现坑也越来越多,不禁感叹:JavaFx果然是要抛弃的UI玩儿,UI开发还是用react na ...

  10. 七天.NET 8操作SQLite入门到实战 - 第七天BootstrapBlazor UI组件库引入(1)

    前言 由于第七天Blazor前端页面编写和接口对接的内容比较的多,所以这一章节将会分为三篇文章来进行讲解,大家可以认为分为早.中.晚来进行阶段性学习,从而提高学习效率. 七天.NET 8 操作 SQL ...