SciTech-BigDataAIML-LLM-Transformer Series

Sampling(采样)

  • Sampling Rate(采样速率)

    单位时间采集样本的数量, 有单位.

    例视频以frame/second为单位, 音频的 kbps

  • Sampling Resolution(采样精度)

    Digitalize(数量化) a Sample(采集到的样本)时,

    表示“信号值域”所用的bit(位数)。

    例如:

    • 音频 的 16bit, 24bit, 32bit 就是指其 "采样精度";
    • Panel(显示屏)的 dpi(Dots Per Inch);
    • Color Channel(色彩通道)的8bit与10bit
    • 视频设备 的 FHD, 2K, 4K, 8K 也是指其“显示的精度”.
  • Resampling(重采样)

    不同制式之间进行转换, 有时需要Resampling.

    “高”转“低”容易, 但“低”转“高”时最需要尽可能保障还原度.

Vectorize(向量化) and Matrixize(矩阵化) 不同数据

常用的\(\large Input\)数据类型有:

  • Text文本: Word Embedding就可以转化Word Seq.为Matrix(Vector Seq.)

    将每一word 变换为一 Vector,

    就可以将整段Text(Word Seq.)变化为一 Matrix(Vector Seq.).

  • Audio语音, Picture图片, Video视频,

    这三类都可采用 "Stepping Slip Window" 或"CNN"方式,

    并Sampling a frame( OR Window) 来将each frame(OR window)转化成一 Vector,

    最终将数据转化成一 Matrix(Vector Seq.).

    如下图: 对audio音频进行Vectorize与Matrixize,

    将 Slip Window设为25ms时长, Step为10ms; 对frame进行Sampling 得到其 Vector.

    将完整的audio音频 转换为一 Matrix. 如一段 1s音频 转换为长100的Matrix(Vector Seq.).

  • Graph图结构(如社交网图与分子结构图)、Object二进制对象(如可执行文件).

    可将 a Node 用 a Vector 表示, 于是整个 "Graph" "转化为一个 "Matrix(Vector Seq.)"

    比如:

    • Social Network Graph 将 a Node 的 Profile(账户信息) 表示为一 "Vector";

    • Molecular Structure Graph:

      将 an Atom 表示为一个One-Hot vector(也可 Embedding with Context),

      进一步可将 Molecule Structure 表示为一 Matrix(Vector Seq.).

常用的\(\large Output\)数据类型有:

  1. \(\large N:N\) 输入 N长 的 Vector Seq., 输出 N长的 label Seq., 每个vector对应一个label.

  2. \(\large N:1\) 输入 N长 的 Vector Seq., 输出 unique label

  3. \(\large N:M\) 输入 N长 的 Vector Seq., 输出 M长(模型决定长度)的 Vector Seq.

    著名的 \(\large Seq2Seq\) \(\large Output\)模型. 经典应用是: Translation(机器翻译任务).

SciTech-BigDataAIML-LLM-Transformer Series-Input+Output-Sampling + Vectorize and Matrixize 不同类型的Input数据(Text/Picture/Audio/Video/Graph:如社交网与分子图)的更多相关文章

  1. read()、write()返回 Input/output error, Device or resource busy解决

    遇到的问题,通过I2C总线读.写(read.write)fs8816加密芯片,报错如下: read str failed,error= Input/output error! write str fa ...

  2. PHP-FPM-failed to ptrace(PEEKDATA) pid 123: Input/output error

    If you're running PHP-FPM you can see these kind of errors in your PHP-FPM logs. $ tail -f php-fpm.l ...

  3. NFS挂载异常 mount.nfs: Input/output error

    [root@localhost ~]# vi /etc/exports #增加/nfs 192.168.10.132(rw,no_root_squash,no_all_squash,async) [r ...

  4. BIOS(Basic Input/Output System)是基本输入输出系统的简称

    BIOS(Basic Input/Output System)是基本输入输出系统的简称 介绍 操作系统老师说,平时面试学生或者毕业答辩的时候他都会问这个问题,可见这个问题对于计算机专业的学生来说是如此 ...

  5. Angular 个人深究(三)【由Input&Output引起的】

    Angular 个人深究(三)[由Input&Output引起的] 注:最近项目在做别的事情,angular学习停滞了 1.Angular 中 @Input与@Output的使用 //test ...

  6. Docker 在转发端口时的这个错误Error starting userland proxy: mkdir /port/tcp:0.0.0.0:3306:tcp:172.17.0.2:3306: input/output error.

    from:https://www.v2ex.com/amp/t/463719 系统环境是 Windows 10 Pro,Docker 版本 18.03.1-ce,电脑开机之后第一次运行 docker ...

  7. dpdk EAL: Error reading from file descriptor 23: Input/output error

    执行test程序时输出: EAL: Error reading from file descriptor 23: Input/output error 原因: 在虚拟机添加的网卡,dpdk不支持导致的 ...

  8. html5 填表 表单 input output 与表单验证

    1.<output>     Js计算结果 <form oninput="res.value = num1.valueAsNumber*num2.valueAsNumber ...

  9. mount_cd9660:/dev/acd0: Input/output error

    mount -t cd9660 /dev/acd0 /cdrom g_vfs_done():acd0[READ(offset32768, length=204]error =5 mount_cd966 ...

  10. Input/output subsystem having an integrated advanced programmable interrupt controller for use in a personal computer

    A computer system is described having one or more host processors, a host chipset and an input/outpu ...

随机推荐

  1. 支持命令行输入中文(例如redis-cli输入中文)

    修改 cmd 控制台默认代码页编码的几种方法[GBK.UTF-8]_FKNIGHT 的博客-CSDN博客_修改cmd编码 1.进入redis-cli.exe所在文件夹 2.在路径栏输入cmd回车 3. ...

  2. 工具 | MemShellParty

    0x00 简介 MemShellParty是一键常见中间件框架内存马生成工具.一键生成常见中间件框架内存马,让内存马测试变得简单高效,打造内存马的全方位学习平台 下载地址: MemShellParty ...

  3. 【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位?

    大家好,我是"蒋点数分",多年以来一直从事数据分析工作.从今天开始,与大家持续分享关于数据分析的学习内容. 本文是第 3 篇,也是[SQL 周周练]系列的第 3 篇.该系列是挑选或 ...

  4. 【HUST】网络攻防实践|6_物联网设备固件安全实验|实验三 FreeRTOS-MPU 保护绕过

    文章目录 实验三 FreeRTOS-MPU 保护绕过 实验要求 子任务1 逆向分析StartFreeRTOS 打印 Flag 函数名称和地址 用于提权的函数名称和地址 填写的代码 模拟运行截图 **附 ...

  5. anaconda 报错之Solving environment: failed

    1问题: 在新电脑上重装了anaconda,发现创建一个新环境都报错"Solving environment: failed",已经添加了清华源,还是报错,查找了很多答案都不能解决 ...

  6. excel/wps, 转code128字体宏, 部分字符串出现空格, 导致条码断裂无法扫描的解决方案

    原宏是网上抄的, 传播比较广的那个. 后来发现, 部分条码出现空格断裂, 导致PDA无法扫描, 经搜索在一个帖子里, 发现是因为: 宏计算条码时, 会出现校验位刚好是空格的情况, 而空格在code12 ...

  7. Ubuntu 初始设置:启用 root 账户、启用密码登录、启用Key登录、ssh超时、修改主机名

    新购买的Ubuntu服务器,默认禁用了root账户,如果想启用root账户的公钥登录,请使用以下方法: vi /etc/ssh/sshd_config # 编辑ssh配置文件 PermitRootLo ...

  8. 【2020.11.25提高组模拟】树的解构(deconstruct) 题解

    [2020.11.25提高组模拟]树的解构(deconstruct) 题解 题目描述 给一棵以\(1\)为根的外向树,进行\((n-1)\)次删边操作,每次都会从没有删掉的边中等概率地删掉一条边\(a ...

  9. 阿里微服务解决方案-Alibaba Cloud之集成Nacos(服务注册与发现)(三)

    一.集成 Nacos(服务注册与发现) 1.1 下载 Nacos Nacos下载地址 1.2 下载后解压到本地 1.3 启动 Nacos 启动成功界面 输入 http://127.0.0.1:8848 ...

  10. Ant Design Mobile 覆盖默认的样式。

    直接在css中这样写是不行的,完全没有效果. .am-list-item.am-input-item { height: 36px; min-height: 30px; } 要像下面这样,加上glob ...