SciTech-BigDataAIML-LLM-Transformer Series-Input+Output-Sampling + Vectorize and Matrixize 不同类型的Input数据(Text/Picture/Audio/Video/Graph:如社交网与分子图)
SciTech-BigDataAIML-LLM-Transformer Series
Sampling(采样)
Sampling Rate(采样速率)
单位时间采集样本的数量, 有单位.
例视频以frame/second为单位, 音频的 kbpsSampling Resolution(采样精度)
Digitalize(数量化) a Sample(采集到的样本)时,
表示“信号值域”所用的bit(位数)。
例如:- 音频 的 16bit, 24bit, 32bit 就是指其 "采样精度";
- Panel(显示屏)的 dpi(Dots Per Inch);
- Color Channel(色彩通道)的8bit与10bit
- 视频设备 的 FHD, 2K, 4K, 8K 也是指其“显示的精度”.
Resampling(重采样)
不同制式之间进行转换, 有时需要Resampling.
“高”转“低”容易, 但“低”转“高”时最需要尽可能保障还原度.
Vectorize(向量化) and Matrixize(矩阵化) 不同数据
常用的\(\large Input\)数据类型有:
Text文本: Word Embedding就可以转化Word Seq.为Matrix(Vector Seq.)
将每一word 变换为一 Vector,
就可以将整段Text(Word Seq.)变化为一 Matrix(Vector Seq.).Audio语音, Picture图片, Video视频,
这三类都可采用 "Stepping Slip Window" 或"CNN"方式,
并Sampling a frame( OR Window) 来将each frame(OR window)转化成一 Vector,
最终将数据转化成一 Matrix(Vector Seq.).
如下图: 对audio音频进行Vectorize与Matrixize,
将 Slip Window设为25ms时长, Step为10ms; 对frame进行Sampling 得到其 Vector.
将完整的audio音频 转换为一 Matrix. 如一段 1s音频 转换为长100的Matrix(Vector Seq.).
![]()
Graph图结构(如社交网图与分子结构图)、Object二进制对象(如可执行文件).
可将 a Node 用 a Vector 表示, 于是整个 "Graph" "转化为一个 "Matrix(Vector Seq.)"
比如:- Social Network Graph 将 a Node 的 Profile(账户信息) 表示为一 "Vector";
![]()
- Molecular Structure Graph:
将 an Atom 表示为一个One-Hot vector(也可 Embedding with Context),
进一步可将 Molecule Structure 表示为一 Matrix(Vector Seq.).
![]()
- Social Network Graph 将 a Node 的 Profile(账户信息) 表示为一 "Vector";
常用的\(\large Output\)数据类型有:
\(\large N:N\) 输入 N长 的 Vector Seq., 输出 N长的 label Seq., 每个vector对应一个label.
![]()
\(\large N:1\) 输入 N长 的 Vector Seq., 输出 unique label
![]()
\(\large N:M\) 输入 N长 的 Vector Seq., 输出 M长(模型决定长度)的 Vector Seq.
著名的 \(\large Seq2Seq\) \(\large Output\)模型. 经典应用是: Translation(机器翻译任务).
![]()
SciTech-BigDataAIML-LLM-Transformer Series-Input+Output-Sampling + Vectorize and Matrixize 不同类型的Input数据(Text/Picture/Audio/Video/Graph:如社交网与分子图)的更多相关文章
- read()、write()返回 Input/output error, Device or resource busy解决
遇到的问题,通过I2C总线读.写(read.write)fs8816加密芯片,报错如下: read str failed,error= Input/output error! write str fa ...
- PHP-FPM-failed to ptrace(PEEKDATA) pid 123: Input/output error
If you're running PHP-FPM you can see these kind of errors in your PHP-FPM logs. $ tail -f php-fpm.l ...
- NFS挂载异常 mount.nfs: Input/output error
[root@localhost ~]# vi /etc/exports #增加/nfs 192.168.10.132(rw,no_root_squash,no_all_squash,async) [r ...
- BIOS(Basic Input/Output System)是基本输入输出系统的简称
BIOS(Basic Input/Output System)是基本输入输出系统的简称 介绍 操作系统老师说,平时面试学生或者毕业答辩的时候他都会问这个问题,可见这个问题对于计算机专业的学生来说是如此 ...
- Angular 个人深究(三)【由Input&Output引起的】
Angular 个人深究(三)[由Input&Output引起的] 注:最近项目在做别的事情,angular学习停滞了 1.Angular 中 @Input与@Output的使用 //test ...
- Docker 在转发端口时的这个错误Error starting userland proxy: mkdir /port/tcp:0.0.0.0:3306:tcp:172.17.0.2:3306: input/output error.
from:https://www.v2ex.com/amp/t/463719 系统环境是 Windows 10 Pro,Docker 版本 18.03.1-ce,电脑开机之后第一次运行 docker ...
- dpdk EAL: Error reading from file descriptor 23: Input/output error
执行test程序时输出: EAL: Error reading from file descriptor 23: Input/output error 原因: 在虚拟机添加的网卡,dpdk不支持导致的 ...
- html5 填表 表单 input output 与表单验证
1.<output> Js计算结果 <form oninput="res.value = num1.valueAsNumber*num2.valueAsNumber ...
- mount_cd9660:/dev/acd0: Input/output error
mount -t cd9660 /dev/acd0 /cdrom g_vfs_done():acd0[READ(offset32768, length=204]error =5 mount_cd966 ...
- Input/output subsystem having an integrated advanced programmable interrupt controller for use in a personal computer
A computer system is described having one or more host processors, a host chipset and an input/outpu ...
随机推荐
- 支持命令行输入中文(例如redis-cli输入中文)
修改 cmd 控制台默认代码页编码的几种方法[GBK.UTF-8]_FKNIGHT 的博客-CSDN博客_修改cmd编码 1.进入redis-cli.exe所在文件夹 2.在路径栏输入cmd回车 3. ...
- 工具 | MemShellParty
0x00 简介 MemShellParty是一键常见中间件框架内存马生成工具.一键生成常见中间件框架内存马,让内存马测试变得简单高效,打造内存马的全方位学习平台 下载地址: MemShellParty ...
- 【SQL周周练】一句 SQL 如何帮助 5 个人买到电影院最好的座位?
大家好,我是"蒋点数分",多年以来一直从事数据分析工作.从今天开始,与大家持续分享关于数据分析的学习内容. 本文是第 3 篇,也是[SQL 周周练]系列的第 3 篇.该系列是挑选或 ...
- 【HUST】网络攻防实践|6_物联网设备固件安全实验|实验三 FreeRTOS-MPU 保护绕过
文章目录 实验三 FreeRTOS-MPU 保护绕过 实验要求 子任务1 逆向分析StartFreeRTOS 打印 Flag 函数名称和地址 用于提权的函数名称和地址 填写的代码 模拟运行截图 **附 ...
- anaconda 报错之Solving environment: failed
1问题: 在新电脑上重装了anaconda,发现创建一个新环境都报错"Solving environment: failed",已经添加了清华源,还是报错,查找了很多答案都不能解决 ...
- excel/wps, 转code128字体宏, 部分字符串出现空格, 导致条码断裂无法扫描的解决方案
原宏是网上抄的, 传播比较广的那个. 后来发现, 部分条码出现空格断裂, 导致PDA无法扫描, 经搜索在一个帖子里, 发现是因为: 宏计算条码时, 会出现校验位刚好是空格的情况, 而空格在code12 ...
- Ubuntu 初始设置:启用 root 账户、启用密码登录、启用Key登录、ssh超时、修改主机名
新购买的Ubuntu服务器,默认禁用了root账户,如果想启用root账户的公钥登录,请使用以下方法: vi /etc/ssh/sshd_config # 编辑ssh配置文件 PermitRootLo ...
- 【2020.11.25提高组模拟】树的解构(deconstruct) 题解
[2020.11.25提高组模拟]树的解构(deconstruct) 题解 题目描述 给一棵以\(1\)为根的外向树,进行\((n-1)\)次删边操作,每次都会从没有删掉的边中等概率地删掉一条边\(a ...
- 阿里微服务解决方案-Alibaba Cloud之集成Nacos(服务注册与发现)(三)
一.集成 Nacos(服务注册与发现) 1.1 下载 Nacos Nacos下载地址 1.2 下载后解压到本地 1.3 启动 Nacos 启动成功界面 输入 http://127.0.0.1:8848 ...
- Ant Design Mobile 覆盖默认的样式。
直接在css中这样写是不行的,完全没有效果. .am-list-item.am-input-item { height: 36px; min-height: 30px; } 要像下面这样,加上glob ...





