计算机视觉--CV技术指南文章汇总
前言
本文汇总了过去本公众号原创的、国外博客翻译的、从其它公众号转载的、从知乎转载的等一些比较重要的文章,并按照论文分享、技术总结三个方面进行了一个简单分类。点击每篇文章标题可阅读详细内容
欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
今年是进入计算机视觉领域的第四年,做公众号的第一年,写了不少原创文章,从国外博客上翻译了不少我认为比较不错的文章,也从知乎上找了不少不错的文章在经作者授权后转载到公众号。
整体上来说,这一年基本保持初心,始终在做一个专注于计算机视觉技术总结、最近技术跟踪、最新论文分享和经典论文解读的公众号。公众号从未采用夸大的标题,宁可不更,也不会强行找一篇无用文章、无用新闻来更新。
今年公众号创立了一个计算机视觉的微信交流群,目前群内氛围还算不错,基本有问有答,想要加群的朋友可以扫描文末的二维码添加编辑微信,经邀请后加群。
与此同时,公众号与一部分互联网企业进行了合作,发布一些计算机视觉的招聘岗位,读者可通过公众号直接内推给HR。
今年主要更新的内容是论文分享和技术总结。
论文分享方面主要介绍论文的研究背景、创新思路和简要介绍创新方法。基本不涉及到代码解读,只提供官方代码的链接,这主要是考虑到对读者负责。计算机是一个对动手能力要求特别高的领域,如果你觉得论文中的方法可以用在你自己的项目或研究上,你应该自己去结合源码完整地阅读整篇论文,这是一种做研究或做项目的正确态度。如果习惯于阅读别人解读得非常详尽的文章,无异于衣来伸手饭来张口,白白丢失了锻炼自己能力的机会,其结果将是始终不具备自学的能力,做事效率极低。
技术总结方面主要对现有的一些技术进行总结,如目标检测、语义分割中的常见的特征金字塔、注意力机制等,神经网络中的初始化方法、归一化方法、损失函数等,各个方向上的一些技术等。通过这些总结,读者能够非常清晰地了解这些方法之间的优缺点,改进思路等。吐槽一句,几乎每篇技术总结都花费了将近两三天的时间,一天时间全面搜寻相关文章,尽可能总结全面,一天时间思考如何写,一天时间完成整体写作,每次更新完一篇技术总结文章,都极其劳累,连玩手机的精力都没有。
接下来一年将继续进行论文分享、技术总结,此外,将会扩展一些代码技术方面的内容。今年始终没有面向读者约稿,这是因为公众号收入比较低,给不出稿费。
如果有读者愿意免费分享的话,可以向公众号提供自己原创的一些技术总结、经验、论文解读等文章,让更多人一起学习进步,共同推动计算机视觉领域的发展。与此同时,读者朋友们也可以把公众号当作是一个自我激励的平台,如一周或两周分享一篇文章到公众号,让自己始终保持不断输入不断输出的状态。公众号也会记录大家供稿的次数,日后若公众号有比较不错的收入,将会向那些给公众号多次供稿的读者们发一些稿费。
补充一句:希望大家养成锻炼身体的习惯,每次更新公众号,都要在座位上四五个小时一动不动,实在辛苦。如果读者朋友们看到觉得不错的文章,可以文末点个赞,会让我更有创作动力。
论文分享
ICCV2021 | 简单有效的长尾视觉识别新方案:蒸馏自监督(SSD)
ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer
ICCV2021 | SOTR:使用transformer分割物体
ICCV2021 | PnP-DETR:用Transformer进行高效的视觉分析
ICCV2021 | Vision Transformer中相对位置编码的反思与改进
ICCV2021 | 重新思考视觉transformers的空间维度
ICCV2021 | 用于视觉跟踪的学习时空型transformer
ICCV2021 | 渐进采样式Vision Transformer
ICCV2021 | Tokens-to-Token ViT:在ImageNet上从零训练Vision Transformer
ICCV2021 | 医学影像等小数据集的非自然图像领域能否用transformer?
ICCV2021 | TransFER:使用Transformer学习关系感知的面部表情表征
ICCV2021 | SMCA:即插即用的共同注意力模型,可使DETR收敛加速10倍
ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别
ICCV2021 Oral | AdaFocus:利用空间冗余性实现高效视频识别
CVPR2021 | TrivialAugment:不用调优的SOTA数据增强策略
CVPR2021 | SETR: 使用 Transformer 从序列到序列的角度重新思考语义分割
CVPR2021 | TransCenter: transformer用于多目标跟踪算法
CVPR2021 | Transformer用于End-to-End视频实例分割
CVPR2021 | 重新思考BatchNorm中的Batch
CVPR2021 | 华为诺亚实验室提出Transformer in Transformer
CVPR2021 | 继SE,CBAM后的一种新的注意力机制Coordinate Attention
CVPR2021 | TimeSformer-视频理解的时空注意模型
CVPR2021 | PVT--无卷积密集预测的多功能backbone
CVPR2021 | 华为诺亚实验室提出Transformer in Transformer
CVPR2021 | 行人搜索中的第一个anchor-free模型
Panoptic SegFormer:端到端的 Transformer 全景分割通用框
MobileVIT:轻量级视觉Transformer+移动端部署
AAAI2021 | 任意方向目标检测中的动态Anchor学习
NeurlPS2021 | WBF:继NMS和Soft-NMS后的过滤候选框新方法
ML2021 | PatrickStar:通过基于块的内存管理实现预训练模型的并行训练
OCR开源神器PaddleOCR再升级:效果提升7%、速度增加220%
经典论文系列 | 缩小Anchor-based和Anchor-free检测之间差距的方法:自适应训练样本选择
经典论文系列 | Group Normalization & BN的缺陷
经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷
经典论文系列 | NLN: Non-Local Neural Network
经典模型系列 | Inception系列之Inception_v1
经典模型系列 | Inception系列之Inception_v2-v3
经典模型系列 | Inception系列之Inception_v4
经典模型系列 | MobileNet系列之MobileNet_v1
经典模型系列 | MobileNet系列之MobileNet_v2
经典模型系列 | MobileNet系列之MobileNet_v3
经典模型系列 | ShuffleNet系列之ShuffleNet_v1
经典模型系列 | ShuffleNet系列之ShuffleNet_v2
视频理解综述:动作识别、时序动作定位、视频Embedding
欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
在公众号中回复关键字 “入门指南“可获取计算机视觉入门所有必备资料。

技术总结
神经网络的初始化方法总结 | 又名“如何选择合适的初始化方法”
PyTorch和TensorFlow在模型可用性、部署便捷度和生态系统方面的对比
工程Tricks | PyTorch有什么节省显存的小技巧?
使用 PyTorch Lightning 将深度学习管道速度提高 10 倍
使用 Ray 将 PyTorch 模型加载速度提高 340 倍
PyTorch 中的 ModuleList 和 Sequential: 区别和使用场景
资源分享 | PyTea:不用运行代码,静态分析pytorch模型的错误
资源分享 | SAHI:超大图片中对小目标检测的切片辅助超推理库
可视化的BatchNorm--它的工作方式以及为什么神经网络需要它
资源分享 | Glint360K: 全球最大人脸数据集, 共36万类别、1800万图像
资源分享 | 一个集图像分割的所有论文、benchmarks、数据集、项目代码等资源的github项目
在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进?
欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
在公众号中回复关键字 “入门指南“可获取计算机视觉入门所有必备资料。
计算机视觉--CV技术指南文章汇总的更多相关文章
- CV技术指南免费版知识星球
最近公众号的交流群满了,我们决定搞一个免费的知识星球,让大家在里面交流.以往都是我们写原创,大家阅读,读者之间没什么交流.与此同时,在CV技术指南交流群里,大部分问题都得到了很好地解决,但从来没有 ...
- Go 开发关键技术指南 | 敢问路在何方?(内含超全知识大图)
作者 | 杨成立(忘篱) 阿里巴巴高级技术专家 Go 开发关键技术指南文章目录: 为什么你要选择 Go? Go 面向失败编程 带着服务器编程金刚经走进 2020 年 敢问路在何方? Go 开发指南大图 ...
- 电子技术经典资料汇总:PCB设计篇
电子技术经典资料汇总:PCB设计篇,下面的链接是一个一个的文件下载的,也是压缩包的内容,只不过我把他们给汇总成了一个压缩包,方便大家下载,还有更多电子技术必备基础资料,通信无线类的,C语言篇的,关于电 ...
- Go 开发关键技术指南 | 为什么你要选择 GO?(内含超全知识大图)
作者 | 杨成立(忘篱) 阿里巴巴高级技术专家 关注"阿里巴巴云原生"公众号,回复 Go 即可查看清晰知识大图! 导读:从问题本身出发,不局限于 Go 语言,探讨服务器中常常遇到的 ...
- (备忘)Nginx中文手册(技术指南第二版)
Nginx 常见应用技术指南[Nginx Tips] 第二版 目 录 一. Nginx 基础知识二. Nginx 安装及调试三. Nginx Rewrite四. Nginx Redirect五. Ng ...
- Go 开发关键技术指南 | Go 面向失败编程 (内含超全知识大图)
作者 | 杨成立(忘篱) 阿里巴巴高级技术专家 关注"阿里巴巴云原生"公众号,回复 Go 即可查看清晰知识大图! 导读:从问题本身出发,不局限于 Go 语言,探讨服务器中常常遇到的 ...
- CVPR2020文章汇总 | 点云处理、三维重建、姿态估计、SLAM、3D数据集等(12篇)
作者:Tom Hardy Date:2020-04-15 来源:CVPR2020文章汇总 | 点云处理.三维重建.姿态估计.SLAM.3D数据集等(12篇) 1.PVN3D: A Deep Point ...
- 贪心学院计算机视觉CV训练营
贪心学院计算机视觉CV训练营 任务 Notes 其他 任务1:机器学习.深度学习简介 Note1 任务2:深度学习的发展历史 Note2 任务3:现代深度学习的典型例子 Note3 任务4:深度学习在 ...
- ******IT公司面试题汇总+优秀技术博客汇总
滴滴面试题:滴滴打车数据库如何拆分 前端时间去滴滴面试,有一道题目是这样的,滴滴每天有100万的订单,如果让你去设计数据库,你会怎么去设计? 当时我的想法是根据用户id的最后一位对某个特殊的值取%操作 ...
随机推荐
- [BUUCTF]PWN——ciscn_2019_n_3
ciscn_2019_n_3 附件 步骤 例行检查,32位,开启了nx和canary保护 本地试运行一下,经典的堆题的菜单 3.32位ida载入 new(),申请了两个chunk,第一个chunk(1 ...
- [BUUCTF]REVERSE——[BJDCTF2020]BJD hamburger competition
[BJDCTF2020]BJD hamburger competition 附件 步骤: 例行检查,64位程序,无壳儿 由于unity是用C++开发的,这里就不用IDA了,直接用dnspy看源码 在B ...
- 【密码学】AES简单学习
欧拉函数 公式 φ(n)=(p-1)(q-1) 小于x并且和x互质的数的个数 相关概念 因数:a*b=c 那么就称 a.b 是 c 的因数 素数:一个数如果除了1与它本身之外没有其他的因数,那么 ...
- java 多线程 发布订阅模式:发布者java.util.concurrent.SubmissionPublisher;订阅者java.util.concurrent.Flow.Subscriber
1,什么是发布订阅模式? 在软件架构中,发布订阅是一种消息范式,消息的发送者(称为发布者)不会将消息直接发送给特定的接收者(称为订阅者).而是将发布的消息分为不同的类别,无需了解哪些订阅者(如果有的话 ...
- JENKINS中创建全局变量并在JOB中使用
配置了一个 "PASSWORD"的变量值 然后再脚本里面使用 注意这里必须要用双引号 不然不行
- java源码——文件读写和单词统计
本文要解决的问题:"键盘输入一段英语语句,将这段话写入content.txt中,然后输出这段话,并且统计语句中英文单词的数目以及各个单词出现的次数." 分析问题知,核心是文件读写和 ...
- 【LeetCode】1021. Best Sightseeing Pair 最佳观光组合(Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 日期 题目地址:https://leetcode.c ...
- 【LeetCode】504. Base 7 解题报告(Java & Python)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 内建库 BigInteger类 逐位计算 倍数相加 ...
- 【LeetCode】34. Find First and Last Position of Element in Sorted Array 解题报告(Python & C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 二分查找 日期 题目地址:https://leetc ...
- 【LeetCode】593. Valid Square 解题报告(Python)
[LeetCode]593. Valid Square 解题报告(Python) 作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 题目地 ...