1.        SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning(2017 CVPR) 主要研究方向:大多数现有的基于注意力的图像字幕模型只考虑了空间特征,本文是对同一层的feature map(特征图)加入了权重考虑. 2.        Knowing When to Look: Adaptive Attention via A Visual Sentine…
1.        SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text(2018 CVPR) 主要研究方向:本论文主要是做语言风格,就是对同一张图片有多种描述. 2.        Neural Baby Talk(2018 cvpr) 主要研究内容:对于图片的描述更多的应该是基于图像内容,而不是基于语言模型去推理:如果是非常见场景,那么模型就差强人意. 3.        Bottom-Up a…
. 过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含“伪代码”.这是今年 AAAI 会议上一个严峻的报告. 人工智能这个蓬勃发展的领域正面临着实验重现的危机,就像实验重现问题过去十年来一直困扰着心理学.医学以及其他领域一样.最根本的问题是研究人员通常不共享他们的源代码. 可验证的知识是科学的基础,它事关理解.随着人工智能领域的发展,打破不可复现性将是必要的. Learning Feature Py…
1.MSCap: Multi-Style Image Captioning with Unpaired Stylized Text 生成多种风格的caption 当前的image captioning systems的问题:生成的caption是很相对很中性,不能体现人类语言风格的多种多样 面临的困难:得到配对的风格和对应的caption是很昂贵的,所以本论文只是使用image和对应的多个caption,最后加一个分类器,对caption分类 整体框架:Caption Generator输入图像…
http://openaccess.thecvf.com/content_cvpr_2017/papers/Kodirov_Semantic_Autoencoder_for_CVPR_2017_paper.pdf Semantic Autoencoder for Zero-Shot Learning,Elyor Kodirov Tao Xiang Shaogang Gong,Queen Mary University of London, UK,{e.kodirov, t.xiang, s.go…
1.Show and Tell: A Neural Image Caption Generator Google团队的成果 整体处理流程: 1)通过CNN提取到图片的特征,简称feature. 2)而后将feature输入到LSTM中,生成第一个词S0 3)而后每个词Si的生成只需要上一个生成的词Si-1的对应的embedding,直到生成最后一个特殊符号 框架: 生成词的方法 Sampling:softmax取最大值 BeamSearch:每次生成一个单词,保存到目前为止生成的概率最大的K个句…
CVPR 2020 共收录 1470篇文章,根据当前的公布情况,人工智能学社整理了以下约100篇,分享给读者. 代码开源情况:详见每篇注释,当前共15篇开源.(持续更新中,可关注了解). 算法主要领域:图像与视频处理,图像分类&检测&分割.视觉目标跟踪.视频内容分析.人体姿态估计.模型加速.网络架构搜索(NAS).生成对抗(GAN).光学字符识别(OCR).人脸识别.三维重建等方向. 目录如下: 总目录 图像处理 Deep Image Harmonization via Domain Ve…
main.py import pymysql import re import requests # 连接数据库函数 from bs4 import BeautifulSoup def insertCvpr(value): try: db = pymysql.connect(host="localhost", user="root", password="password", database="article",charse…
完整录用论文官方链接:http://www.pamitc.org/cvpr13/program.php 过段时间CvPaper上面应该会有正文链接 今年有关RGB-D摄像机应用和研究的论文渐多起来了. 当然,自己还是比较关心Tracking方面的Papers.从作者来看,一作大部分为华人,而且有不少在Tracking这个圈子里相当有名的牛,比如Ming-Hsuan Yang,RobertCollins等(中科院到阿大的Xi Li也是非常活跃,从他的论文可以看出深厚的数学功底,另外ChunhuaS…
main.py #保存单个界面数据 def getInfo(url): # url='https://openaccess.thecvf.com/WACV2021' header={ 'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Mobile Safari/537.36' } html=…