定义 图像标注或语言生成图像问题把计算机视觉与自然语言处理联系在了一起,是广义的人工智能领域的一大难题.通常涉及到特征提取(用cnn提取出图像内部不为人类感知的向量特征)和语言模型建立.为图像提取文字信息可以节省大量的图像资料的人工标注成本,转为语音后可以方便视觉障碍者理解图片内容.从文字生成图像也有艺术创作和罪犯画像等实用领域.任务扩展为视频后,应用将更为广泛. codaLab基于MScoco数据集举行的相关竞赛排行榜,鹅厂方案暂时领先 相关数据集信息 任务描述 统一两个子任务图片特征提取和描…