TinyMind 多标签图像分类竞赛之路

竞赛传送门：https://www.tinymind.cn/competitions/42

我们就是傻狗天仙配啦~

决赛排行榜：

这次比赛感谢第一名的 baseline：https://blog.csdn.net/guleileo/article/details/81946511

我们的代码基于这个baseline，省去了自己编写数据读取、评分准则的麻烦。

首先，我们将baseline的模型换成ResNet50、DenseNet201空模型效果不好；然后，我们选择了迁移学习，参考博客：https://blog.csdn.net/tsyccnh/article/details/78889838，后来将其InceptionV3换成InceptionResNetV2：

from keras.applications.inception_resnet_v2 import InceptionResNetV2,preprocess_input

base_model = InceptionResNetV2(weights='imagenet',include_top=False)

x = base_model.output

x = GlobalAveragePooling2D()(x)

x = Dense(,activation='relu')(x)

predictions = Dense(,activation='sigmoid')(x)

model = Model(inputs=base_model.input, outputs=predictions)

model.summary()

加入了imgaug库的数据增强：

from imgaug import augmenters as iaa

seq = iaa.Sequential([

    iaa.CropAndPad(percent=(-0.1, 0.1)),

    iaa.Sometimes(0.5,

    iaa.GaussianBlur(sigma=(, 0.5))

    ),

    iaa.ContrastNormalization((0.75, 1.5)),

    iaa.AdditiveGaussianNoise(loc=, scale=(0.0, 0.05*)),

], random_order=True)

imglist=[]

imglist.append(X_train)

images_aug = seq.augment_images(X_train)

之后基于这个模型开始了调节batchsize、steps及两个epoch的工作，我们调节的最佳结果：

batch_size =

setup_to_transfer_learning(model, base_model)

history_t1 = model.fit_generator(train_generator,

                                steps_per_epoch=,

                                validation_data = val_generator,

                                epochs=,

                                callbacks=[reduce],

                                verbose=)

setup_to_fine_tune(model,base_model)

history_ft = model.fit_generator(train_generator,

                                steps_per_epoch=,

                                epochs=,

                                validation_data=val_generator,

                                validation_steps=,

                                callbacks=[reduce],

                                verbose=)

这时，就得到了预赛排名榜的分数44.3。

下面是得到45.89分的两个关键的工作啦！

第一，将arr2tag函数中的0.5改成0.3。原因：数据集小，很多标签对应的训练图片数量少，预测得到的概率值低，所以需要调低阈值让更多正确标签预测到。

第二，模型融合。我们是将InceptionV3和InceptionResNetV2两个模型的结果融合，先将两个模型保存训练出来，然后求两个模型预测出的标签的并集。

部分代码如下：

def arr2tag(arr1, arr2):

    tags = []

    for i in range(arr1.shape[]):

        tag = []

        index1 = np.where(arr1[i] > 0.3 )

        index2 = np.where(arr2[i] > 0.3 )

        index1 = index1[].tolist()

        index2 = index2[].tolist()

        index = list(set(index1).union(set(index2)))

        tag =  [hash_tag[j] for j in index]

        tags.append(tag)

    return tags

model = load_model('model1.h5')

y_pred1 = model.predict(X_test)

del model

model = load_model('model2.h5')

y_pred2 = model.predict(X_test)

y_tags = arr2tag(y_pred1, y_pred2)

针对以上两个关键工作，可以提升的点：

两个0.3还可以调的精确些；模型融合还可以加入其它的模型一起融合。

小心情：没拿到第一还是有点遗憾的，报名后好长时间没有做，也没想到更好的方法，所以重心都放在调参上，学习率、epoch都试了很多，epoch甚至需要一个一个的减小。关键工作都在是比赛结束前一天晚上和最后的上午完成的。我们队由傻狗和天仙两人组成，天仙之前在一个公众号里看到模型融合的方法，最后一天晚上决定再试一试这种方法，傻狗很聪明，训练需要保存的模型时将arr2tag函数里的0.5改成0.4，早晨提交发现结果提升了1分多，欢喜得不得了。这次比赛还是收获颇丰哒~

傻狗刚刚说给大家公开一下代码吧，那好吧：https://github.com/feifanrensheng/TinyMind-

TinyMind 多标签图像分类竞赛之路的更多相关文章

《PYTHON机器学习及实践－从零开始通往KAGGLE竞赛之路》分享下载
转: <PYTHON机器学习及实践-从零开始通往KAGGLE竞赛之路> 分享下载书籍信息书名: PYTHON机器学习及实践-从零开始通往KAGGLE竞赛之路标签: PYTHON机器学 ...
multi-label image classification:多标签图像分类总结
多标签图像分类总结目录 1.简介 2.现有数据集和评价指标 3.学习算法 4.总结(现在存在的问题,研究发展的方向) 简介传统监督学习主要是单标签学习,而现实生活中目标样本往往比较复杂,具有多个语 ...
《机器学习及实践--从零开始通往Kaggle竞赛之路》
<机器学习及实践--从零开始通往Kaggle竞赛之路> 在开始说之前一个很重要的Tip:电脑至少要求是64位的,这是我的痛. 断断续续花了个把月的时间把这本书过了一遍.这是一本非常适合基于 ...
《Python机器学习及实践：从零开始通往Kaggle竞赛之路》
<Python 机器学习及实践–从零开始通往kaggle竞赛之路>很基础主要介绍了Scikit-learn,顺带介绍了pandas.numpy.matplotlib.scipy. 本书代 ...
多标签图像分类任务的评价方法-mAP
http://blog.sina.com.cn/s/blog_9db078090102whzw.html 多标签图像分类(Multi-label Image Classification)任务中图片的 ...
CVPR 2019细粒度图像分类竞赛中国团队DeepBlueAI获冠军 | 技术干货分享
[导读]CVPR 2019细粒度图像分类workshop的挑战赛公布了最终结果:中国团队DeepBlueAI获得冠军.本文带来冠军团队解决方案的技术分享. 近日,在Kaggle上举办的CVPR 201 ...
Python机器学习及实践+从零开始通往Kaggle竞赛之路
内容简介本书面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉并且掌握当下最流行的机器学习.数 ...
Python机器学习及实践_从零开始通往KAGGLE竞赛之路PDF高清完整版免费下载|百度云盘|Python基础教程免费电子书
点击获取提取码:i5nw Python机器学习及实践面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读 ...
湖南师范大学第五届大学生计算机程序设计竞赛--G--修路
题目链接:http://acm.hunnu.edu.cn/online/?action=problem&type=show&id=11464&courseid=132 题目: ...

随机推荐

（原）Ring loss Convex Feature Normalization for Face Recognition
转载请注明出处: http://www.cnblogs.com/darkknightzh/p/8858998.html 论文: Ring loss: Convex Feature Normalizat ...
s3cmd用法总结
概述 S3是亚马逊AWS提供的简单存储服务(可以理解为有公网域名的大容量高可用存储) S3配合CloudFront服务可作为CDN使用,它提供多节点全球发布安装方法一: yum install s ...
Homebrew macOS 包管理
1.Homebrew 简介 1.1 Homebrew Homebrew 是一款 macOS 平台下的软件包管理工具,拥有安装.卸载.更新.查看.搜索等很多实用的功能.简单的一条指令,就可以实现包管理, ...
借着Python-3来聊聊utf-8字符集
[关于文本文件] 文本文件也是以二进制序列的方式保存在磁盘中的,磁盘并不能保存文本:我们打开文本文件的时候之所以能看到文字,是因为软件根据文件所用编码的字符集对文件进行解码的原因. [以utf-8字 ...
nginx下wordpress 固定链接问题
情况是这样的, 我的wordpress并不是放在网站的根目录的,而是放在/blog目录下的,然后在wordpress中设置固定链接的时候,每次都出错,用了网上几个方法都不行,后来在http://cod ...
Genymotion模拟器出现INSTALL_FAILED_NO_MATCHING_ABIS 的解决办法
下载插件: http://files.cnblogs.com/files/feijian/genymotion-arm-translation_v1.1.zip 步骤: 将模拟器运行起来,然后将下载好 ...
Java知多少（14）数组
如果希望保存一组有相同类型的数据,可以使用数组. 数组的定义和内存分配 Java 中定义数组的语法有两种: type arrayName[]; type[] arrayName; type 为Java ...
关于使用maven打包如何聚合资源文件
多数情况下,我们使用maven管理多个子工程,在最后maven打包阶段将多个子工程聚合到一个jar或war包.单个子工程会有自己独立的资源配置文件,在打包的时候我们需要将其聚合在一起(各子工程中的配置 ...
LVS DR模式搭建 keepalived lvs
LVS DR模式搭建• 三台机器 • 分发器,也叫调度器(简写为dir)172.16.161.130 • rs1 172.16.161.131 • rs2 172.16.161.132 • vip 1 ...
【Window 7】解决Win7远程桌面无法全屏的方法
在Windows中有一项远程桌面功能,可以登录到其他电脑上进行远程控制,就像操纵本机一样,非常方便.但是最近发现用远程桌面登录过去时并不是全屏模式,而是窗口模式,老要拉滚动条,实在很不方便,今天还是到 ...

TinyMind 多标签图像分类竞赛 之路

TinyMind 多标签图像分类竞赛 之路的更多相关文章

随机推荐

热门专题

TinyMind 多标签图像分类竞赛之路

TinyMind 多标签图像分类竞赛之路的更多相关文章