用101000张食物图片实现图像识别（数据的获取与处理）-python-tensorflow框架

　　　　前段时间，日剧《轮到你了》大火，作为程序员的我，看到了另外一个程序员—二阶堂，他的生活作息，以及饮食规律，让我感同身受，最让我感触的是他做的AI聊天机器人，AI菜品分析机器人，AI罪犯分析。　

　　　　这让作为程序员的我突然萌生了一股攀比和一种激情，我也得做一个出来（小声bb，都得尝试下）：

　　　　于是，我想从相对简单的做起，《AI菜品分析机器人》：

　　　　AI菜品分析机器人：

　　　　　　　　1.建立语料库，爬取各个网站的对话和问答，这里我采用的是知乎以及调用api获取实时对话，至于代码的话我这里就不放了，涉及比较多，我这里侧重点是图像识别，大概获取了将近4万条数据，

　　　　　　　　　　这里给出部分结果：

　　　　　　　　2.关于图像识别：

　　　　　　　　　　1.图像训练需要极大的数据，我这里找了很久，通过各种手段，找到了kaggle比赛曾用过的101000张图片，里面有101种食物图片，如下（部分）

　　　　　　　　　　类似于上述图片，每一个图片都是都是对应得食物，我们需要提取每一张图片的特征值。

　　　　　　　　　　2.我们可以看出上述图片，大小不一，还具有色彩，我们特征值提取，是将图片进行矩阵化，所以我们在这里需要将图片变成大小一样，并且灰度处理。这里我们解释下：

　　　　　　　　　　将图片处理成大小一样：我们训练数据的时候是将图片矩阵化，如果图片大小不一样，我们得矩阵大小就不一样，所以在训练得时候会有问题，为了简单方便，我们直接将其同一化：

import numpy as np

from PIL import Image

img =Image.open("F:/images/baby_back_ribs/"+i).convert('L')

        img=img.resize((512,512))

        img.save("F:/baby_back_ribs28/"+i)

　　　　　　　　　　这里，我们通过img =Image.open("F:/images/baby_back_ribs/"+i).convert('L')将图片灰度处理，然后img=img.resize((512,512))处理图片为512，512，最后保存：

　　　　　　　　　　可以看出，我们处理过后得图片如上，得出这样的图片后，我们就可以用来作为数据了

　　　　　　　　　　3.我们将我们获取的灰度图片矩阵化：

 for i in range(512):

            for j in range(512):

                pixel=1.0-float(img.getpixel((j,i)))/255.0

　　　　　　　　　　所以我们可以将其矩阵化：

　　　　　　　　　　每张图片有512*512个数据，我们这里是将一个二维矩阵扁平化为一维矩阵。所以我们可以将这101000张图片所有数据都矩阵化，然后测试算法。

　　　　　　　　　　具体的代码，还在测试中，目前遇到得问题比较多，正在一步一步处理，后面会继续更新，下面给出我遇到的一些问题和解决：

　　　　　　　　　　1.数据的获取：这101000张图片我找了很久才找到的数据（约有5个g）。

　　　　　　　　　　2.数据量比较大，在处理的时候容易出错，所以大家在写的时候一定要仔细，最好把源图复制一份，保留下来。

　　　　　　　　　　3.图片特征比较多，普通的算法难以满足，容易出现过拟合现象，而且1000张图也不算特别多，准确率较低，容易识别出错。

　　　　　　　　　　4.在实现矩阵算法的时候，每次带入100张图片进行训练，注意图片维度，以及图片长度。

　　　　　　　　　　等数据测试稳定后会放出源码让大家学习。

　　　　　　　　　　持续更新中,希望大家留意后面的博客.....

用101000张食物图片实现图像识别（数据的获取与处理）-python-tensorflow框架的更多相关文章

食物图片变菜谱：这篇CVPR论文让人人都可以学习新料理
根据 Facebook 的统计,Instgram 上的美食图片数量已经超过 3 亿张.然而,获取食物烹饪方法的途径依然有限,例如,通过烹饪网站或相关教程.怎样能够挖掘丰富食物图片背后的烹饪方法,让每个 ...
Atitit 判断判断一张图片是否包含另一张小图片
Atitit 判断判断一张图片是否包含另一张小图片 1. keyword1 2. 模板匹配是在图像中寻找目标的方法之一(切割+图像相似度计算)1 3. 匹配效果2 4. 图片相似度的算法(感知哈希算 ...
【Python网络爬虫四】通过关键字爬取多张百度图片的图片
最近看了女神的新剧<逃避虽然可耻但有用>,同样男主也是一名程序员,所以很有共鸣被大只萝莉萌的一脸一脸的,我们来爬一爬女神的皂片. 百度搜索结果:新恒结衣本文主要分为4个部分: 1.下载 ...
读取多张MNIST图片与利用BaseEstimator基类创建分类器
读取多张MNIST图片在读取多张MNIST图片之前,我们先来看下读取单张图片如何实现每张数字图片大小都为28 * 28的,需要将数据reshape成28 * 28的,采用最近邻插值,如下 def ...
音视频入门-18-手动生成一张GIF图片
* 音视频入门文章目录 * GIF 编码知识 GIF 包含的数据块: 文件头(Header) 逻辑屏幕标识符(Logical Screen Descriptor) 全局颜色表(Global Color ...
（第二章第二部分）TensorFlow框架之读取图片数据
系列博客链接: (第二章第一部分)TensorFlow框架之文件读取流程:https://www.cnblogs.com/kongweisi/p/11050302.html 本文概述: 目标说明图片 ...
Atitit.java图片图像处理attilax总结 BufferedImage extends java.awt.Image获取图像像素点image.getRGB(i, lineIndex); 图片剪辑/AtiPlatf_cms/src/com/attilax/img/imgx.javacutImage图片处理titit 判断判断一张图片是否包含另一张小图片 atitit 图片去噪算法的原理与
Atitit.java图片图像处理attilax总结 BufferedImage extends java.awt.Image 获取图像像素点 image.getRGB(i, lineIndex); ...
java图片处理——多张图片合成一张Gif图片并播放或Gif拆分成多张图片
1.多张jpg图合成gif动画 /** * 把多张jpg图片合成一张 * @param pic String[] 多个jpg文件名包含路径 * @param newPic String 生成的gif ...
一张png图片上面有多个图标，如何用CSS准确的知道其中某个图片的坐标
一张png图片上面有多个图标,如何用CSS准确的知道其中某个图片的坐标 ,如下图可以使用 background background:url(images/xx.png) 40px 10px n ...

随机推荐

【openmp】for循环的break问题
问题描述:在用openmp并行化处理for循环的时候,便无法在for循环中用break语句,那么我们如何实现这样的机制呢?在stackoverflow上看到一个不错的回答总结一下. volatile ...
面试java后端面经_3
小姐姐说:你一点都不懂表达,一点都不懂爱情,一点也不爱我! 你答:你知道吗,我听说过一个这样的故事,讲的就是有一个小女孩和一个男孩在一起,小男孩呢很不幸是位聋哑人,虽然如此,但是他们的日子过得特别的美 ...
linux command line learn - get the absolute path of a file
get the absolute path of a file in linux readlink -f filenme [heshuai@login01 3_Variation_calling]$ ...
java120经典面试题
经典面试题 -----version 1.0 题注:以下答案仅限本人个人见解,若有错误和建议请多多指教.QQ:1807812486 题目来源 1.什么是Java虚拟机?为什么Java被称作是" ...
MVC + EFCore 完整教程19-- 最简方法读取json配置：自定义configuration读取配置文件
问题引出 ASP.NET Core 默认将 Web.config移除了,将配置文件统一放在了 xxx.json 格式的文件中. 有Web.config时,我们需要读到配置文件时,一般是这样的: var ...
从零写一个编译器（十三）：代码生成之遍历AST
项目的完整代码在 C2j-Compiler 前言在上一篇完成对JVM指令的生成,下面就可以真正进入代码生成部分了.通常现代编译器都是先把生成IR,再经过代码优化等等,最后才编译成目标平台代码.但是时 ...
NNs（Neural Networks，神经网络）和Polynomial Regression（多项式回归）等价性之思考，以及深度模型可解释性原理研究与案例
1. Main Point 0x1:行文框架第二章:我们会分别介绍NNs神经网络和PR多项式回归各自的定义和应用场景. 第三章:讨论NNs和PR在数学公式上的等价性,NNs和PR是两个等价的理论方法 ...
socket-遇到一枚假程序员
1. 一脸懵比今天又偶然看到socket,对socket有点简单的概念,知道是网络编程.客户端与服务端通信等,但是不是太了解,就随便搜了下,几千万条记录,随便点开看了几页,socket跟网络编程也是 ...
Go 面试每天一篇（第 2 天）
下面这段代码输出什么,说明原因. func main() { slice := []int{0,1,2,3} m := make(map[int]*int) for key,val := range ...
听说你不会调参？TextCNN的优化经验Tricks汇总
前言:本篇是TextCNN系列的第三篇,分享TextCNN的优化经验前两篇可见: 文本分类算法TextCNN原理详解(一) TextCNN代码详解(附测试数据集以及GitHub 地址)(二) 调优模 ...

用101000张食物图片实现图像识别（数据的获取与处理）-python-tensorflow框架

用101000张食物图片实现图像识别（数据的获取与处理）-python-tensorflow框架的更多相关文章

随机推荐

热门专题