挑战:使用机器学习对 RSS 提要进行分类 最近,我接到一项任务,要求为客户创建一个 RSS 提要分类子系统.目标是读取几十个甚至几百个 RSS 提要,将它们的许多文章自动分类到几十个预定义的主题领域当中.客户网站的内容.导航和搜索功能都将由这个每日自动提要检索和分类结果驱动. 客户建议使用机器学习,或许还会使用 Apache Mahout 和 Hadoop 来实现该任务,因为客户最近阅读了有关这些技术的文章.但是,客户的开发团队和我们的开发团队都更熟悉 Ruby,而不是 Java™ 技术.本文…
多类分类问题本质上可以分解为多个二分类问题,而解决二分类问题的方法有很多.这里我们利用Keras机器学习框架中的ANN(artificial neural network)来解决多分类问题.这里我们采用的例子是著名的UCI Machine Learning Repository中的鸢尾花数据集(iris flower dataset). 1. 编码输出便签 多类分类问题与二类分类问题类似,需要将类别变量(categorical function)的输出标签转化为数值变量.这个问题在二分类的时候直…
概述 通过本文我们来一起看一些用于人工智能的高质量AI库,它们的优点和缺点,以及它们的一些特点. 人工智能(AI)已经存在很长时间了.然而,由于这一领域的巨大进步,近年来它已成为一个流行语.人工智能曾经被称为一个完整的书呆子和天才的领域,但由于各种开发库和框架的发展,它已经成为一个友好的IT领域,并有很多人正走进它. 在这篇文章中,我们将研究用于人工智能的优质库,它们的优缺点以及它们的一些特征.让我们深入并探索这些人工智能库的世界! 1. TensorFlow “使用数据流图表的可伸缩机器学习的…
本次分享一部分python/人工智能/Tensorflow/自然语言处理/计算机视觉/机器学习的学习资源,也是一些比较基础的,如果大家有看过网易云课堂的吴恩达的入门课程,在看这些视频还是一个很不错的提高:对于已经有自己想学习的方向的人来说,可以从这里找到你想要的那个方向的视频.下面上链接: 书籍:(缺失密码的部分,请访问原帖(http://www.ctsch.cn/?p=120),懒得输了) 名称 地址 密码 AI电子书全系列 百度云链接   图书库 百度云链接 ufnw 电子书 百度云链接 v…
Python教程 Python 教程 Python 简介 Python 环境搭建 Python 中文编码 Python 基础语法 Python 变量类型 Python 运算符 Python 条件语句 Python 循环语句 Python 数字 Python 列表(List) Python 字符串 Python 元组 Python 字典(Dictionary) Python 日期和时间 Python 函数 Python 模块 Python File及os模块 Python文件IO Python 异…
简单的问答已经实现了,那么问题也跟着出现了,我不能确定问题一定是"你叫什么名字",也有可能是"你是谁","你叫啥"之类的,这就引出了人工智能中的另一项技术: 自然语言处理(NLP) : 大概意思就是 让计算机明白一句话要表达的意思,NLP就相当于计算机在思考你说的话,让计算机知道"你是谁","你叫啥","你叫什么名字"是一个意思 这就要做 : 语义相似度 接下来我们用Python大法来实…
前言 这是一篇包含极少数学推导的NN入门文章 大概从今年4月份起就想着学一学NN,但是无奈平时时间不多,而且空闲时间都拿去做比赛或是看动漫去了,所以一拖再拖,直到这8月份才正式开始NN的学习. 这篇文章主要参考了<深度学习入门:基于Python的理论与实现>一书,感觉这本书很不错,偏向实践,蛮适合入门. 话不多说,下面开始我们的NN入门(手撕NN)之旅 基础数学知识 这里只对张量进行简单介绍,关于矩阵运算之类的,就靠你们自己另外学啦. 标量(0D张量) 仅包含一个数字的张量叫作标量(scala…
引言 上一篇关于<面试官为啥总是喜欢问前端路由实现方式>的文章发布后,发现还是挺受欢迎的.这就给我造成了一定的困惑 之前花了很长时间,实现了一个自认为创意还不错的关于前端如何利用node+canvas实现一键解析博客中关键词后生成一张云图,并支持一键上传github或oss的小工具,类似于图床的功能,只不过场景是解析markdown中关键字.本想着借这个实现,让大家对node全局包有一个更加深刻的印象,同时也可以借鉴其思路解决工作中的一些特定场景下的低效问题.所以写了长篇大论,沾沾自喜的窃以为…
按照固有思维方式,人们总以为人工智能是一个莫测高深的行业,这个行业的人都是高智商人群,无论是写文章还是和人讲话,总是讳莫如深,接着就是蹦出一些"高级"词汇,什么"神经网络",什么"卷积神经"之类,教人半懂不懂的.尤其ChatGPT的风靡一时,更加"神话"了这个行业,用鲁迅先生形容诸葛武侯的话来讲:"多智而近妖". 事实上,根据二八定理,和别的行业一样,人工智能行业内真正顶尖的天才也就是20%,他们具备真正的…
我们都知道机器学习是一门综合性极强的研究课题,对数学知识要求很高.因此,对于非学术研究专业的程序员,如果希望能入门机器学习,最好的方向还是从实践触发. 我了解到Python的生态对入门机器学习很有帮助.因此希望以此作为突破口入门机器学习. 我将会记录一个系列的学习与实践记录.记录内容主要参考Youtube中sentdex发布的视频,有兴趣的读者可以自己FQ到油管看一下. 下面介绍一下我将如何通过Python入门机器学习. 学习Python基本语法 首先我在Python官网找到入门教程,快速过了一…