零基础入门数据挖掘 - 二手车交易价格预测 赛题理解 比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格. 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量.为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name.model.brand和regionCode等信息进行脱敏. 比赛地址:https://tianchi.al…
[机器学习入门与实践]数据挖掘-二手车价格交易预测(含EDA探索.特征工程.特征优化.模型融合等) note:项目链接以及码源见文末 1.赛题简介 了解赛题 赛题概况 数据概况 预测指标 分析赛题 数据读取pandas 分类指标评价计算示例 回归指标评价计算示例 EDA探索 载入各种数据科学以及可视化库 载入数据 总览数据概况 判断数据缺失和异常 了解预测值的分布 特征分为类别特征和数字特征,并对类别特征查看unique分布 数字特征分析 类别特征分析 用pandas_profiling生成数据…
作者:韩信子@ShowMeAI 数据分析实战系列:https://www.showmeai.tech/tutorials/40 机器学习实战系列:https://www.showmeai.tech/tutorials/41 本文地址:https://www.showmeai.tech/article-detail/300 声明:版权所有,转载请联系平台与作者并注明出处 收藏ShowMeAI查看更多精彩内容 一份来自『RESEARCH AND MARKETS』的二手车报告预计,从 2022 年到…
简介 TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人. 文章包括一下几个部分: 1.为什么要尝试做这个项目? 2.为什么选取了这个模型? 3.模型的数据从哪里来? 4.模型的优化过程? 5.项目可以进一步提升的方向. 对于以比特币为首的数字货币近期的表现,只能用疯狂来形容.来自比特币交易平台的最新价格行情显示,就在此前一天,比特币盘中最高价格达到29838.5元,距离3万元大关仅有咫尺之遥.比特币最近火热的行情,…
写在前面 准备近期将微软的machinelearning-samples翻译成中文,水平有限,如有错漏,请大家多多指正. 如果有朋友对此感兴趣,可以加入我:https://github.com/feiyun0112/machinelearning-samples.zh-cn 出租车费预测 ML.NET 版本 API 类型 状态 应用程序类型 数据类型 场景 机器学习任务 算法 v0.7 动态 API 最新版本 控制台应用程序 .csv 文件 价格预测 回归 Sdca 回归 在这个介绍性示例中,您…
简介 TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人. 文章包括一下几个部分: 1.为什么要尝试做这个项目? 2.为什么选取了这个模型? 3.模型的数据从哪里来? 4.模型的优化过程? 5.项目可以进一步提升的方向. 对于以比特币为首的数字货币近期的表现,只能用疯狂来形容.来自比特币交易平台的最新价格行情显示,就在此前一天,比特币盘中最高价格达到29838.5元,距离3万元大关仅有咫尺之遥.比特币最近火热的行情,…
据业内人士透露,weixin.com双拼域名今日易主,交易价格在几千万级别,有传闻其交易价格仅次于360.com. 从whois信息查看可知,weixin.com域名信息今日发生变更,目前域名的持有者者是li ming,不过持有者并不愿意透露其身份. 众所周知,在国内称霸一方的微信,一直使用的却是QQ的二级域名.weixin.com域名无疑是有着巨大价值的,按照域名争议解决办法,weixin.com在腾讯之外的公司使用的情况下,不得出现微信相关内容,否则将会视为侵权,因此,weixin.com的…
先翻译了一下给的房屋数据的特征,这里定义了一个case class,方便理解每个特征的含义, Kaggle的房价数据集使用的是Ames Housing dataset,是美国爱荷华州的艾姆斯镇2006-2010年的房价 case class house( Id: String, MSSubClass: String, // 参与销售住宅的类型:有年代新旧等信息 MSZoning: String, // 房屋类型:农用,商用等 LotFrontage: String, // 距离街道的距离 Lot…
Chapter1_housing_price_predict .caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px solid #000; } .table { border-collapse: collapse !important; } .table td, .table th { background-color: #fff !important; } .ta…
1.题目 这道题目的地址在https://www.kaggle.com/c/titanic,题目要求大致是给出一部分泰坦尼克号乘船人员的信息与最后生还情况,利用这些数据,使用机器学习的算法,来分析预测另一部分人员最后是否生还.题目练习的要点是语言和数据分析的基础内容(比如python.numpy.pandas等)以及二分类算法. 数据集包含3个文件:train.csv(训练数据).test.csv(测试数据).gender_submission.csv(最后提交结果的示例,告诉大家提交的文件长什…