推荐|近期热点机器学习git项目
No1: InterpretML by Microsoft——Machine Learning Interpretability
github地址:https://github.com/microsoft/interpret
可解释性是目前机器学习中的一个重要问题。能够理解模型如何产生它所输出的内容,这是每个机器学习项目的关键。
Interpretml是微软的一个开源软件包,用于训练可解释模型和解释黑盒系统。微软在解释解为什么解释性是必要的时候说得非常好:
模型调试:为什么我的模型犯了这个错误?
检测偏差:我的模型有区别吗?
人工智能合作:我如何理解和信任模型的决策?
法规遵从性:我的模型是否满足法律要求?
高风险应用:医疗、金融、司法等。
从过去的经验看,最容易理解的模型不是很准确,而最准确的模型是不可理解的。随着复杂性的增加,解释机器学习模型的内部工作变得更加困难。于是,MicrosoftResearch开发了一种称为可解释增强机(EBM)*的算法,该算法具有高精度和可理解性。EBM使用现代机器学习技术,如 bagging 和boosting,为传统的GAM模型注入新的活力。这使它们像随机森林和梯度提升树一样准确,并且还增强了它们的可理解性和可编辑性。
此外,该算法不仅限于使用EBM,它还支持LIME、线性模型、决策树等算法。比较模型并为我们的项目挑选最好的模型从未如此简单!
而Interpretml的安装也很简单,仅需要如下几行代码:
pip install numpy scipy pyscaffoldpip install -U interpret
pip install -U interpret
No2:Tensor2Robot (T2R) by Google Research
github地址:https://github.com/google-research/tensor2robot
Google Research再次出现在我们推荐的Github系列项目中。因为他们拥有业务中最强大的计算能力,且他们正在将它用于机器学习。
Google最新发布了名为Tensor2Robot(T2R)的开源项目。 T2R是用于大规模深度神经网络训练、评估和推理的库。,此存储库包含分布式机器学习和强化学习基础结构。它在Alphabet内部使用,开源的目的是使Robotics @ Google的研究对于更广泛的机器人和计算机视觉社区更具可重复性。
以下是使用Tensor2Robot实现的几个项目:
QT-Opt(https://arxiv.org/abs/1806.10293
Grasp2Vec(https://github.com/google-research/tensor2robot/blob/master/research/grasp2vec)
No3:Generative Models in TensorFlow 2
Github地址:https://github.com/timsainb/tensorflow2-generative-models
这是一个在Tensorflow 2中实现大量生成模型的小项目。(TensorFlow 2.0是今年最受期待的TensorFlow版本,于不久前正式推出。)图层和优化器都是使用Keras。这些模型是针对两个数据集实现的:fashion MNIST和NSYNTH。编写网络的目的是尽可能简单和一致,同时具有可读性。因为每个网络都是自包含在notebook中的,所以它们应该可以在colab会话中轻松运行。
该存储库包含多个生成模型的TF实现,包括:
生成对抗网络(GAN)
自动编码器
变分自动编码器(VAE)
VAE-GAN等。
No4:STUMPY – Time Series Data Mining
github地址:https://github.com/TDAmeritrade/stumpy
STUMPY是一个功能强大且可扩展的库,可帮助我们执行时间序列数据挖掘任务。 STUMPY旨在计算矩阵轮廓,矩阵轮廓是一个向量,它存储时间序列中任何子序列与其最近邻居之间的 z-normalized 欧几里德距离。
以下是此矩阵配置文件帮助我们执行的一些时间序列数据挖掘任务:
异常发现
语义分割
密度估计
时间序列链(时序有序的子序列模式集)
使用以下代码可以通过pip直接安装STUMPY:
pip install stumpy
No5:MeshCNN in PyTorch
github地址:https://github.com/ranahanocka/MeshCNN
MeshCNN是用于3D三角网格的通用深度神经网络。这些网格可用于3D形状分类或分割等任务。MeshCNN框架包括直接应用于网格边缘的卷积,池化和解除层:
卷积神经网络(CNN)非常适合处理图像和视觉数据。 CNN近年来风靡一时,随着图像相关应用的涌现而兴起:物体检测、图像分割、图像分类等,随着CNN的进步,这些都变成了可能。
而最近3D深度学习吸引了业界的兴趣,包括机器人和自动驾驶等领域。3D形状的问题在于它们本质上是不规则的。这使得像卷积这样的操作变得很困难。这也是MeshCNN发挥作用的地方。它是是用于3D三角网格的通用深度神经网络:网格是顶点,边和面的列表,它们共同定义3D对象的形状。
如果您热衷于计算机视觉,那么这对您来说是完美的存储库。 您可以通过我们的文章了解有关CNN的更多信息:
A Comprehensive Tutorial tolearn Convolutional Neural Networks from Scratch(A Comprehensive Tutorial to learn Convolutional Neural Networks fromScratch)
Architecture of ConvolutionalNeural Networks (CNNs) Demystified(A Comprehensive Tutorial to learn Convolutional Neural Networks fromScratch)
欢迎关注磐创博客资源汇总站:
http://docs.panchuang.net/
欢迎关注PyTorch官方中文教程站:
http://pytorch.panchuang.net/
推荐|近期热点机器学习git项目的更多相关文章
- 干货 | 近期热点机器学习git项目
No1:PyTorchImplementation of DeepMind's BigGAN(https://github.com/huggingface/pytorch-pretrained-Big ...
- 近期 github 机器学习热门项目top5
磐创智能-专注机器学习深度学习的教程网站 http://panchuang.net/ 磐创AI-智能客服,聊天机器人,推荐系统 http://panchuangai.com/ [导读]:Github是 ...
- 近期 github 机器学习热门项目 top5
欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习.深度学习的知识! 作者:Walker No1:NVIDIA's vid2vid Technique( ...
- 多人开发的git项目如何保持提交日志为一条直线?
多人开发的git项目如何保持提交日志为一条直线? 一.Git的项目的git常用操作 a)Git clone 项目地址 从远程仓库克隆项目到本地 b)Git pull 从当前分支拉取更新代码 c)Git ...
- 推荐一本写给IT项目经理的好书
原文地址:http://www.cnblogs.com/cbook/archive/2011/01/19/1939060.html (防止原文作者删除.只能拷贝一份了) 推荐一本写给IT项目经理的好书 ...
- 机器学习开源项目精选TOP30
本文共图文结合,建议阅读5分钟. 本文为大家带来了30个广受好评的机器学习开源项目. 640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1 最近,Mybridge发布了 ...
- IDEA 提交项目至Git与获取Git项目
1.IDEA提交项目至git 注:保证已安装Git分布式管理系统,没有自行百度安装git 1)在IDEA中配置Git与GitHub a)Git: File-->Settings --> V ...
- GitHub Python项目推荐|瓦力Devops开源项目代码部署平台持续部署
GitHub Python项目推荐|walle - 瓦力 Devops开源项目代码部署平台 项目热度 标星(star):8418 (很不错的实用项目,大神作品,建议关注) 标星趋势 关注(watch) ...
- 在 CentOS 上部署 GitLab (自托管的Git项目仓库)
参考资料https://github.com/mattias-ohlsson/gitlab-installer/blob/master/gitlab-install-el6.sh 环境准备OS: Ce ...
随机推荐
- marquee用到的属性
一.marquee标签的几个重要属性: 1.direction:滚动方向(包括4个值:up.down.left.right) 说明:up:从下向上滚动:down:从上向下滚动:left:从右向左滚 ...
- percona-toolkit 之 【pt-query-digest】介绍
背景: 做为一个MySQL DBA,分析慢查询是日常主要的工作之一,之前一直使用mysqlsla作为分析慢查询的, 因为简单并且也能满足自己对慢查询分析的要求,对于另一个工具pt-query-dige ...
- 基于JS正则实现模板数据动态渲染
最近业务上需要动态渲染模板数据: 一.业务需求: 1.前端后端定义好模板以及变量名,根据打印机类型转换成对应sdk需要的标签模板,保存数据库 2.订单数据是前端根据支付结果获取的,最终渲染完的数据模板 ...
- Angular 1 深度解析:脏数据检查与 angular 性能优化
TL;DR 脏检查是一种模型到视图的数据映射机制,由 $apply 或 $digest 触发. 脏检查的范围是整个页面,不受区域或组件划分影响 使用尽量简单的绑定表达式提升脏检查执行速度 尽量减少页面 ...
- 【猫狗数据集】谷歌colab之使用pytorch读取自己数据集(猫狗数据集)
之前在:https://www.cnblogs.com/xiximayou/p/12398285.html创建好了数据集,将它上传到谷歌colab 在colab上的目录如下: 在utils中的rdat ...
- JavaWeb中登录验证码生成
1.页面代码 <html> <head> <title>Title</title> <script type="text/javascr ...
- Django Queryset增加manager
**#定义一个新的过滤规则,这里是过滤状态为发布的帖子** **class PublishedManager(models.Manager):** **def get_queryset( ...
- 为什么java内部类访问局部变量必须声明为final?
https://blog.csdn.net/z55887/article/details/49229491 先抛出让我疑惑了很久的一个问题 编程时,在线程中使用局部变量时候经常编译器会提示:局部变量必 ...
- search(1)- elasticsearch结构概念
上篇提到选择了elasticsearch ES作为专业化搜索引擎的核心,这篇讨论一下ES的基本结构和应用概念.首先,从硬结构方面来讲:ES是在一个集群(cluster)环境里运行的,所以ES应该具备高 ...
- flask连接数据库的URI书写格式
1. MySQL mysql://username:password@hostname/database 2. PostgreSQL postgresql://username:password@ho ...