No1: InterpretML by Microsoft——Machine Learning Interpretability

github地址:https://github.com/microsoft/interpret

可解释性是目前机器学习中的一个重要问题。能够理解模型如何产生它所输出的内容,这是每个机器学习项目的关键。

Interpretml是微软的一个开源软件包,用于训练可解释模型和解释黑盒系统。微软在解释解为什么解释性是必要的时候说得非常好:

模型调试:为什么我的模型犯了这个错误?

检测偏差:我的模型有区别吗?

人工智能合作:我如何理解和信任模型的决策?

法规遵从性:我的模型是否满足法律要求?

高风险应用:医疗、金融、司法等。

从过去的经验看,最容易理解的模型不是很准确,而最准确的模型是不可理解的。随着复杂性的增加,解释机器学习模型的内部工作变得更加困难。于是,MicrosoftResearch开发了一种称为可解释增强机(EBM)*的算法,该算法具有高精度和可理解性。EBM使用现代机器学习技术,如 bagging 和boosting,为传统的GAM模型注入新的活力。这使它们像随机森林和梯度提升树一样准确,并且还增强了它们的可理解性和可编辑性。

此外,该算法不仅限于使用EBM,它还支持LIME、线性模型、决策树等算法。比较模型并为我们的项目挑选最好的模型从未如此简单!

而Interpretml的安装也很简单,仅需要如下几行代码:


 
pip install numpy scipy pyscaffoldpip install -U interpret
pip install -U interpret

No2:Tensor2Robot (T2R) by Google Research

github地址:https://github.com/google-research/tensor2robot

Google Research再次出现在我们推荐的Github系列项目中。因为他们拥有业务中最强大的计算能力,且他们正在将它用于机器学习。

Google最新发布了名为Tensor2Robot(T2R)的开源项目。 T2R是用于大规模深度神经网络训练、评估和推理的库。,此存储库包含分布式机器学习和强化学习基础结构。它在Alphabet内部使用,开源的目的是使Robotics @ Google的研究对于更广泛的机器人和计算机视觉社区更具可重复性。

以下是使用Tensor2Robot实现的几个项目:

  • QT-Opt(https://arxiv.org/abs/1806.10293

  • Grasp2Vec(https://github.com/google-research/tensor2robot/blob/master/research/grasp2vec)

No3:Generative Models in TensorFlow 2

Github地址:https://github.com/timsainb/tensorflow2-generative-models

这是一个在Tensorflow 2中实现大量生成模型的小项目。(TensorFlow 2.0是今年最受期待的TensorFlow版本,于不久前正式推出。)图层和优化器都是使用Keras。这些模型是针对两个数据集实现的:fashion MNIST和NSYNTH。编写网络的目的是尽可能简单和一致,同时具有可读性。因为每个网络都是自包含在notebook中的,所以它们应该可以在colab会话中轻松运行。

该存储库包含多个生成模型的TF实现,包括:

  • 生成对抗网络(GAN)

  • 自动编码器

  • 变分自动编码器(VAE)

  • VAE-GAN等。

No4:STUMPY – Time Series Data Mining

github地址:https://github.com/TDAmeritrade/stumpy

STUMPY是一个功能强大且可扩展的库,可帮助我们执行时间序列数据挖掘任务。 STUMPY旨在计算矩阵轮廓,矩阵轮廓是一个向量,它存储时间序列中任何子序列与其最近邻居之间的 z-normalized 欧几里德距离。

以下是此矩阵配置文件帮助我们执行的一些时间序列数据挖掘任务:

  • 异常发现

  • 语义分割

  • 密度估计

  • 时间序列链(时序有序的子序列模式集)

使用以下代码可以通过pip直接安装STUMPY:


 
pip install stumpy

No5:MeshCNN in PyTorch

github地址:https://github.com/ranahanocka/MeshCNN

MeshCNN是用于3D三角网格的通用深度神经网络。这些网格可用于3D形状分类或分割等任务。MeshCNN框架包括直接应用于网格边缘的卷积,池化和解除层:

卷积神经网络(CNN)非常适合处理图像和视觉数据。 CNN近年来风靡一时,随着图像相关应用的涌现而兴起:物体检测、图像分割、图像分类等,随着CNN的进步,这些都变成了可能。

而最近3D深度学习吸引了业界的兴趣,包括机器人和自动驾驶等领域。3D形状的问题在于它们本质上是不规则的。这使得像卷积这样的操作变得很困难。这也是MeshCNN发挥作用的地方。它是是用于3D三角网格的通用深度神经网络:网格是顶点,边和面的列表,它们共同定义3D对象的形状。

如果您热衷于计算机视觉,那么这对您来说是完美的存储库。 您可以通过我们的文章了解有关CNN的更多信息:

  • A Comprehensive Tutorial tolearn Convolutional Neural Networks from Scratch(A Comprehensive Tutorial to learn Convolutional Neural Networks fromScratch)

  • Architecture of ConvolutionalNeural Networks (CNNs) Demystified(A Comprehensive Tutorial to learn Convolutional Neural Networks fromScratch)

欢迎关注磐创博客资源汇总站:

http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站:

http://pytorch.panchuang.net/

推荐|近期热点机器学习git项目的更多相关文章

  1. 干货 | 近期热点机器学习git项目

    No1:PyTorchImplementation of DeepMind's BigGAN(https://github.com/huggingface/pytorch-pretrained-Big ...

  2. 近期 github 机器学习热门项目top5

    磐创智能-专注机器学习深度学习的教程网站 http://panchuang.net/ 磐创AI-智能客服,聊天机器人,推荐系统 http://panchuangai.com/ [导读]:Github是 ...

  3. 近期 github 机器学习热门项目 top5

    欢迎大家关注我们的网站和系列教程:http://panchuang.net/ ,学习更多的机器学习.深度学习的知识! 作者:Walker No1:NVIDIA's vid2vid Technique( ...

  4. 多人开发的git项目如何保持提交日志为一条直线?

    多人开发的git项目如何保持提交日志为一条直线? 一.Git的项目的git常用操作 a)Git clone 项目地址 从远程仓库克隆项目到本地 b)Git pull 从当前分支拉取更新代码 c)Git ...

  5. 推荐一本写给IT项目经理的好书

    原文地址:http://www.cnblogs.com/cbook/archive/2011/01/19/1939060.html (防止原文作者删除.只能拷贝一份了) 推荐一本写给IT项目经理的好书 ...

  6. 机器学习开源项目精选TOP30

    本文共图文结合,建议阅读5分钟. 本文为大家带来了30个广受好评的机器学习开源项目. 640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1 最近,Mybridge发布了 ...

  7. IDEA 提交项目至Git与获取Git项目

    1.IDEA提交项目至git 注:保证已安装Git分布式管理系统,没有自行百度安装git 1)在IDEA中配置Git与GitHub a)Git: File-->Settings --> V ...

  8. GitHub Python项目推荐|瓦力Devops开源项目代码部署平台持续部署

    GitHub Python项目推荐|walle - 瓦力 Devops开源项目代码部署平台 项目热度 标星(star):8418 (很不错的实用项目,大神作品,建议关注) 标星趋势 关注(watch) ...

  9. 在 CentOS 上部署 GitLab (自托管的Git项目仓库)

    参考资料https://github.com/mattias-ohlsson/gitlab-installer/blob/master/gitlab-install-el6.sh 环境准备OS: Ce ...

随机推荐

  1. marquee用到的属性

      一.marquee标签的几个重要属性: 1.direction:滚动方向(包括4个值:up.down.left.right) 说明:up:从下向上滚动:down:从上向下滚动:left:从右向左滚 ...

  2. percona-toolkit 之 【pt-query-digest】介绍

    背景: 做为一个MySQL DBA,分析慢查询是日常主要的工作之一,之前一直使用mysqlsla作为分析慢查询的, 因为简单并且也能满足自己对慢查询分析的要求,对于另一个工具pt-query-dige ...

  3. 基于JS正则实现模板数据动态渲染

    最近业务上需要动态渲染模板数据: 一.业务需求: 1.前端后端定义好模板以及变量名,根据打印机类型转换成对应sdk需要的标签模板,保存数据库 2.订单数据是前端根据支付结果获取的,最终渲染完的数据模板 ...

  4. Angular 1 深度解析:脏数据检查与 angular 性能优化

    TL;DR 脏检查是一种模型到视图的数据映射机制,由 $apply 或 $digest 触发. 脏检查的范围是整个页面,不受区域或组件划分影响 使用尽量简单的绑定表达式提升脏检查执行速度 尽量减少页面 ...

  5. 【猫狗数据集】谷歌colab之使用pytorch读取自己数据集(猫狗数据集)

    之前在:https://www.cnblogs.com/xiximayou/p/12398285.html创建好了数据集,将它上传到谷歌colab 在colab上的目录如下: 在utils中的rdat ...

  6. JavaWeb中登录验证码生成

    1.页面代码 <html> <head> <title>Title</title> <script type="text/javascr ...

  7. Django Queryset增加manager

    **#定义一个新的过滤规则,这里是过滤状态为发布的帖子** **class PublishedManager(models.Manager):**        **def get_queryset( ...

  8. 为什么java内部类访问局部变量必须声明为final?

    https://blog.csdn.net/z55887/article/details/49229491 先抛出让我疑惑了很久的一个问题 编程时,在线程中使用局部变量时候经常编译器会提示:局部变量必 ...

  9. search(1)- elasticsearch结构概念

    上篇提到选择了elasticsearch ES作为专业化搜索引擎的核心,这篇讨论一下ES的基本结构和应用概念.首先,从硬结构方面来讲:ES是在一个集群(cluster)环境里运行的,所以ES应该具备高 ...

  10. flask连接数据库的URI书写格式

    1. MySQL mysql://username:password@hostname/database 2. PostgreSQL postgresql://username:password@ho ...