深度学习库 SynapseML for .NET 发布0.1 版本
2021年11月 微软开源一款简单的、多语言的、大规模并行的机器学习库 SynapseML(以前称为 MMLSpark),以帮助开发人员简化机器学习管道的创建。具体参见[1]微软深度学习库 SynapseML:可直接在系统中嵌入 45 种不同机器学习服务、支持 100 多种语言文本翻译。
2022年8月12日 微软在.NET 博客上发布了[2] 用于 .NET 的 SynapseML,建立在其去年 11 月首次亮相的大规模机器学习开源项目SynapseML 的基础上。作为新 SynapseML v0.10 版本的一部分,微软宣布了一组新的 .NET API,用于大规模可扩展的机器学习。 博客文章中说:“这允许我们通过 .NET for Apache Spark 语言绑定来创作、训练和使用来自 C#、F# 或 .NET 系列中的其他语言的任何 SynapseML 模型。 ”
SynapseML 在 Apache Spark 上运行并且需要安装 Java,因为 Spark 使用 JVM 来运行 Scala。但是,它具有针对 Python 或 R 等其他语言的绑定。当前的 0.10.0 版本添加了针对 .NET 语言的绑定。该工具可以帮助开发人员在各种 Microsoft 领域构建可扩展的智能系统,包括:
微软去年首次开源这个项目时是这么说的 ”统一的 API 标准化了当今的许多工具、框架和算法,简化了分布式 ML 体验, 这使开发人员能够为需要多个框架的用例快速构建不同的 ML 框架,例如 Web 监督学习、搜索引擎创建等。它还可以在单节点、多节点上训练和评估模型,以及可弹性调整大小的计算机集群,因此开发人员可以在不浪费资源的情况下扩展他们的工作。”。 这段话对于熟悉微软的另一个捐献给CNCF的 开源项目[3]Dapr 的同学来说是不是很熟悉?
SynapseML for .NET包含在一组 SynapseML NuGet 包中。这些包尚未发布到主要的 NuGet 源,必须手动添加它们的源。安装后,即可从 .NET 应用程序调用 SynapseML API。
以下代码片段说明了如何从 C# 应用程序调用 SynapseML API。
// Create LightGBMClassifier
var lightGBMClassifier = new LightGBMClassifier()
     .SetFeaturesCol("features")
     .SetRawPredictionCol("rawPrediction")
     .SetObjective("binary")
     .SetNumLeaves(30)
     .SetNumIterations(200)
     .SetLabelCol("label")
     .SetLeafPredictionCol("leafPrediction")
     .SetFeaturesShapCol("featuresShap");
// Fit the model
var lightGBMClassificationModel = lightGBMClassifier.Fit(trainDf);
// Apply transformation and displayresults
lightGBMClassificationModel.Transform(testDf).Show(50);
SynapseML 允许开发人员调用其管道中的其他服务。该库支持 Microsoft 自己的[4]认知服务,这是一组由 Microsoft 训练的模型提供支持的通用 AI 服务。此外,当前版本的 SynapseML 允许开发人员在其解决方案中利用预训练的[5]OpenAI模型,例如用于自然语言理解和生成的[6]GPT-3以及用于代码生成的 Codex。目前使用 OpenAI 模型需要访问 Azure OpenAI 服务。
最后,当前版本增加了对[7]MLflow的支持,这是一个管理 ML 生命周期的平台。开发人员可以使用它来加载和保存模型,并在模型执行期间记录消息。
现在.NET 机器学习社区加入了一新的成员SynapseML:
- [8]ML.NET 是一个 .NET 库,用于使用 .NET 语言运行单机工作负载:
 - [9]TensorFlow.NET :TensorFlow 绑定
 - [10]Keras.NET
 - [11]TorchSharp: PyTorch 绑定
 - [12]ONNX RT: ONNX 模型支持
 - [13]Apache Spark for .NET:为 Apache Spark 分布式计算框架提供 .NET 支持
 - [14]Microsoft Cognitive Toolkit (CNTK)是 Microsoft ML 库。它还有一个.NET API ,他已经停止开发。
 - [15]Accord.NET是一个面向视觉和音频处理的 .NET 机器学习库,已经停止开发。
 
在 .NET 社区中,开发人员对所有这些库如何相互比较或它们是否相互替换存在混淆。SynapseML 项目成员在[16]Reddit上积极回答这些问题。

SynapseML 构建在Apache Spark for .NET项目之上,该项目为 Apache Spark 分布式计算框架提供 .NET 支持。Apache Spark 是用 Scala(JVM 上的一种语言)编写的,但具有 Python、R、.NET 和其他语言的语言绑定。此版本为 SynapseML 库中的所有模型和学习器添加了完整的 .NET 语言支持,因此您可以在 .NET 中创作分布式机器学习管道,以便在 Apache Spark 集群上执行。
相关链接:
[1]微软深度学习库 SynapseML:可直接在系统中嵌入 45 种不同机器学习服务、支持 100 多种语言文本翻译: https://mp.weixin.qq.com/s/UBoF3wYsf5fqBsbRpHk4pg
[2]用于 .NET 的 SynapseML: https://devblogs.microsoft.com/dotnet/announcing-synapseml-for-dotnet/
[3]Dapr: http://dapr.io/
[4]认知服务 : https://azure.microsoft.com/zh-cn/services/cognitive-services/
[5]OpenAI: https://openai.com/api/
[6]GPT-3: https://en.wikipedia.org/wiki/GPT-3
[7]MLflow: https://mlflow.org/
[8]ML.NET :https://dotnet.microsoft.com/zh-cn/apps/machinelearning-ai/ml-dotnet
[9]TensorFlow.NET:https://github.com/SciSharp/TensorFlow.NET
[10]Keras.NET: https://github.com/SciSharp/Keras.NET
[11]TorchSharp: https://github.com/dotnet/TorchSharp
[12]ONNX RT:https://github.com/microsoft/onnxruntime
[13]Apache Spark for .NET:https://dotnet.microsoft.com/en-us/apps/data/spark
[14]Microsoft Cognitive Toolkit (CNTK):https://docs.microsoft.com/en-us/cognitive-toolkit/using-cntk-with-csharp
[15]Accord.NET: http://accord-framework.net/
[16]Reddit: https://www.reddit.com/r/dotnet/comments/wk7zkq/microsoft_announces_new_scalable_machine_learning/
深度学习库 SynapseML for .NET 发布0.1 版本的更多相关文章
- 百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。
		
百度为何开源深度机器学习平台? 有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举. 5月20日,百度在github上开源了其 ...
 - 64位Win7下安装并配置Python3的深度学习库:Theano
		
注:本文全原创,作者:Noah Zhang (http://www.cnblogs.com/noahzn/) 这两天在安装Python的深度学习库:Theano.尝试了好多遍,CMake.MinGW ...
 - 深度学习环境搭建:Tensorflow1.4.0+Ubuntu16.04+Python3.5+Cuda8.0+Cudnn6.0
		
目录 深度学习环境搭建:Tensorflow1.4.0+Ubuntu16.04+Python3.5+Cuda8.0+Cudnn6.0 Reference 硬件说明: 软件准备: 1. 安装Ubuntu ...
 - MXNet深度学习库简介
		
MXNet深度学习库简介 摘要: MXNet是一个深度学习库, 支持C++, Python, R, Scala, Julia, Matlab以及JavaScript等语言; 支持命令和符号编程; 可以 ...
 - windows下Anaconda3配置TensorFlow深度学习库
		
Anaconda3(python3.6)安装tensorflow Anaconda3中安装tensorflow3是非常简单的,仅需通过 pip install tensorflow 测试代码: imp ...
 - Kelp.Net是一个用c#编写的深度学习库
		
Kelp.Net是一个用c#编写的深度学习库 基于C#的机器学习--c# .NET中直观的深度学习 在本章中,将会学到: l 如何使用Kelp.Net来执行自己的测试 l 如何编写测试 l ...
 - 人工智能不过尔尔,基于Python3深度学习库Keras/TensorFlow打造属于自己的聊天机器人(ChatRobot)
		
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_178 聊天机器人(ChatRobot)的概念我们并不陌生,也许你曾经在百无聊赖之下和Siri打情骂俏过,亦或是闲暇之余与小爱同学谈 ...
 - 30个深度学习库:按Python、C++、Java、JavaScript、R等10种语言分类
		
30个深度学习库:按Python.C++.Java.JavaScript.R等10种语言分类 包括 Python.C++.Java.JavaScript.R.Haskell等在内的一系列编程语言的深度 ...
 - Python机器学习库和深度学习库总结
		
我们在Github上的贡献者和提交者之中检查了用Python语言进行机器学习的开源项目,并挑选出最受欢迎和最活跃的项目. 1. Scikit-learn(重点推荐) www.github.com/sc ...
 
随机推荐
- 【python基础】第10回 周总结
			
路径 可以简单的理解为路径就是某个事物所在的具体位置(坐标) 1.相对路径:必须有一个参考系,就是相对于自己的目标文件的位置. 2.绝对路劲:不需要有参考系,是指文件在硬盘上真正存在的路径. 计算机五 ...
 - sql-DQL-单表查询
			
单表查询 select [distint]* 字段列表 from 表名列表 where 条件列表 group by 分组字段 having 分组之后的条件 order by 排序 limit 分页限定 ...
 - 【python量化】将Transformer模型用于股票价格预测
			
本篇文章主要教大家如何搭建一个基于Transformer的简单预测模型,并将其用于股票价格预测当中.原代码在文末进行获取.小熊猫的python第二世界 1.Transformer模型 Transfor ...
 - python线程池 ThreadPoolExecutor 的用法及实战
			
写在前面的话 (https://jq.qq.com/?_wv=1027&k=rX9CWKg4) 文章来源于互联网从Python3.2开始,标准库为我们提供了 concurrent.future ...
 - SpringBoot开发 - 什么是热部署和热加载?devtool的原理是什么?
			
在SpringBoot开发调试中,如果我每行代码的修改都需要重启启动再调试,可能比较费时间:SpringBoot团队针对此问题提供了spring-boot-devtools(简称devtools)插件 ...
 - ESP分区重建,解决各种引导问题
			
电脑装了双系统,win7和win10,每次重启都进入不同系统,郁闷至极,索性把不常用的Win7盘格式化,但依旧解决不了问题.所以有了以下方法. 1.进PE删除ESP分区(先备份). 2.新建ESP分区 ...
 - centos更改mac
			
centos 6更改mac vim /etc/udev/rules.d/70-persistent-net.rules
 - Scala(二)IO流 读取文件和保存文件
			
package com.shujia.scala import java.io.{BufferedReader, FileReader, FileWriter} import scala.io.{Bu ...
 - 简答一波 HashMap 常见八股面试题 —— 算法系列(2)
			
请点赞,你的点赞对我意义重大,满足下我的虚荣心. Hi,我是小彭.本文已收录到 GitHub · Android-NoteBook 中.这里有 Android 进阶成长知识体系,有志同道合的朋友,关注 ...
 - ShardingSphere数据分片
			
码农在囧途 坚持是一件比较难的事,坚持并不是自欺欺人的一种自我麻痹和安慰,也不是做给被人的,我觉得,坚持的本质并没有带着过多的功利主义,如果满是功利主义,那么这个坚持并不会长久,也不会有好的收获,坚持 ...