Java机器学习软件介绍

  编写程序是最好的学习机器学习的方法。你可以从头开始编写算法,但是如果你要取得更多的进展,建议你采用现有的开源库。在这篇文章中你会发现有关Java中机器学习的主要平台和开放源码库包。

环境

本节描述可用于机器学习的java环境或工作台。他们被称为环境,因为他们为执行机器学习任务提供了图形用户界面,但也提供了Java api供使用者开发自己的应用程序。

Weka

Waikato Environment for Knowledge Analysis (Weka) 是一个机器学习的平台开发,由新西兰的怀卡托大学用Java编写的。提供一个图形用户界面,命令行界面和Java API。这可能是最流行的Java机器学习库和最好的开始机器学习或实践的起点。

KNIME

Konstanz Information Miner (KIME) 是一个德国康斯坦茨大学开发的分析和报告平台。它是关注医药研究开发的,但可扩展到一般商业智能。它提供了一个图形用户界面(基于Eclipse)和Java API。

RapidMiner

RapidMiner 在过去被称为另一个学习环境(YALE),是由德国多特蒙德大学开发的技术。它提供了一个GUI和Java API来开发自己的应用程序。它提供了数据处理、可视化建模和机器学习算法。

ELKI

Environment for DeveLoping KDD-Applications Supported by Index-Structures (ELKI) 是一个Java开发的数据挖掘工作台,由德国慕尼黑大学开发。它有一个专注于处理关系数据库的数据,用于异常值检测和分类(基于距离函数的方法)。它提供了一个迷你GUI,命令行接口和Java API。

库包

下面是机器学习的库包,它们都有Java API,提供器学习在某个方面成就。

Java-ML

Java Machine Learning Library (Java-ML) 提供了一个用Java实现机器学习算法的集合。每个算法它都提供了一个标准接口,但是没有ui,没有相关引用以便进一步阅读相关的科学文献。它包括数据操作方法、聚类、特征选择和分类。

JSTAT

Java Statistical Analysis Tool (JSTAT) 提供了标准的纯Java实现机器学习算法,包括small-ish问题。作者承认开发这个库包是为了自己修炼学习。然而算法列表令人印象深刻。它包括分类、回归、合奏、集群和特征选择方法。

大数据

Mahout (Hadoop)

Apache Mahout提供了在Apache Hadoop平台上(分布式使用map-reduce模式)使用机器学习算法的实现。这个项目提供了一个专注于聚类和分类算法和一个受欢迎的应用程序驱动实现,其针对推荐系统使用协同过滤。

MLlib (Spark)

Apache Mchine Learning Library提供了用于Apache Spark的平台(HDFS,但不是使用Map-reuce模式)实现的机器学习算法。支持Java平台,Scala和Python绑定。库包是很新,算法的列表也很短,但发展迅速。

MOA

Massive Online Analysis (MOA) 是一个新西兰怀卡托大学为数据流挖掘开发的开源的平台设计。某些地方像Weka,它提供了一个GUI,命令行接口和Java API。它提供了一长串的算法着重分类和支持异常值检测和解决概念漂移。MOA使用Advanced Data mining And Machine learning System (ADAMS) 作为管理工作流。

SAMOA

Scalable Advanced Massive Online Analysis (SAMOA) 是一个由雅虎开发的分布式流媒体机器学习框架。它被设计为运行在Apache Storm 风暴和Apache S4上。系统可以利用MOA 所提供的算法如分类等任务。

自然语言处理

本节是关于从机器学习的分支称为自然语言处理(NLP)的Java库和项目。

  • OpenNLP: Apache OpenNLP 是一个处理自然语言文本的工具包。它提供了NLP等任务的方法,如标记 分割和实体提取。
  • LingPipe: LingPipe是计算语言学的工具包,包括主题分类方法、实体提取、聚类和情感分析。.
  • GATE: The General Architecture for Text Engineering (GATE) 是一个用于文本处理开源库。它针对不同的用例提供了一系列子项目。
  • MALLET: Machine Learning for Language Toolkit (MALLET) 是一个Java工具包统计自然语言处理,文档分类、聚类、主题建模和信息提取。

Computer Vision(CV)

  • BoofCV: BoofCV是一个开源库用于计算机视觉和机器人应用程序。它支持功能,如图像处理,特征,几何愿景、校准、识别和图像数据

Deep Learning深度学习

本节列出使用神经网络和深入学习的关键Java库.

  • Encog: Encog 是一个机器学习库提供算法支持向量机等古典神经网络,遗传编程,贝叶斯网络,嗯,遗传算法
  • Deeplearning4j: Deeplearning4j 声称是用Java编写的商用深度学习图书馆。它被描述为兼容Hadoop并提供算法包括限制玻耳兹曼机,deep-belief网络和Stacked Denoising Autoencoders(SdA)。

机器学习流行算法一览

最好的开源报表工具

Apache Spark机器学习初级教程

更多机器学习专题

Java机器学习软件介绍的更多相关文章

  1. java机器学习工具包

    下面是25个Java机器学习的工具&&库列表: 1. Weka 是一个数据挖掘任务机器学习算法的集合.这些算法可以直接应用于数据集或者在你自己的Java代码中调用.Weka 包含 数据 ...

  2. 软件介绍(apache lighttpd nginx)

    一.软件介绍(apache  lighttpd  nginx) 1. lighttpd Lighttpd是一个具有非常低的内存开销,cpu占用率低,效能好,以及丰富的模块等特点.lighttpd是众多 ...

  3. 25个Java机器学习工具和库

    本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法.这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用.Weka包括一系列的工具,如数据预 ...

  4. 如何开始使用 Java 机器学习

    开始Java机器学习的最好工具是什么? 这个问题已经有一段时间了,但最近这些日子几乎每个人都在谈论人工智能和机器学习.这已经不再是一个保留给科学家和研究者的秘密,而是几乎实现于每一项新兴技术中. 在下 ...

  5. 【转】Spring学习---Bean配置的三种方式(XML、注解、Java类)介绍与对比

    [原文]https://www.toutiao.com/i6594205115605844493/ Spring学习Bean配置的三种方式(XML.注解.Java类)介绍与对比 本文将详细介绍Spri ...

  6. 25个Java机器学习工具&库--转载

    本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法.这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用.Weka包括一系列的工具,如数据预 ...

  7. 转:25个Java机器学习工具和库

    转自:http://www.cnblogs.com/data2value/p/5419864.html 本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习 ...

  8. 一.软件介绍(apache lighttpd nginx)

    一.软件介绍(apache  lighttpd  nginx) 1. lighttpd Lighttpd是一个具有非常低的内存开销,cpu占用率低,效能好,以及丰富的模块等特点.lighttpd是众多 ...

  9. java25个Java机器学习工具&库

    本列表总结了25个Java机器学习工具&库: 1. Weka集成了数据挖掘工作的机器学习算法.这些算法可以直接应用于一个数据集上或者你可以自己编写代码来调用.Weka包括一系列的工具,如数据预 ...

随机推荐

  1. Apache NiFi Processor实战

    1 前言 Apache NiFi是什么?NiFi官网给出如下解释:“一个易用.强大.可靠的数据处理与分发系统”.通俗的来说,即Apache NiFi 是一个易于使用.功能强大而且可靠的数据处理和分发系 ...

  2. spring第9天(事务)

    依赖:spring-context,spring-jdbc(这个本身有依赖spring-tx,关于事务的),druid,mysql-connector-java,aspectjweaver五个 由于我 ...

  3. PHP基础(9.27 第十三天)

    什么是PHP,为什么要学习PHP:  (1)php是嵌入html页面中的脚本语言   (2)目前最流行的网站开发语言  (3)在几乎所有平台中都可以运行  (4)很多企业都在使用PHP作为开发语言 P ...

  4. 洛谷 P1043 数字游戏

    题目传送门 解题思路: 跟石子合并差不多,区间DP(环形),用f[i][j][s]表示从i到j分成s段所能获得的最大答案,枚举断点k,则f[i][j][s] = min(f[i][j][s],f[i] ...

  5. 【pwnable.kr】fb

    这是pwnable.kr的签到题,记录pwn入门到放弃的第一篇. ssh fd@pwnable.kr -p2222 (pw:guest) 题目很简单,登录上了ssh后,发现了3个文件:fd,fd.c, ...

  6. php base64编码图片上传七牛

    上网上找了好几个例子 都是自己写curl上传 感觉七牛这么多年了不应该sdk不提供一个方法 然后试 试 试 显示put 方式 上传上去 就是个字符串 后来换成文件上传方法 putFile 成了 不废话 ...

  7. docker - how do you disable auto-restart on a container?

    https://stackoverflow.com/questions/37599128/docker-how-do-you-disable-auto-restart-on-a-container 9 ...

  8. uboot 学习笔记

    ram 初始化: 在 start.S 中, bl cpu_init_crit 这句,在 tq2440 中是直接调用,在韦东山里面是通过和 TEXT_BASE 进行比较,如果从 RAM 中运行就不进行 ...

  9. linux文件编辑VI命令详解

    vi编辑器是所有Unix及Linux系统下标准的编辑器,它的强大不逊色于任何最新的文本编辑器,这里只是简单地介绍一下它的用法和一小部分指令.由于对Unix及Linux系统的任何版本,vi编辑器是完全相 ...

  10. python刷LeetCode:21. 合并两个有序链表

    难度等级:简单 题目描述: 将两个有序链表合并为一个新的有序链表并返回.新链表是通过拼接给定的两个链表的所有节点组成的. 示例: 输入:1->2->4, 1->3->4输出:1 ...