15开源顶级人工智能工具
以下开源的人工智能应用是人工智能研究的前沿。
1.咖啡
它是贾在加州大学伯克利分校攻读博士学位时发明的。Caffe是基于表达式架构和可扩展代码的深度学习框架。让它出名的是它的速度,这让它很受研究人员和企业用户的欢迎。据其网站介绍,仅一个NVIDIA K40 GPU一天就可以处理超过6000万张图像。它由伯克利视觉和学习中心(BVLC)管理,并由NVIDIA和亚马逊等公司提供支持。
2.CNTK
是计算机网络工具包的缩写,CNTK是微软的开源人工智能工具。它在单个CPU、单个GPU、多个GPU或多台具有多个GPU的机器上都具有出色的性能。微软主要用于语音识别研究,但在机器翻译、图像识别、图像字幕、文本处理、语言理解、语言建模等方面都有很好的应用。
3.深度学习4j
Deeplearning4j是java虚拟机(JVM)的开源深度学习库。它运行在分布式环境中,集成在Hadoop和Apache Spark中。这使得配置深度神经网络成为可能,并且兼容Java、Scala等JVM语言。
4.DMTK
DMTK分布式机器学习工具包的缩写,和CNTK一样,是微软的开源人工智能工具。作为一个为大数据设计的应用,它的目标是更快地训练人工智能系统。它包括三个主要组件:DMTK框架、LightLDA主题模型算法和分布式(多义词)单词嵌入算法。为了证明自己的速度,微软声称,在一台八集群机器上,它可以“训练一个主题模型,其词汇量为654.38+000万个主题,654.38+00万个单词(总* * * 654.38+00万亿个参数),并在一个文档中收集654.38+000亿个符号”。这一成就是其他工具无法比拟的。
5.H20
相比科研,H2O更注重为企业用户服务AI,所以H2O有大量的企业客户,比如第一资本金融、思科、尼尔森卡特琳娜、PayPal、泛美等。它声称任何人都可以使用机器学习和预测分析的力量来解决商业问题。它可用于预测建模、风险和欺诈分析、保险分析、广告技术、医疗保健和客户智能。
它有两个开源版本:标准版H2O和火花水版本,它集成在Apache Spark中。还有付费企业用户支持。
6.象夫
它是Apache基金会的项目,Mahout是一个开源的机器学习框架。根据其网站介绍,它有三个主要特点:一个用于构造可扩展算法的编程环境,像Spark和H2O这样的预制算法工具,以及一个名为Samsara的向量数学实验环境。使用Mahout的公司包括Adobe、埃森哲咨询公司、Foursquare、英特尔、LinkedIn、Twitter、雅虎和许多其他公司。其网站列出了第三方的专业支持。
7.MLlib
由于速度快,Apache Spark已经成为最受欢迎的大数据处理工具。MLlib是Spark的可扩展机器学习库。它集成了Hadoop,可以与NumPy和r互操作,包含分类、回归、决策树、推荐、聚类、主题建模、函数转换、模型评估、ML流水线架构、ML持久化、生存分析、频繁项集和序列模式挖掘、分布式线性代数和统计学等多种机器学习算法。
8.努皮克
NuPIC由Numenta管理,是一个基于分层临时记忆理论的开源人工智能项目。本质上,HTM试图创造一个计算机系统来模仿人类大脑皮层。他们的目标是创造一种“在许多认知任务中接近或超过人类认知能力”的机器。
除了开源许可,Numenta还为NuPic提供商业许可协议,它还提供技术专利的许可。
9.OpenNN
作为一个为开发者和研究人员设计的具有高级理解能力的人工智能,OpenNN是一个实现神经网络算法的c++编程库。它的主要特性包括深层架构和快速性能。在其网站上可以找到丰富的文档,包括解释神经网络基础知识的入门教程。
10.OpenCyc
Cycorp开发的OpenCyc提供了对Cyc知识库和常识推理引擎的访问。它有超过239,000个条目,大约2,093,000个三元组和大约69,000个owl:它是一种类似于链接到外部语义库的名称空间。它在丰富的领域模型、语义数据集成、文本理解、特定领域专家系统和游戏人工智能等方面都有很好的应用。该公司还提供另外两个版本的Cyc:一个是科研免费但不开源,另一个是企业免费但需要付费。
11.大羚羊2
Oryx 2基于Apache Spark和Kafka构建,是一个专门针对大规模机器学习的应用开发框架。它采用独特的三层λ架构。开发人员可以使用Orys 2创建新的应用程序,它也有一些预构建的应用程序,可以用于常见的大数据任务,如协同过滤、分类、回归和聚类。大数据工具供应商Cloudera创建了最初的Oryx 1项目,并一直积极参与可持续发展。
12.预测
今年2月,Salesforce收购了PredictionIO,随后在7月将平台和商标贡献给了Apache Foundation,后者将其列为孵化计划。因此,当Salesforce使用PredictionIO技术来提高其机器学习能力时,效果也会出现在开源版本中。它可以帮助用户创建一个具有机器学习功能的预测引擎,用于部署可以实时动态查询的Web服务。
13.SystemML
SystemML最初由IBM开发,现在是Apache大数据项目。它为高级数学运算提供了一个高度可扩展的平台,它的算法是用R或类似python的语法编写的。企业一直在使用它来跟踪汽车维修的客户服务,规划机场交通,并将社交媒体数据与银行客户联系起来。它可以运行在Spark或Hadoop上。
14.张量流
TensorFlow是谷歌的开源人工智能工具。它提供了一个使用数据流图进行数值计算的库。它可以在许多具有单个或多个CPU和GPU的不同系统上运行,甚至可以在移动设备上运行。它具有深刻的灵活性,真正的可移植性,自动微分功能,并支持Python和c++。它的网站上有一个非常详细的教程列表,帮助开发人员和研究人员沉浸在使用或扩展其功能中。
15.火炬
Torch将自己描述为“一个广泛支持以GPU为主的机器学习算法的科学计算框架”,其特点是灵活性和速度。此外,它还可以通过软件包方便地用于机器学习、计算机视觉、信号处理、并行处理、图像、视频、音频和网络。它依赖于一种叫做LuaJIT的脚本语言,这种语言基于Lua。
欢迎关注~
微信微信官方账号:IT程序员,免费提供人工智能、大数据、云计算等资料~ ~无论你在地球的哪个角落,欢迎你的关注!