首页 > 美妆 > 正文

23个深度学习库排名,你知道几个?

  • 人民邮电出版社京东自营官方旗舰店
  • 2023-06-09 06:04
  • 10
摘要:基于 Github 和 Stack Overflow 上的活跃度以及 Google 搜索结果,The Data Incubator 最近制作了一个 23 个热门

基于 Github 和 Stack Overflow 上的活跃度以及 Google 搜索结果,The Data Incubator 最近制作了一个 23 个热门深度学习库的排名。

下表显示了标准化后的分数,其中值 1 表示高于平均值的一个标准偏差(平均值为 0)。 例如,Caffe 在 Github 中的活动是一个高于平均水准的标准差,而 deeplearning4j 接近平均水平。见末尾的方法。

结果和讨论

该排名基于三个同等重要的部分:Github(star 和 fork),Stack Overflow(标签和问题)和 Google 搜索结果(总和以及季度增长率)。这 3 部分是通过可用的 API 获得的。想弄一个全面的深入学习工具包列表不容易,所以在最后选取了我们认为具有代表性的五个不同的列表(有关详细信息,请参阅下面的方法)。计算每种度量的标准化分数,使我们能够看到在每个类别中哪些包是脱颖而出的。 完整排名 在这里,而 原始数据 在这里。

TensorFlow 在最大活跃社区中占主导

TensorFlow 在所有计算度量上的平均值上至少有两个标准偏差。TensorFlow 和第二大流行框架 Caffe 相比,在 Github 上的 fork 数几乎是后者的三倍,在 Stack Overflow 上的问题总量是后者的六倍以上。TensorFlow 由 Google Brain 团队于 2015 年首度开放,已经超过了众多的高级库,如 Theano(4)和 Torch(8),成为我们榜单的首位。TensorFlow 虽然与在 C++ 引擎上运行的 Python API 一起分发,但表中的几个库可以将 TensorFlow 用作后端,并提供它们自己的接口。这些库包括了 Keras(2),将很快成为 TensorFlow 和 Sonnet 的核心部分(6)。TensorFlow 的流行可能是其通用的深度学习框架,灵活的界面,好看的计算图形可视化和 Google 的重要开发人员和社区资源的合力下的结果。

Caffe 尚未被 Caffe2 所取代

Caffe 在我们的名单上排名第三,除了 TensorFlow 外,Caffe 其在 Github 上的活跃度比其他竞争对手都要多。Caffe 传统上被认为比 Tensorflow 更专业,并且专注于图像处理,目标识别和预先训练的卷积神经网络。Facebook 于 2017 年 4 月发布了 Caffe2(11),并且已经排在了深入学习库的上半部分。Caffe2 是一个更轻巧、模块化和可扩展的 Caffe 版本,包括循环神经网络。Caffe 和 Caffe2 是相互独立的仓库(repo),所以数据科学家可以继续使用最初的 Caffe。然而,有一些迁移工具,比如如 Caffe Translator,它提供了一种使用 Caffe2 来驱动现有 Caffe 模型的方法。

Keras 是深度学习上最受欢迎的前端库

Keras(2)是排名最高的非框架库。Keras 可以用作 TensorFlow(1)、Theano(4)、MXNet(7)、CNTK(9)、deeplearning4j(14)的前端。在所有的三个衡量标准上, Keras 的表现均优于平均水平。Keras 的流行可能是由于其简单性和易用性。Keras 允许快速的原型化,但代价是牺牲了从框架直接运行而产生的一些灵活性和控制。数据科学家在数据集上做深度学习的相关实验时,Keras 受到了他们的青睐。随着 R Studio 最近发布了 Keras 的界面,Keras 的发展和受欢迎程度还在不断延续。

即使没有巨头支持,Theano 仍保持名列前茅

在新的深度学习框架的海洋中,Theano(4)是我们的排名中最古老的库。Theano 开创性地使用了计算图(computational graph),并在研究界普遍做深度学习和机器学习之时仍保持流行。Theano 本质上是一个 Python 的数值计算库,但可以与像 Lasagne 这样的高级深度学习库(15)一起使用。虽然 Google 支持 TensorFlow(1)和 Keras(2),Facebook 支持 PyTorch(5)和 Caffe2(11),MXNet(7)是 Amazon Web Services 的官方深度学习框架,Microsoft 设计并维护了 CNTK(9),Theano 在没受到行业巨头的正式支持下依然流行。

Sonnet 是增长最快的库

2017 年初,Google 的 DeepMind 公开发布了 Sonnet(6)的代码,这是一个以 TensorFlow 为基础的高级面向对象库。Sonnet 的 Google 搜索结果返回页数比上个季度增长了 272%,是我们列表中所有库中最大的。尽管 Google 在 2014 年收购了英国人工智能公司DeepMind,但 DeepMind 和 Google Brain 仍然在大体上是独立团队。DeepMind 专注于通用人工智能,Sonnet 可以帮助用户为他们的具体 AI 想法和研究做顶层设计。

Python 是深度学习的接口语言

PyTorch(5)是我们表中增长速度第二的库,该框架的唯一接口是 Python。与上季度相比,PyTorch 的 Google 搜索结果增加了 236%。在我们排的 23 个开源深度学习框架和包装器中,只有三个没有 Python 接口:Dlib(10)、MatConvNet(20)和OpenNN(23)。在 23 个库中,C ++ 和 R 接口分别只有 7 个和 6 个。虽然数据科学界在使用 Python 方面有些接近同一个共识,但对深度学习库而言,还有很多的选择。

限制

当然,有些库由于已经存在了更长的时间会有更高的数据,因此排名更高。唯一考虑到这一点的指标,是 Google 搜索季度增长率。

数据呈现中遇到的一些困难:

• ·神经设计和 wolfram 数学是专有的,故被删除

• ·cntk 也被称为「微软认知工具包」,但是我们只使用了 ctnk 名称

• ·neon 变成了 nervana neon

• ·paddle 被改为 paddlepaddle

• ·一些库显然是其他库的衍生品,如 Caffe 和 Caffe2。如果它们有单独/独立的 Github 仓库,我们分开处理这些库。

方法

所有源代码和数据都在 我们的 Github 页面 上。

我们首先从五个不同的来源中生成了 23 个开源深度学习库的列表,然后收集了所有这些库的指标,以获得排名。Github 的数据基于 star 数和 fork 数、Stack Overflow 的数据包含包名称的标签和问题,Google 搜索结果则基于过去五年的 Google 搜索结果总数,并计算结果在过去三个月与前三个月相比的季度增长率。

一些注意事项:

• ·有几个库是常用词汇(caffe、chainer、lasagne),因此用于确定 Google 搜索结果数量的搜索词,包括库的名称和术语即“deep learning”。

• ·任何不可用的 Stack Overflow 计数都转换为零计数。

• ·计数被标准化为均值 0 和偏差 1,然后平均得到 Github 和 Stack Overflow 分数,并结合 Serch 结果,从而得到总分。

• ·做了一些手动检查以确认 Github 仓库位置。

本文转载自36大数据(36dsj.com): 36大数据 » 23 个热门深度学习库的排名

深度学习和机器学习书单

1.深度学习

深度学习

本书适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。

本书由全球知名的三位专家Ian Goodfellow、Yoshua Bengio 和Aaron Courville撰写,是深度学习领域奠基性的经典图书。

AI圣经!深度学习领域奠基性的经典畅销书!长期位居美国亚马逊AI和机器学习类图书榜首!所有数据科学家和机器学习从业者的必读图书!特斯拉CEO埃隆•马斯克等国内外众多专家推荐! 本书会介绍深度学习领域的许多主题。

2. 深度学习精要(基于R语言)

深度学习精要 基于R语言

本书适合了解机器学习概念和R语言并想要使用R提供的包来探索深度学习应用的读者学习参考。

本书结合R语言介绍深度学习软件包H2O,帮助读者理解深度学习的概念。本书从在R中设置可获取的重要深度学习包开始,接着转向建立神经网络、预测和深度预测等模型,所有这些模型都由实际案例的辅助来实现。成功安装了H2O软件包后,你将学习预测算法。随后本书会解释诸如过拟合数据、异常数据以及深度预测模型等概念。最后,本书会介绍设计调参和优化模型的概念。 本书适合那些胸怀大志的数据科学家,他们精通R语言数据科学概念,并希望可以使用R中的包进一步探索深度学习范式

本书重点介绍如何将R语言和深度学习模型或深度神经网络结合起来,解决实际的应用需求。全书共6章,分别介绍了深度这习基础知识、训练预测模型、如何防止过拟合、识别异常数据、训练深度预测模型以及调节和优化模型等内容。

3. TensorFlow机器学习项目实战

TensorFlow机器学习项目实战

本书是介绍如何在产品中使用TensorFlow的实用教程。本书介绍了可以使用TensorFlow的多种情况,并通过真实世界的项目,向读者展示了如何使用TensorFlow。本书还讲解了在实际环境中使用TensorFlow的创新方法。

本书主要介绍第二代机器学习与数值计算,提供了训练模型、机器学习、深度学习以及使用各种神经网络的项目,以此来讲解TensorFlow的应用领域,还讨论如何使用TensorFlow计算复杂数值。

本书在教读者使用TensorFlow的同时,还展示了如何使用张量来探究各层的数据。只需选定一个跟读者环境相匹配的项目,就能学到如何在产品中应用TensorFlow的相关知识。读完本书后,读者将能通过TensorFlow有效改善项目的速度和效率。

本书包括以下内容:

● 加载、交互、剖析、处理和存储复杂数据集;

● 使用先进的技术来解决分类和回归问题;

● 使用线性回归模型预测简单时间序列的输出;

● 使用逻辑回归方法预测时间序列在未来的结果;

● 使用深度学习方法对图像进行分类;

● 标定图像集,并使用包括卷积神经网络层的深度神经网络生成绘画图像;

● 使用循环神经网络对时间信号进行预测并生成音乐。

4.TensorFlow技术解析与实战

TensorFlow技术解析与实战

TensorFlow是深度学习的最流行的框架之一,极适合新手入门。谷歌公司正致力于建立一个相关软件和机器学习模型的开源生态系统,这是人工智能发展的技术风口。

本书深入浅出,理论联系实际,实战案例新颖,适合对TensorFlow感兴趣的各层次读者阅读。

机器学习深度学习领域参考书

包揽TensorFlow1.1的新特性

人脸识别 语音识别 图像和语音相结合等热点一应俱全

李航 余凯等人工智能领域专家倾力推荐

本书基于TensorFlow1.1版本,深入TensorFlow基础原理、设计理念、编程模型、源码分析和模型构建、工业界应用、大规模数据训练等。全书分为基础篇、实战篇和提高篇三部分。 “基础篇”

•人工智能入门,学习深度学习的方法。

• TensorFlow基础原理、设计架构和编程模型。

• 常用API、批标准化、模型的存储与加载、队列及线程、实现一个自定义OP。

• TensorBorad可视化的全面解析。

• 源码分析。

• 神经网络(CNN和RNN)的发展演化以及如何用TensorFlow实现这些网络。

• 第三方上层框架Keras和TFLearn的应用。

“实战篇”

• 用TensorFlow实现第1个神经网络。

• 用TensorFlow实现CNN、RNN、LSTM和自动编码器的各种示例。

• TensorFlow在人脸识别、语音识别、智能机器人、语音和图像相结合以及生成式对抗网络(GAN)等领域的实际应用。

“提高篇”

• TensorFlow的分布式原理、架构和模式。

• 移动端开发(Android、iOS和树莓派)。

• TensorFlow的新特性,线性代数编程框架XLA、调试器Debugger、动态图Fold、生产环境Serving。

• TensorFlow和Kubernetes相结合。

• TensorFlowOnSpark。

• 硬件计算加速。

• 机器学习的评测体系。

5. Python机器学习实践指南

Python机器学习实践指南

本书适合Python 程序员、数据分析人员、对算法感兴趣的读者、机器学习领域的从业 人员及科研人员阅读。

机器学习是近年来渐趋热门的一个领域,同时Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。本书结合了机器学习和Python 语言两个热门的领域,通过利用两种核心的机器学习算法来将Python 语言在数据分析方面的优势发挥到极致。 全书共有10 章。第1 章讲解了Python 机器学习的生态系统,剩余9 章介绍了众多与机器学习相关的算法,包括各类分类算法、数据可视化技术、推荐引擎等,主要包括机器学习在公寓、机票、IPO 市场、新闻源、内容推广、股票市场、图像、聊天机器人和推荐引擎等方面的应用。

6. Python机器学习——预测分析核心算法

Python机器学习 预测分析核心算法

本书主要针对想提高机器学习技能的Python 开发人员,帮助他们解决某一特定的项目或是提升相关的技能。

在学习和研究机器学习的时候,面临令人眼花缭乱的算法,机器学习新手往往会不知 所措。本书从算法和Python 语言实现的角度,帮助读者认识机器学习。 本书专注于两类核心的“算法族”,即惩罚线性回归和集成方法,并通过代码实例来 展示所讨论的算法的使用原则。全书共分为7 章,详细讨论了预测模型的两类核心算法、预测模型的构建、惩罚线性回归和集成方法的具体应用和实现。

机器学习关注于预测,其核心是一种基于数学和算法的技术,要掌握该技术,需要对数学及统计概念有深入理解,能够熟练使用R 语言或者其他编程语言。 本书通过集中介绍两类可以进行有效预测的机器学习算法,展示了如何使用Python 编程语言完成机器学习任务,从而降低机器学习难度,使机器学习能够被更广泛的人群掌握。 作者利用多年的机器学习经验带领读者设计、构建并实现自己的机器学习方案。本书尽可能地用简单的术语来介绍算法,避免复杂的数学推导,同时提供了示例代码帮助读者迅速上手。读者会很快深入了解模型构建背后的原理,不论简单问题还是复杂问题,读者都可以学会如何找到问题的解决算法。书中详细的示例,给出了具体的可修改的代码,展示了机器学习机理,涵盖了线性回归和集成方法,帮助理解使用机器学习方法的基本流程。