全国服务QQ:3447249690

KDnuggets:2018年数据科学和OPE体育机器学习工具排名 Python排名第一

发布时间:2019-02-07 作者:OPE体育智能系统

感谢您支撑199IT开展,可参加199IT常识沟通群3000+用户,最有价值同享和评论! 点击即可参加!
KDnuggets:2018年数据科学和OPE体育机器学习东西排名 Python排名榜首互联网数据资讯中心-199IT2018年05月28日作者 翠花日子数据

近来,闻名数据科学网站 KDnuggets 发布了 2018 年数据科学和OPE体育机器学习东西查询成果。逾越 2000 人对自己「曩昔 12 个月内涵项目开发中运用过的数据发掘/OPE体育机器学习东西和编程言语」进行了投票。该计算还对曩昔三年来的排名进行了比照剖析。


这份投票成果既有意料之内,也有意料之外的部分。数据显现,Python 作为OPE体育机器学习常用的编程言语正在不断扩大抢先优势,R 言语的运用率榜初次降到了 50% 以下。在深度学习结构上,最近呼声很高的深度学习结构 PyTorch 只是占有了 6.4% 的运用率,远远落后于 TensorFlow 的 29.9% 和 Keras 的 22.2%。

Python 持续腐蚀着 R 的用户范畴,RapidMiner 抢手度添加,SQL 保持稳定,TensorFlow 和 Keras 引领行进,Hadoop 式微,数据科学渠道整合等等。

第 19 次年度 KDnuggets 软件查询有逾越 2300 人参加投票,稍微少于 2017 年,或许是因为仅有一个供货商 RapidMiner 活泼地参加 KDnuggests 查询的投票。均匀来说,每个参加者挑选 7 个运用过的不同东西,因而仅投票一个东西会带来误差。KDnuggets 扫除了大约 260 个这样的「独好」投票(首要来自 RapidMiner),因为即便他们代表了该东西的合法用户,他们的行为也是非典型的,并且会曲解成果。

以下是依据 2052 个参加者的初始成果剖析,其间「独好」投票者已被扫除。更多详细剖析和匿名数据将在大约两周内发布。

最受欢迎的剖析、数据科学、OPE体育机器学习东西

图 1:KDnuggests 剖析/数据科学 2018 年软件查询:2018 年最受欢迎东西,以及它们相关于 2016-2017 年的排名改变。(为了更有用的比较,KDnuggests 扫除了「独好」投票者并从头计算了 2016 年、2017 年的查询成果。)

上图显现了排名前 11 的东西,每个东西的运用率至少为 20%。

表 1:KDnuggests 2018 年软件查询最受欢迎的剖析/数据科学/OPE体育机器学习软件

在这里,「2018 % share」一栏是指运用该东西的用户百分比,「% change」是指和 2017 年软件查询比较的改变份额,绿色和赤色符号标明份额的改变起伏到达了 10% 或更多。

每个投票人的均匀运用东西数量是 7 个,稍微高于 2017 年查询的 6.75 个(也扫除了「独好」投票人)。

和 2017 年的软件查询比较,进入前 11 名的新东西是 Keras。Knime 从第 11 名跌落,或许是因为本年他们并没有活泼调集其用户参加投票。

以下是一些查询成果。

Python 正在吞噬 R 的用户范畴

2017 年 Python 的运用率逾越 50%,本年它的运用率上升至 66%,而 R 的运用率初次跌落,跌破 50%。

RapidMiner 

在之前的几回问卷中,RapidMiner 这一尖端数据科学渠道正快速传达,它的用户运用率由 2017 年的 33% 增加到了本年的 52.7%。依据 RapidMiner 的开创人和董事长 Ingo Mierswa,他们采取了一些办法鼓舞用户参加该查询。

关于 KDnuggets 的问卷查询,Ingo Mierswa 说:「近两年咱们都向用户发送邮件推行该问卷查询,但本年有逾越 400 多位用户回邮件标明很快乐能协助 RapidMiner 的传达。并且本年 RapidMiner 月度活泼用户增加率超出上一年 300%,因而咱们向更多用户发送了关于 KDnuggets 问卷查询的邮件。我很快乐看到如此活泼的社区。」

SQL 保持稳定

作为数据管理体系的程序言语,SQL(包含 Spark SQL 和 SQL to Hadoop 东西)持续保持着约 40% 的运用率,和之前 3 次查询成果相同。因而,假如你是一位有雄心勃勃的数据科学家,学习 SQL 吧,它在很长一段时间里都会很有用!

趋势

该查询仅有运用率逾越 2% 的新东西是 Spark SQL,运用率到达 11.7%。下表列举了运用率增幅到达 20% 及以上、2018 年运用率为 3% 以上的东西。

表 2:运用率增幅最大的首要剖析/数据科学/OPE体育机器学习东西。

整合

2017 年运用率到达 2% 及以上的 56 个东西中,有 19 个(仅 1/3)东西在 2018 年运用率有所上升,其他 37 个均下降。这和近期的收买案(Datawatch 收买 Angoss、Minitab 收买 Salford)一道标明数据科学渠道的整合正在进行过程中。

2017 年运用率至少 3% 的东西,本年下降了 25% 乃至更多,详见下表。

表 3:运用率跌幅最大的首要剖析/数据科学东西。

深度学习东西

近两年,该查询中运用深度学习东西的投票者所占份额保持稳定。2018 年有 33% 的投票者运用深度学习东西,2017 年和 2016 年分别有 32% 和 18%。谷歌保护的 TensorFlow 仍然占主导地位,而开展迅速的 Keras 可作为构建在 TensorFlow 和 MXNet 等结构上的高档 API。

另一方面,首要由 Facebook 推进,推出已过一年的 PyTorch 招引了一批研讨者和工程人员,运用率到达 6.4%,排名第三。因为这款深度学习结构已和 Caffe2 兼并,在未来咱们必定将会看到 PyTorch 占有更大的份额。

不过 KDnuggets 更重视数据科学,也更常运用浅层的OPE体育机器学习算法。咱们或许更期望了解OPE体育机器学习及深度学习社区在结构上的挑选,因而读者能够在文末对常用的深度学习结构进行投票。

深度学习东西排名:

Tensorflow, 29.9% Keras, 22.2% PyTorch, 6.4% Theano, 4.9% Other Deep Learning Tools, 4.9% DeepLearning4J, 3.4% Microsoft Cognitive Toolkit (Prev. CNTK), 3.0% Apache MXnet, 1.5% Caffe, 1.5% Caffe2, 1.2% TFLearn, 1.1% Torch, 1.0% Lasagne, 0.3%

大数据东西:Hadoop 运用率下降

2018 年,大约 33% 的用户运用大数据东西,要么是 Hadoop,要么是 Spark,和 2017 年相同。但 Hadoop 的运用率明显下降,跌幅逾越 30%。

以下是相关细节:

编程言语

Python 好像不只正在替代 R,还包含除了 SQL、Java、C/C++ 之外的大多数其它言语,这三者与 Python 大致处于同一个等级。自 KDnuggets 开端做这项查询以来,R 运用率初次呈现跌落。其它言语也呈现了式微的趋势。

以下是按抢手度排序的首要编程言语:

Python, 65.6% (was 59.0% in 2017), 11% up R, 48.5% (was 56.6%), 14% down SQL, 39.6% (was 39.2%), 1% up Java, 15.1% (was 15.5%), 3% down Unix, shell/awk/gawk, 9.2% (was 10.8%), 15% down Other programming and data languages, 6.9%, (was 7.6%), -9% down C/C++, 6.8%, (was 7.1%), 3% down Scala, 5.9%, (was 8.3%), 29% down Perl, 1.0% (was 1.9%), 46% down Julia, 0.7% (was 1.2%), 45% down Lisp, 0.3% (was 0.4%), -25% down Clojure, 0.2% (was 0.3%), -38% down F, # 0.1% (was 0.5%), -73% down

区域参加度

本次查询中不同区域的参加份额是:

欧洲,37.5% 美国/加拿大,36.6% 亚洲,11.7% 拉丁美洲,6.6% 非洲/中东,4.5% 澳大利亚/新西兰,3.1%

和 2017 年比较,首要的改变是欧洲的参加份额变高了(之前为 35.5%),而美国/加拿大的参加份额变低了(之前为 41.5%)。

完好成果和 3 年来的趋势

以下表格展现了查询成果的细节(因为篇幅约束,此处仅列出排名前 12 的东西):

自 机器之心

更多阅览:大规模OPE体育机器学习:将数据科学引进出产体系架构的典型形式KDNuggets:数据科学家运用东西查询Stack Overflow:2017年抢手编程言语“分时段”排行榜IEEE Spectrum:2017年度盛行编程言语Hacker News:2018年7月编程言语招聘趋势榜 Python仍然稳居冠军宝座CFF:Java 和 JavaScript 是企业开发所用最遍及的言语深度点评亚马逊、微软、谷歌、IBM 等 6 大OPE体育机器学习云Packt:2016年收入最高编程言语 Bash言语成意外“黑马”Packt Publishing:JavaScript和Python是当今最盛行的编程言语TIOBE:2016年度抢手编程言语排行榜PYPL:2018年5月编程言语指数榜 Python初次逾越Java夺下冠军Hacker News:2018年4月编程言语排行榜 Python排名榜首KDnuggets:2013年数据剖析/数据发掘/数据科学运用言语排行榜KDnuggets:数据发掘软件排名TIOBE:2017年2月编程言语 Java榜首
感谢支撑199IT 咱们努力为我国互联网研讨和咨询及IT职业数据专业人员和决策者供给一个数据同享渠道。

要持续拜访咱们的网站,只需封闭您的广告拦截器并改写页面。

KDnuggets:2018年数据科学和OPE体育机器学习工具排名 Python排名第一


易优CMS 素材58 区块链是什么 微信小程序开发教程
地址:武汉东湖新技术开发区  电话:0898-08980898  QQ:3447249690
Copyright © 2012-2018 OPE体育|app下载官网 版权所有  ICP备案编号:鄂ICP备19002934号-1