数据科学领域的核心技能和新兴技能分别有哪些?
近年来随着大数据的迅速发展,各种各样的数据分析技能也逐渐大热,为了找到数据科学领域目前最常用的技能和未来最流行的应用趋势,我们进行了一项调查。 我们确定了数据科学技能的两个主要类别:一个是大多数受访者拥有的13种核心技能,另一个是大多数还没用但想要应用的热门新兴技能。 本次调查主要有以下两个问题:
本次调查获得了1500以上的票数,样本足够大,可以做出有意义的推断。 下面的图1中,X轴显示已经具有的技能 ,即第一个民意调查问题的答案,Y轴显示想要的技能 ,即第二个民意调查问题的答案。每个圆圈的大小与拥有该技能的选民比例成正比,而颜色则取决于想要/拥有的比例(红色高,数值大于1;蓝色低,数值小于1)。 注:其他大数据工具适用 于Hadoop或Spark以外的大数据工具。 注意此图中的两个主要类别。 图表右侧蓝色虚线框中的第1类包括超过40%的选民所拥有的技能,其需要/拥有的比率小于1。我们称其为核心数据科学技能,具体内容参考表1。 其中,最需要增加或改进的技能是机器学习(41%)和Python(37%)。增长最少的技能是Excel,只有7%的人希望增加或提高其Excel技能。 第二个集群是图1左侧用红色边框标记的部分,包括当前不那么受欢迎的技能(拥有比率<30%),但是却在增长,想要/拥有的比率超过1,参见表2。 有趣的是,尽管有观点认为Hadoop在下降,但在这次调查中,有更多的人希望学习Hadoop,而不是已经流行的技能,因此它可能会越来越流行。 我们没有把Julia放2在热门/新兴技能中,尽管它的想要/拥有比率为3.4,因为只有2%的选民选择它,它还没有得到足够的支持。 剩下的技能如XGBoost、软件工程、Java、MATLAB、SAS的拥有比率为10%-30%,但想要/拥有比率没有增长,小于1。 下面是关于本次调查的更多细节。图2将所有技能按拥有百分比递减排列。 图3显示了受访者希望添加或改进的技能以及他们所拥有的技能。 我们看到,当前数据科学家最想要添加的技能是深度学习、Tensorflow、机器学习和Python。 本次调查的受访者的就业类型分布如下:
【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。 |
-
「没有数据,你只是一个有想法的人。」 这是 W. Edwar...[详细]
-
蓝牙、WiFi与ZigBee三种,这三种无线传输技术,谁能一统天下
智能产品种类越来越多,运用在智能家居上的技术也越来...[详细]
-
前言 网络是我们工程师的基础技能之一, 毕竟没有网络...[详细]
-
现在已经有很多的运营商支持ipv6,前天还有不少朋友留...[详细]
-
5G已经被热炒得家喻户晓,但与其对标的WiFi新技术标准...[详细]
-
人工智能技术的加持,5G建设的全面铺开,加速了工业互...[详细]
-
在朝阳规划艺术馆数字沙盘区,巨型荧幕上显示着用地强...[详细]
-
笔者按,采样问题是数据科学中的常见问题,对此,Walm...[详细]
-
随着中共中央办公厅、国务院办公厅印发了《推进互联网...[详细]
-
5G是什么? 5G的G是英文Generation的缩写,翻译过来就...[详细]