当前位置:首页  >  数据分析专题  > 

数据科学机器将实现无人参与数据分析功能

作者:finereport

浏览:1,657

发布时间:2023.8.3

大数据的时代已经到来,而在前两年,大数据也被炒作到了高峰,而马云则表示,在今后的三十年,是属于DT(数据技术)的。不过在这段时间,关于大数据的声音不是很响亮了,造成这样现象的原因,出来炒作周期的规律外,就是在技术上也遇到了一些瓶颈。

在遇到的瓶颈中最大的一个就是人。想要将隐藏在大数据里面的模式挖掘出来,在很大程度上是要依靠数据分析软件开发者的建模以及直觉的,不过当前数据专家的树立似乎无法跟上大数据的发展。不过目前有一款名为数据科学机器(Data Science Machine)的软件实现了即便无人参与也能进行数据分析的功能,且经过实验对比,这个数据分析软件的表现与专业数据分析师在能力上不相上下。

数据科学机器的关键突不仅是能自己寻找模式,还能自己设计相关的特征集。了解机器学的人都知道,特征工程在其中的重要性,指的是,利益数据只是来创建特征,以此来机器学习到算法,并进行工作的过程,而这个过程往往要依靠人的直觉。

但是数据科学机器却利用了相关联的数据库中表间的结构化关系来当作线索,并进行构造特征,从而生成一批特征集。然后通过分析相关性来缩小范围,因此免去了人在这个过程中参与。然后,数据科学机器还会将特征集在样本数据上应用,再利用不同的方式进行重新组合特征,以此来优化准确率。

为了对新系统的第一款的原型进行测试,研究人员用其参与了三项数据的相关科学分析的竞赛,而竞赛的目标不是常见的预测性模式。竞赛一共有九百多支队伍参加,而数据科学机器的成绩要比六百多支队伍高。在准确率方面,数据科学机器在竞赛中也有两场达到了百分之九十以上。但是在效率方面却是要比人类高很多。

目前数据科学机器已经对可能退出 MIT 的在线课程的学生进行了分析,并它选出了两个特征来分析学生准备写作业时间是早还是晚,以及网上学习的时间长短。尽管当前的这个能力看起来没有什么强大的地方,但是要知道这只是开始,一旦学会真正的自我学习,那么在强大的计算能力下,其进化程度将是我们很难想象的。

管理驾驶舱指南,业务指标,数据分析报表需要展现大量的数据和文字,提高信息传递的效率

报表工具产品更多介绍:www.finereport.com


在线客服

电话咨询

技术问题

投诉入口