AI开始管理自己的数据并替换数据科学家
喜欢指数的未来?加入我们的Xpotential社区,通过Xpotential University的课程进行未来的证明,阅读有关指数技术和趋势,连接,观看Keynote或浏览我的博客。
我们都知道,目前人工智能(AI)在数据上蓬勃发展 - 也就是说,直到不需要数据来学习新事物之前,零镜头学习已经出现了……目前,尽管AI的一般经验法则是它可以访问的数据越多,并且数据越准确和上下文,数据就越好。
问题在于,全球数字足迹当前生成的数据量是如此巨大,以至于数百万(即使不是数十亿美元)的数据科学家将其全部处理,即使那样,它仍然不会足够快地发生,以至于对AI-drien流程产生有意义的影响。因此,现在许多组织正在获得AI来擦洗自己的数据并使用它来自动化数据科学家工作的工作,这并不令人惊讶。
根据戴尔(Dell)的2021年全球数据保护指数,与五年前相比,平均企业的平均企业现在要多10倍,而全球平均平均水平从2016年的1.45 pb升至今天的14.6 pb。而且,随着数据中心的生成 - 在数据中心,云,边缘以及世界各地的连接设备上 - 我们可以期望这一上升趋势会持续到未来。
在这种环境中,任何不利用数据充分潜力的组织实际上都将钱扔掉了。因此,展望未来,问题不是是否要将AI集成到数据管理解决方案中,而是如何将AI集成到数据管理解决方案中。
AI为数据管理过程的每个步骤带来了独特的功能,而不仅仅是由于其能力筛选大量量寻找明显位和字节的能力,而是通过它可以适应不断变化的环境和转移数据流的方式。例如,根据ATSCALE和CTO的创始人David Mariani的说法,在数据准备方面,AI已经变得越来越擅长自动化关键功能,例如匹配,标记,加入和注释。从那里开始,它越来越擅长检查数据质量并在扫描量之前提高完整性,以识别否则不会引起注意的趋势和模式 - 当数据未结构化时,所有这些都特别有用。
医疗保健是医疗保健最多的行业之一,医学研究产生了很大的负担。因此,根据Anju Life Sciences软件的说法,奇怪的是,临床研究组织(CRO)处于AI驱动数据管理的最前沿。一方面,重要的是不要忽视或简单地丢弃数据集,因为这样做可以消除极为重要的研究的结果。
机器学习已经证明了其在优化数据收集和管理方面的价值,通常保留了由于收集错误或文档错误而通常会拒绝的数据集的有效性。反过来,这可以更深入地了解试验工作的结果,并在整个过程中推动更高的投资回报率。
尽管如此,许多组织只是在启动并运行其新的主数据管理(MDM)套件,这使得他们很快就会随时用新的智能版本代替它们。幸运的是,他们不必。根据Open Logic Systems的说法,新的智能MDM助推器正在击中渠道,使组织能够将AI集成到现有平台中,以支持从数据创建和分析到处理自动化,规则执行和工作流程集成的所有内容。这些任务中的许多都是微不足道的,重复性的,可以释放数据经理的时间进行更高层次的分析和解释。
部署AI来管理它在数字企业中履行其他职责所需的数据的趋势将改变数据科学家和其他知识工作者的工作性质。人们将不再负责完成他们现在所做的工作,而是专注于监视AI驱动过程的结果,然后如果他们从定义的目标转移,则进行更改。
但是,最重要的是,AI驱动的数据管理将大大加快业务速度。数据是数字宇宙中的国王,国王不喜欢等待……但这也提出了一个问题:当AI管理自己的数据并且人类不再处于循环中时会发生什么!?