这个新的AI同时使用视觉和声音来估计抑郁症
对未来感兴趣,想体验更多吗?观看主题演讲,抓住一本免费书籍,阅读数千篇文章,然后连接!
从某人的声音中检测到情感唤醒是一回事 - 诸如《言语之外》,《情感》和《麻省理工学院旋转》(MIT Spinout Cogito)之类的创业公司正在利用自然语言处理来实现这一目标。但是,随着机器人和机器人接受了心理学培训,例如现在帮助数百万人的Woebot,开始出现在现场以新方式帮助患者,因此,仅凭演讲就不足以诊断出抑郁症的人,更不用说判断其严重性了。
输入印度理工学院PATNA和CAEN NORMANDY大学科学家的新研究,该研究表明非语言标志和视觉效果如何大大改善对抑郁水平的估计。
该论文的作者写道:“全球抑郁症和精神疾病的负担不断增加,这是开发更先进,个性化和自动化技术的动力,这有助于其检测。”“抑郁症检测是一个具有挑战性的问题,因为它的许多症状都是秘密的。”
研究人员编码了七种模式,例如头部的向下角,眼睛凝视,微笑的持续时间和强度以及自我触摸的持续时间和强度,以及文本和口头提示 - 它们喂给了机器学习模型,将它们融合到向量或数学表示中。然后将这些融合的向量传递到第二个系统上,该系统根据个人健康问卷调查量表(PHQ-8)预测抑郁症的严重程度,这是一种经常在大型临床心理学研究中采用的诊断测试。
为了训练各种系统,研究人员挖掘了AIC-WOZ,这是一个抑郁症数据集,它是较大的语料库的一部分 - 遇险分析访谈语料库,其中包含带注释的录音片段,视频录制和问卷调查的189次临床访谈的问卷反应,该临床访谈支持诊断,例如焦虑,抑郁症,抑郁症,抑郁症和经历性后压力障碍。每个样本都包含大量数据,包括原始音频文件,一个包含受访者68个面部“地标”坐标的文件,包括时间戳记,置信度分数和检测成功标志,两个文件包含参与者的头姿势和眼睛凝视功能,面试的成绩单等。
经过几个预处理步骤和模型培训后,团队使用三个指标(均方根误差(RMSE),平均绝对误差(MAE)(MAE)和解释的方差得分(EVS)比较了AI系统的结果。他们报告说,这三种方式的融合(声学,文本和视觉)有助于给出“最准确”的抑郁水平估计,在RMSE上优于先前的先前最先前的最先前的系统状态,而MAE的表现为8.08%。
将来,他们计划研究最新的多任务学习架构,并“更深入地”对文本数据的新颖性表示,如果他们的作品有效,这对于现在患有抑郁症的超过3亿人来说,这将是一个有希望的发展 - 可悲的是,这一数字正在上升。
来源:Arvix