Federated Learning on Mobile Health Data for Mood Detection

基于移动健康数据的联邦学习情绪检测

Abstract

虽然研究者希望人工智能能够帮助诊断和治疗抑郁症,但传统的集中式机器学习需要对患者数据进行汇总,精神疾病患者的数据隐私需要严格保密,这阻碍了机器学习算法的临床应用。为了解决抑郁症患者的病史隐私问题,我们实现了联合学习来分析和诊断抑郁症。首先,我们提出了一个基于多源数据的通用多视图联合学习框架,该框架可以扩展任何传统的机器学习模型,以支持跨不同机构或团体的联合学习。其次,采用后期融合方法解决多视图数据时间序列不一致的问题。最后,我们比较了联合学习框架与其他合作学习框架的性能,并讨论了相关结果。

INTRODUCTION

为了更好地帮助医生诊断抑郁症,研究人员通过引入机器学习技术来分析患者数据。但在使用机器学习技术时,模型的性能与数据隐私保护之间存在矛盾。

首先,机器学习训练的模型的质量与数据量密切相关。深度神经网络(DNN)在各种医学应用中都取得了良好的效果,但它在很大程度上取决于训练数据的数量和多样性。虽然Wang et al.提出了集中式学习下避免数据隐私泄露的方案,但医院需要保护患者诊断数据的隐私,因此不同的医疗机构无法收集和共享数据,这极大地影响了模型的准确性。例如在心电图的工作中,由于单一医疗机构无法收集到足够的高质量数据,模型的预测能力无法达到临床辅助的作用。

第二,虽然有很多机器学习算法涉及到隐私保护,但是很难达到良好的训练效果。在隐私保护方面,有很多机器学习的应用场景,如推荐系统、人脸识别等。然而,隐私保护机器学习方法需要根据算法中间产品的敏感性增加噪声,因此在有限的隐私预算下,隐私算法的预测性能往往较差。第三,由于各医疗机构之间的巨大差距,患者数据存在较大差异。为了应对各种情况,要求算法和软件具有较高的泛化能力,如果不进行数据交换,模型很难获得足够的准确性和特异性。

为了解决上述局限性,谷歌在2016年提出了一种名为联邦学习的方法,以打破因患者数据隐私而导致的医疗数据竖井问题。每个医疗机构不需要集中患者数据来训练机器学习模型。相反,它将训练有素的模型聚集在一个地方,并使用联邦平均技术不断优化模型,以便所有医疗机构都能获得数据。然而,目前医学领域使用联邦学习框架的研究大多是基于医院现有的数据。它主要包括对特定疾病患者的特征诊断、降低诊疗成本、医学图像处理等问题。

根据现有的研究,手机作为患者生活中最重要的信息传递工具之一,也可以成为疾病预测的重要数据源。我们认为,键盘击键,例如两次击键之间的间隔,可以作为一种生物特征识别的形式,通过分析抑郁症患者的击键习惯来预测抑郁症。抑郁症患者的打字速度通常与正常人不同,这可能是由于发病时情绪不稳定造成的。

我们的工作使用了一个为移动电话定制的虚拟键盘来收集元数据(包括关键字母、特殊字符和手机加速度计值)。使用来自20个用户的多于130万次按键,每个用户另外完成了至少1份患者健康问卷。我们将用户的键击间隔至少5秒作为开始,并且在最后一次键击5秒后没有操作作为会话执行。会话的持续时间通常在1分钟内。我们在会话级使用联邦学习架构来建模DeepMood,这是一个基于后期融合的深度学习架构。

然而,在现实生活中,不同的医疗机构所持有的数据量有很大的不同,不同地区的医疗机构数量也不同。为此,我们将工作分为两部分。首先,我们根据IID(Independent and identical Distributed,独立同分布)方法将数据分发给不同的参与方进行训练,但是每个参与方在每次训练中拥有的数据量并不相同,每次参加训练的参与方数量也不相同。这个设置模拟了不同地区和不同医疗机构的真实情况。同时,为了验证联邦学习对模型训练的影响,我们模拟了一个数据岛环境,为没有参与联邦学习的各方建立了局部训练。此外,我们将数据按照non-IID分配给各方,并讨论了non-IID对预测结果的影响。实验结果表明,在IID情况下,模型预测精度达到85.13%,在non-IID情况下,模型预测精度达到76.95%。

本文的其余部分组织如下。第二部分介绍了多视角学习、联邦学习和隐私保护的背景。同时,对后期融合模型的原理进行了分析。任务定义和联邦学习框架将在第三节中描述。第四节概述了本文的数据来源、实验设置和结果。最后在第五节对本文进行总结。

BACKGROUND

  • Multi-View learning:Xu等人指出,多视角学习需要使用一个函数对一个视角建模,并使用其他视角共同优化所有功能。Cao等人采用张量积处理多视图数据。Yao等人将CNN、LSTM和Graph embedding结合在一起,以多角度的方式处理复杂的非线性时空依赖关系。此外,还有一些工作将多视角融入到深度学习和迁移学习的过程中,从而帮助从数据中扩展样本。
  • Federated learning:Lee等人提出了一种联邦环境下的隐私保护平台,该平台可以在不共享患者级信息的情况下找到不同医院的相似患者。Huang L等人通过使用特征自编码器和患者聚类,改善了联合学习预测死亡率和住院时间的性能。然而,现有研究中联合学习与多视图数据相结合的方法仍处于发展阶段。Adrian Flanagan等人提出了联邦多视图矩阵分解方法,解决了冷启动问题。Huang等人提出了FL-MV-DSSM,这是第一个通用的基于内容的联合多视图框架,成功地将传统的联合学习扩展到联合多视图学习。Kang等提出了用于半监督学习的FedMVT算法,该算法可以在有限重叠样本的情况下提高垂直联邦学习的性能。这些利用公共数据集的相关方法主要用于推荐系统以解决冷启动问题。然而,我们的框架使用从移动设备收集的数据来解决医疗情绪预测问题。
  • Federated privacy protection:在联邦学习框架中,保护数据隐私的方式主要有三种:安全多方计算(SMC)、差分隐私机制(DP)和同态加密(HE)。

Later Fusion Model

融合模型

由于我们使用的数据集存在三个视图下的时间序列频率不同,无法对齐的问题,在本节中,我们介绍了模型后期采用的融合策略,使数据的时间序列一致。

设p-th视图序列末尾的输出向量为k(p),设{k(p)∈Rdk}^n_p=1为多视图数据,其中m为视图数。

  • Fully connected layer
  • Factorization Machine layer
  • Multi-view Machine layer