科研动态

中国科学院合肥肿瘤医院在基于语音的神经系统疾病检测方面取得新进展

发布者:转化医学研究中心 杨立状 发布时间:2025-06-24

近日,中国科学院合肥肿瘤医院李海研究员团队在基于语音信号的神经系统疾病检测研究中取得新进展。相关研究成果发表在计算机科学领域的权威期刊Neurocomputing上。

构音障碍是多种神经系统疾病,如帕金森病(Parkinson’s disease, PD)、亨廷顿病(Huntington's disease, HD)和肝豆状核变性病(Wilson Disease, WD)等的早期常见症状。构音障碍会改变患者的发音节律和清晰度,因此,语音信号有望作为生物标记物辅助神经性疾病的无创筛查与持续监测,并且基于语音的自动化分析方法具备检测效率高、使用成本低和非侵入性等优势。然而,现有的主流方法仍存在过分依赖人工特征设计、时间变量交互建模能力不足以及模型的可解释性差等问题。

为应对上述挑战,研究团队提出了一种跨时间与跨通道的多变量时间序列处理框架(CTCAIT)。该框架首先利用大型音频模型提取语音信号的高维时序特征,并将其表示为时间与通道的多维嵌入结构。随后,借助 InceptionTime 网络提取多变量时间序列中的多尺度、多层次信息,结合跨时间与跨通道的多头注意力机制,有效捕捉语音在不同维度中所蕴含的病理特征。该方法在中文普通话语音数据集上达到了92.06%的检测准确率,在外部英文数据集上也取得了87.73%的准确率,表现出良好的跨语言泛化能力。此外,研究团队还对模型的内部决策机制进行了可解释性分析,并比较了不同言语任务的检测效果,为模型在临床中的实际应用提供了支持。

构音障碍检测中的多变量时间序列处理框架

该论文的第一作者为中国科学技术大学博士研究生张政霖,通讯作者为中国科学院合肥肿瘤医院李海研究员和杨立状副研究员。本研究得到了国家自然科学基金、安徽省自然科学基金和安徽省重点研发项目的支持。

文章链接:https://www.sciencedirect.com/science/article/pii/S0925231225013803

top