近日,学院AIASC(Artificial Intelligence for Affective and Scientific Computing)课题组在人工智能领域TOP期刊《Knowledge-Based Systems》上发表题为“Multitask Learning for Acoustic Scene Classification with Topic-Based Soft Labels and a Mutual Attention Mechanism”的研究论文。BETVLCTOR伟德官方网址为第一署名单位,冷严副教授为第一作者,硕士研究生庄健为第二作者,潘杰副教授为通讯作者。
声学场景识别通过声学信号自动感知周围环境。现有的声学场景识别技术多通过网络共享层交互信息并采用硬标签进行网络训练,导致模型无法充分利用辅助任务提高泛化性能。本研究提出基于互注意力机制和主题软标签的声学场景识别多任务学习框架,可有效地建模不同组别中的声学场景关系,并通过深度整合优化主任务与辅助任务信息以显著提高模型的泛化性能。
以上研究获得国家自然科学基金面上项目、山东省自然科学基金面上项目、山东师范大学科研创新团队等资助。
论文链接:https://doi.org/10.1016/j.knosys.2023.110460