SH Symposium Series on Speech (SH SSS 2022)
SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。
来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。
分享的论文成果来自国内外顶级会议收录的优秀文章、前沿学术报告。
主题 Tittle
ISSD: 基于迭代式语音分离的说话人日志系统
时间 Time
2022年11月15日 19:00 - 19:45
嘉宾 Author
牛树同:中国科学技术大学语音实验室博士研究生。主要研究方向为语音分离及说话人日志任务。合作文章曾发表于ICASSP、INTERSPEECH等语音领域会议。作为团队成员参加DIHARD III及DCASE 2022 Task 3等国际挑战赛并取得第一名。
概述 Abstract
本文提出了一种基于迭代式语音分离的说话人日志(Iterative separation-based speaker diarization, ISSD)方法来处理真实的测试数据。在ISSD方法中,我们根据说话人先验迭代地产生自适应数据来提高分离模型的泛化能力,这可以使得模型性能逐步提升。为了进一步减少说话人先验中一些不可避免的检测错误带来的影响,我们利用说话人的声纹信息提出了两种后处理方法,即说话人过滤以及说话人恢复。我们在真实的两人电话语音(Conversational telephone speech, CTS)上对提出的方法进行了测试。实验结果表明,与最先进的基于聚类的说话人日志系统(Clustering-based speaker diarization, CSD)相比,我们提出的方法在开发集和测试集上分别取得了47.72%和46.97%的相对提升。ISSD也是我们在DIHARD III挑战赛冠军系统中应用的一个关键技术。
题 目 Tittle
中文:ISSD: 基于迭代式语音分离的说话人日志系统
英文:IMPROVING SEPARATION-BASED SPEAKER DIARIZATION VIA ITERATIVE MODEL REFINEMENT AND SPEAKER EMBEDDING BASED POST-PROCESSING
收录会议 Source Title
ICASSP 2022
作 者 Authors
牛树同,杜俊,孙磊,李锦辉
论文地址 Url
https://ieeexplore.ieee.org/document/9746354
议程
Program Overview
时间主题嘉宾19:00-19:30 ISSD: 基于迭代式语音分离的 说话人日志系统 牛树同19:30-19:45Q&A
参与方式
Joining
直播将通过语音之家微信视频号进行直播,手机端、PC端可同步观看。
精彩链接
发表评论