最新消息
首頁 最新消息
喜馬拉雅珠峰實驗室在ASRU2023多通道多方會議轉錄挑戰賽中摘冠 2023-07-04
文章来源:由「百度新聞」平台非商業用途取用"http://tech.caijing.com.cn/20230630/4944795.shtml"

近日,2023年國際頂級語音會議ASRU(IEEEAutomaticSpeechRecognitionandUnderstanding,自動語音識別與理解)的多通道多方會議轉錄挑戰賽(M2MeT2.0)圓滿結束,喜馬拉雅珠峰實驗室取得了卓越成績,榮獲冠軍殊榮。ASRU研討會是IEEE語音和語言處理技術委員會(SLTC)的旗艦技術活動,每兩年舉辦一次,匯集了來自學術界和工業界的頂級專家和研究人員,共同探討廣泛的語音識別與理解問題。本次M2MeT2.0挑戰賽是ASRU2023年的重要賽事,旨在解決離線會議室中語音重疊的轉錄難題。會議場景作為典型的多人自由交談的"雞尾酒會場景"一直是語音識別領域的難點和關注焦點,對于開發會議場景的語音人工智能和探索相關問題的工業級解決方案具有重要意義。值得一提的是,喜馬拉雅并非首次參加ASRU的M2MeT挑戰賽。在首屆M2MeT挑戰賽中,喜馬拉雅與中國科學技術大學合作,在說話人日志賽道中榮獲第三名,并且取得了僅有4.05%的日志錯誤率。首屆挑戰賽的評估指標是字符錯誤率(CER),只轉錄音頻對應的文本,不考慮說話人標簽。基于首屆的成功,M2MeT2.0挑戰賽將著重于說話人相關的評估,推動多說話人語音識別系統的實用化,并設立了限定數據和不限定數據兩個子賽道。為了應對這一挑戰,喜馬拉雅珠峰實驗室從語音識別基礎框架出發,展開了混疊語音檢測技術和說話人日志技術等方面的技術探索。在本次M2MeT2.0挑戰賽中,喜馬拉雅在限定數據集和開放數據集兩個子賽道上均取得了第一名的出色成績。今年的M2MeT2.0挑戰賽數據集包含了真實、多場景、多模態的大規模數據,涵蓋了不同規模和布局的多種會議室,模擬了各種家具、不同主題的例會以及各種室內噪音。其中包括人聲、電視聲、風扇空調聲、鍵盤聲、開門關門聲、氣泡聲等重疊交錯的聲音,為比賽增添了挑戰性。通過使用麥克風陣列記錄遠場音頻和耳機麥克風記錄近場音頻,確保了對應說話人的語音準確轉錄。這一數據集對于多說話人語音識別和語音重疊問題的研究具有重要的學術意義,并為尋找工業級解決方案提供了真實且多樣化的數據資源。M2MeT2.0挑戰賽數據集中所有說話人的母語均為漢語,喜馬拉雅通過產學研相結合的方式積極參與其中,致力于為中國本土語音識別技術的發展作出貢獻。在M2MeT2.0挑戰賽中,喜馬拉雅展示了出色的說話人和語音識別技術(ASR

關鍵字標籤:實驗室設備規劃
澎湖有許多好玩海上活動,夏天值得到的旅遊地區。
澎湖美食多,好吃海鮮多到讓你品嘗不完。