溫馨提示×

語音識別開發需要哪些數據集

語音識別

小樊

171

2024-10-26 11:26:22

欄目: 編程語言

語音識別開發需要多種數據集，以下是一些常用的語音識別數據集：

Common Voice：包含26,119小時的錄音，涵蓋104種語言，提供年齡、性別、口音等人口統計元數據。
CMU Wilderness Multilingual Speech Dataset：包含700多種不同語言的語音數據，平均每種語言提供大約20小時的句子長度轉錄。
GigaSpeech：一個不斷發展的多域英語語音識別語料庫，包含10000小時的高質量標記音頻和40000小時的總音頻。
MagicData-RAMC：包括351組多輪普通話對話，時長共計180小時，標注信息包括轉錄文本、語音活動時間戳等。
Free ST Chinese Mandarin Corpus：包含855個speakers的120個話語，每個話語都經過人仔細的轉錄和核對。

這些數據集為語音識別開發提供了豐富的資源，有助于提高模型的準確性和魯棒性。選擇合適的數據集對于開發高效的語音識別系統至關重要。

0 贊

0 踩

最新問答

相關問答

相關標簽

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女