教師照片:江振宇

江振宇

副教授
電機資訊學院 通訊工程學系

技術名稱 可控制韻律之多語者文字轉語音技術
研究專長
  • 語音處理
  • 自然語言處理
  • 圖形辨識
  • 音訊處理
技術摘要 本技術內容可以使用以下三點說明:1. 本技術包含 Speech Labeling and Modeling Toolkit (SLMTK) version 1.0 (簡稱 SLMTK 1.0) 的商業使用授權,為一個完整的 TTS 建立 solution,由 raw text 以及語音檔案輸入,輸出為韻律標記檔案、HTS Label 檔、以及音訊處理後音檔,並且自動建立 TTS 所需要的模型。2. SLMTK version 1.0 的處理模組包含:a) 語料庫處理 、b) 文字分析、c) 韻律模型 、d) 時長模型 、e) 聲學模型、以及 f) 聲碼器模型。3. 本技術具有語者調適功能,且所建立之 TTS 程式之使用介面可方便使用者撥放段落語音,並可以直接將輸入文字以 markup language 標示以方便調整以下參數:語速、音高、停頓。適合建立模擬不同陳述專業內容的語音音色,用於產生軟性文字之對應語音產生,滿足不同市場情境對聲音情感的需求。

技術應用範疇:媒體業、輔具市場
運作技術成熟度 TRL6:原型於相似環境測試
專利名稱 可學習不同語言及模仿不同語者說話方式之韻律參數語速正規化器、語速相依韻律模型建立器、可控語速之韻律訊息產生裝置及韻律訊息產生方法
申請國家 中華民國
專利類型 發明
專利證書號 I595478
專利期間 自2017/08/11至2036/04/20止
專利說明 本案係提供一種語速相依韻律模型建立器,包括:一第一輸入端,用以接收源自一第一語者所講一第一語言的一第一訊息;一第二輸入端,用以接收源自一第二語者所講一第二語言的一第二訊息;以及一函式資料單元具一函式,其中該函式包含與該第一語言及該第二語言同時相關之第一複數參數或單獨與該第二語言相關之第二複數參數中任一參數的複數子參數;以及該函式資料單元在一最大後驗(MAP)條件下,基於該第一訊息、該第二訊息、及該第一複數參數或該複數子參數來產生與語速相依之一參考訊息,俾根據該參考訊息建構該第二語言之一語速相依韻律模型。