運用AI 台北大學致力說聽無礙
【記者王志誠、周貞伶/新北報導】 2025/02/09

▲北大計畫團隊與相關領域專業人員座談會。(圖:台北大學提供)
台北大學包容科技研究團隊,運用AI人工智慧與創新科技,致力於推進語音障礙者的溝通輔助研究,未來期望實現「科技溝通無障礙」的願景。這項包容科技計畫包含四個子計畫,各計畫緊密協作,從語音收集、語音克隆、語音辨識、智慧客服系統建設等技術,到使用者需求分析的各個層面,全面推動語音障礙者溝通輔助技術的發展,實現系統化的創新突破。

校方表示,子計畫一:由通訊工程學系副教授江振宇主持,致力於為語音障礙者提供便捷且有效的溝通工具。計畫利用語音銀行協助漸凍病友及語障者收集語音,建立標準語音資料庫,並藉由深度學習技術進行語音合成,使語障者能使用具個人特色的數位合成語音進行語音溝通交流。

同時,計畫成果涵蓋多領域突破,包括可用於華語教學的中文調值辨識以及生成技術,以及個人化語音辨識系統的開發。此外,該計畫針對食道語者設計了語音輔助裝置,不僅顯著提升語音的清晰度與準確性,展現出極高的社會價值與應用潛力。

子計畫二:由電機資訊學院院長張玉山主持,致力於為「重度吶語症」患者開發個人化語音辨識技術,目的是幫助患者以自身的聲音進行高效準確的溝通。計畫利用「ezTalk」這款多功能溝通輔具,通過音節選擇或文字輸入,為患者提供即時語音辨識與個人化合成語音支持。該系統具有資料收集與訓練功能,透過錄製單音、句子或整段語音,建立個人資料庫以提升辨識準確度;還具備遠距錄音功能,透過此功能幫助患者克服外出錄製語音的困難。

語音辨識系統需要超過200萬筆語音數據以達到高準確度,但吶語症患者僅能提供1萬至3萬筆資料,這使得資料收集變得困難並增加了患者負擔。為克服資料收集的挑戰,團隊引入生成式AI技術,利用少量語音樣本生成模擬數據,從而有效提升辨識精準度,並減輕患者負擔。這項技術的開發將為患者提供更精準高效的語音輔助,助力患者實現無障礙溝通。

子計畫三:由資訊管理研究所教授戴敏育主持,致力於開發智能客服對話系統,為語音障礙者提供全天候服務。該系統運用生成式AI技術,並與中華民國腦性麻痺協會、漸凍人協會、陽光社會福利基金會等機構合作,量身打造智慧客服系統,提供24/7全天候服務。透過LINEAPI,語音障礙者可使用語音、文字及圖像等多種方式進行交流,並享有即時互動服務,提升服務效能並減少人力成本。

子計畫四:由社會工作學系教授林昭吟主持,主要負責如何將研發的輔具技術融入患者的日常生活。計畫不僅關注技術研發,還積極與病友、言語治療師及社工等專業人士交流合作,深入了解患者需求並持續追蹤輔具使用情況,幫助他們解決各種操作上的困難。