文/羅世宏
畢業於倫敦政經學院,立志不做大官,也不做大事。平日最喜歡做的事是閱讀、思考和寫作。最大的缺點是「好為人師」。
AI世代的客語媒體傳播,不只是「能否上字幕」的技術問題,更是「誰能定義語言未來」的文化與政治課題。當語言與科技交會,關鍵已不在語音辨識是否準確,而在AI是否能理解語言背後的世界觀與價值觀。
AI學習非主流語言並非不可能,但需要長期資源投入與制度性支持。關鍵挑戰之一是客語腔口的多樣性:四縣、海陸、大埔、饒平、詔安等腔調各具獨特性,若語料訓練偏向少數常見腔口,忽視語言真實使用情境,恐加劇文化的扁平化與排除性。
語言並非中性的符號組合,它承載著族群文化記憶與生命經驗。若AI只學會客語的問候語、生活詞彙,卻忽略諺語、詩詞、民俗與宗教語境,所謂的「AI說客話」不過是淺層模仿,無法真正實踐文化的傳遞與創造。
此外,AI系統如何處理語言差異,也牽涉深層偏見與語言歧視問題。美國芝加哥大學與史丹佛大學研究團隊2024年發表於《自然》的研究指出,大型語言模型在辨識非裔美國英語(AAE)使用者時,會產生系統性偏見:AI將AAE使用者連結至低社經職業,在模擬法庭判決中甚至給予更高定罪與死刑率。研究數據顯示,僅因語言差異,AAE使用者的定罪率高達68.7%,高於標準美語使用者的62.1%;死刑判決率則為27.7%,顯著高於後者的22.8%。
這些研究結果向我們提出警示:若AI對語言變體缺乏敏感度,並預設主流語言為「標準」,不僅將重複社會偏見,更會傷害語言少數者的文化認同與社會參與權。這不只是技術問題,更是文化正義與語言平權的挑戰。
台灣的主權AI語料庫目前已將客語與原住民語言納入語料治理架構,方向值得肯定。但在治理實踐上,仍須強化語言社群的參與機制。例如,應設立語料公民審議平台,開放語者參與標註、語境詮釋與意義交涉,讓語言當事人成為共同建構的參與者,而非被動的數據提供者。
主權AI的未來不應只是政府導向的技術工程,而應成為文化協商的民主實踐現場。從客語新聞、Podcast、AI朗讀工具,到多語教育與防詐App的開發,AI必須尊重語言差異與文化多元,而非強化主流語言霸權或施加「標準化壓力」。唯有如此,AI才能真正為語言弱勢者發聲,而不是被用於「矯正」他們的語言行為。
更進一步地,AI語言治理也應與母語教育政策形成互補關係。現行《國家語言發展法》雖規範政府應促進語言平權,但若未能將AI語言模型視為語言教育的延伸工具,恐將錯失數位轉型契機。學校端若能搭配在地語料,共同設計具族群語言腔口辨識的語音學習平台,不僅有助語言復振,也可深化數位素養與文化自覺。AI不該只是科技革命的代名詞,更應成為語言多樣性的守護者與民主溝通的促進者。