Page 82 - 《toʉsvʉsvʉtʉ談論雜誌》4
P. 82
tangi ay ninebian tu sikawman na taytan na pakingkiwan ay lazat, paqiRi
yencumin qaninanan nipelintuluan, tu meRaya ay AI nitaqinan tu ussiq
yau ta siang cen ci kungsuo semuzuq sikawman qayau utulu Rasibu banan
tu sikawman ay lazat, cuce na temuzus tu ulima Rasibu banan nisudadan
semuzuq tu sikawman na yencumin tu sikawman, azu ngid tuzus tu nengi
semudad tu nipaninguan tu suni ay nitaqinan, qayau melaziw tu ussiq
na baqian, seRay ta cui E leyenan melalazan sikawman. tangi ta ninebian
sikawman na yencumin, tuRuz na tu nisapunan tu sikawman melaziw ti
paqeRaya palisimpu tu sikawman tu uzusa Rasibu banan, sabidangan ta
na yencumin sudad, nitungawan na tuRuz na 2024 tasaw Rabetin yau unem
Raya tu nisudadan tu sikawman na lazatan tuzus pa tu usepat Rasibu banan
yencumin ay sudad. wanayka, taninian nisudadan tu sikawman, ta paqiRian tu
ay lazatan nisudad na tu sikawman sikawman na yencumin sataqinan na
mai pama tu maqezaq ay qinunungan, sapaskan na tu AI Raya ay sikawman,
yauqaya mai sasetaR nitaqinan, padames tuzusan tu paqiRian tu AI ay
ngid pasinanam tu melaqid na AI, ta sikawman na yencumin, qadaud pama
ngyaw na paqiRi tu sikawman tangi sasaqayan, padames setangi yencumin
qakinsan pama, yauqaya sazemakenan Rabetin yau unem lazatan usepat betin
tu sikawman seRay nisudadan na tu yau uzusa sikawman, Raqana, ngid
hulan seRay suni na nizu melaqid ni, kunna mazas ya yenihuy mekingkiw,
nitaqin na maqezaq ni… . paqanas pa pasangayaw semangi.
現階段族語資料庫的語料來源主 據專家評估,建置有規模的 AI 翻
要分為三部分:包括鄉鎮區公所語推 譯系統單一語言至少需要 300 萬到
人員、族語推動組織的耆老訪談影音 500 萬詞的語料,如要達到較好的翻
紀錄,以及族語 E 樂園語料,後續也 譯成效,則需要 1000 萬詞以上。目前
將擴大蒐集族語刊物、族語公文等語 資料庫已蒐集 200 多萬詞,預計 2024
料。然而,由於各族在族語文字書寫 年底達到 16 族共 400 萬詞,距離建
尚未有一致性的規範,加上轉譯方式 立族語 AI 翻譯的語言模型,甚至是族
不一,為了 AI 訓練的準確性,語料在 語生成式 AI 系統的目標,還有一段路
建置前仍需校對,包括確認語料中的 要走,特別是目前原住民族包含 16 族
族語及華語文字與音檔是否為句對句, 42 語,因此,原語會將採先導型研發
以及翻譯語意是否有落差等。 模式,逐步向前。
80

