Page 82 - 《toʉsvʉsvʉtʉ談論雜誌》4
P. 82

tangi ay ninebian tu sikawman na                   taytan na pakingkiwan ay lazat, paqiRi
            yencumin qaninanan nipelintuluan,                  tu meRaya ay AI nitaqinan tu ussiq
            yau ta siang cen ci kungsuo semuzuq                sikawman qayau utulu Rasibu banan

            tu  sikawman  ay  lazat,  cuce  na                 temuzus tu ulima Rasibu banan nisudadan
            semuzuq tu sikawman na yencumin                    tu sikawman, azu ngid tuzus tu nengi
            semudad  tu  nipaninguan  tu  suni                 ay nitaqinan, qayau melaziw tu ussiq
            na  baqian,  seRay  ta  cui  E  leyenan            melalazan sikawman. tangi ta ninebian

            sikawman  na  yencumin,  tuRuz  na                 tu nisapunan tu sikawman melaziw ti
            paqeRaya  palisimpu  tu  sikawman                  tu uzusa Rasibu banan, sabidangan ta
            na yencumin sudad, nitungawan na                   tuRuz na 2024 tasaw Rabetin yau unem
            Raya tu nisudadan tu sikawman na                   lazatan tuzus pa tu usepat Rasibu banan

            yencumin ay sudad. wanayka, taninian               nisudadan tu sikawman, ta paqiRian tu
            ay lazatan nisudad na tu sikawman                  sikawman na yencumin sataqinan na
            mai pama tu maqezaq ay qinunungan,                 sapaskan na tu AI Raya ay sikawman,
            yauqaya  mai  sasetaR  nitaqinan,                  padames tuzusan tu paqiRian tu AI ay

            ngid pasinanam tu melaqid na AI, ta                sikawman na yencumin, qadaud pama
            ngyaw na paqiRi tu sikawman tangi                  sasaqayan, padames setangi yencumin
            qakinsan pama, yauqaya sazemakenan                 Rabetin yau unem lazatan usepat betin
            tu sikawman seRay nisudadan na tu                  yau uzusa sikawman, Raqana, ngid

            hulan seRay suni na nizu melaqid ni,               kunna mazas ya yenihuy mekingkiw,
            nitaqin na maqezaq ni… .                           paqanas pa pasangayaw semangi.


              現階段族語資料庫的語料來源主                                     據專家評估,建置有規模的 AI 翻
            要分為三部分:包括鄉鎮區公所語推                                   譯系統單一語言至少需要 300 萬到

            人員、族語推動組織的耆老訪談影音                                   500 萬詞的語料,如要達到較好的翻
            紀錄,以及族語 E 樂園語料,後續也                                 譯成效,則需要 1000 萬詞以上。目前

            將擴大蒐集族語刊物、族語公文等語                                   資料庫已蒐集 200 多萬詞,預計 2024
            料。然而,由於各族在族語文字書寫                                   年底達到 16 族共 400 萬詞,距離建

            尚未有一致性的規範,加上轉譯方式                                   立族語 AI 翻譯的語言模型,甚至是族
            不一,為了 AI 訓練的準確性,語料在                                語生成式 AI 系統的目標,還有一段路

            建置前仍需校對,包括確認語料中的                                   要走,特別是目前原住民族包含 16 族
            族語及華語文字與音檔是否為句對句,                                  42 語,因此,原語會將採先導型研發

            以及翻譯語意是否有落差等。                                      模式,逐步向前。



         80
   77   78   79   80   81   82   83   84   85   86   87