Page 66 - 《toʉsvʉsvʉtʉ談論雜誌》3
P. 66

Web mati-urucin vaitai tanasʉn citai.

          maraa mara’an marikʉpʉ kari.



          Web2.0 社群媒體時代                                        他特別提到,儘管原住民有看似複雜
                                                               的 16 族 42 語別,但只要先建出基本
          蒐集語料更容易
                                                               模型,再根據不同語別細修、調整即
          “tia  tʉni!”  misee  sua  Ru  ciau-so,               可。例如印尼語和馬來西亞語有 80%
                        6
          mata’uru ,  wang-ru  mataa  kʉ-ci                    的相似性,盧教授用印尼語的辨識系
                                                         7
          musuruusuru, tʉni muranʉ marikʉpʉ
          kari. nguai sua cau masini ia, ’esi na               統,對馬來西亞語進行測試,就能過
                                      8
          Web mati-urucin vaitai  tanasʉn kisʉʉn               關。
          namuriungu, tikirimi kari-caukia, maraa
          ka’anʉ  rangrang,  ’una  pa Youtuber                 kari-Inni maatʉa mataa kari-caukia,
          makaasia vaitai takacicini, mamumuarʉ                kavangvang Nantau tamna kari, Ru
          na wang-ru ’apacʉ’ʉra takacicin, sua                 ciau-so tʉni mata’uru ’apaica kari-
          nikamanumanua karananana kari-caukia                 Inni kamanʉngʉ AI capai, makaa’ʉna

          tamna ’ungkaku, ’aningu ia, nguai sua                pacancan pati’ʉnʉ’ʉnʉʉn cu, “imua
                                                                                  10
          tʉni  toiisua ’urupacʉʉn AI takacicin                sua  kangania   ia,  tia  marikʉpʉ
          kunting mataa kiatuuturu ’inia tamna                 kari,  noo  musutampʉ  cu  niaraa,

          ngaca’ʉ.                                             miaa ’esacu kari-caukia ia, tʉni cu
                                                               ’urupacʉʉn AI  takacicin  kunting

          「當然可以!」盧教授強調,首先,網路                                   mataa kiatuuturu ’inia, macuvungu
          發達、科技進步有助於蒐集語料。尤其                                    ’apaica tia ’uruupaca cau tamna

          現今人們身處 Web 2.0 社群媒體的環境,                              cʉpʉngʉ,    nipapona  tia pakʉnnanu
          生產族語語料變得相對容易,Youtuber                                ’urupacʉʉn mataa siaruranʉ.”

          等自媒體能輕易在網路上展現自我,產                                    而印尼語和族語一樣,同為南島語系,
          出的族語音樂、影片等各種內容,就是                                    盧教授能先根據印尼語建立基本 AI 模

          讓 AI 訓練、學習的語料來源。                                     型後,再逐一細修,「所以關鍵還是

                                                               在蒐集語料,資料量夠了、族語語料
          makasi pa nguain, ’apaco’e Cau-                      一來,就能讓 AI 往下訓練、學習,
          Vuvurung tamna kari, ’una maan unʉmʉ                 接著再從使用者的需求發想應用與服

          cuku masʉpatʉʉn urucin karanana kari
          makai  marapusu,  nakai  noo  ’una  cu               務。」
          ngaca’ʉ  capai,  ’apaica  karanana  kari
                            9
          mati’ʉnʉʉ’ʉna  ’inia, tia cu tʉni.                   makasi Ru ciau-so, arasuruusuru
          makai kari-Inni mataa kari-Maraisiya,                kʉ-ci,  maraa  ka’anʉ  cu  rangrang
          ’una maruun paseen maatʉa, Ru ciau-                  marikʉpʉ kari. macuvungu ’uruupaca
                                                               AI tarakanangʉ riang, mungangaan,
          so ’uruupaca kari-Inni sipatarakanangʉ,              marisaniivari kari tamna taiku,
          tanamaʉn  na  kari-Maraisiya  ia,  tʉni              put ucuc uru  tʉni   m ura nʉ  kari -

          maca’ivi.                                            caukiaarasuruusuru.


         64
   61   62   63   64   65   66   67   68   69   70   71