Page 66 - 《toʉsvʉsvʉtʉ談論雜誌》3
P. 66
Web mati-urucin vaitai tanasʉn citai.
maraa mara’an marikʉpʉ kari.
Web2.0 社群媒體時代 他特別提到,儘管原住民有看似複雜
的 16 族 42 語別,但只要先建出基本
蒐集語料更容易
模型,再根據不同語別細修、調整即
“tia tʉni!” misee sua Ru ciau-so, 可。例如印尼語和馬來西亞語有 80%
6
mata’uru , wang-ru mataa kʉ-ci 的相似性,盧教授用印尼語的辨識系
7
musuruusuru, tʉni muranʉ marikʉpʉ
kari. nguai sua cau masini ia, ’esi na 統,對馬來西亞語進行測試,就能過
8
Web mati-urucin vaitai tanasʉn kisʉʉn 關。
namuriungu, tikirimi kari-caukia, maraa
ka’anʉ rangrang, ’una pa Youtuber kari-Inni maatʉa mataa kari-caukia,
makaasia vaitai takacicini, mamumuarʉ kavangvang Nantau tamna kari, Ru
na wang-ru ’apacʉ’ʉra takacicin, sua ciau-so tʉni mata’uru ’apaica kari-
nikamanumanua karananana kari-caukia Inni kamanʉngʉ AI capai, makaa’ʉna
tamna ’ungkaku, ’aningu ia, nguai sua pacancan pati’ʉnʉ’ʉnʉʉn cu, “imua
10
tʉni toiisua ’urupacʉʉn AI takacicin sua kangania ia, tia marikʉpʉ
kunting mataa kiatuuturu ’inia tamna kari, noo musutampʉ cu niaraa,
ngaca’ʉ. miaa ’esacu kari-caukia ia, tʉni cu
’urupacʉʉn AI takacicin kunting
「當然可以!」盧教授強調,首先,網路 mataa kiatuuturu ’inia, macuvungu
發達、科技進步有助於蒐集語料。尤其 ’apaica tia ’uruupaca cau tamna
現今人們身處 Web 2.0 社群媒體的環境, cʉpʉngʉ, nipapona tia pakʉnnanu
生產族語語料變得相對容易,Youtuber ’urupacʉʉn mataa siaruranʉ.”
等自媒體能輕易在網路上展現自我,產 而印尼語和族語一樣,同為南島語系,
出的族語音樂、影片等各種內容,就是 盧教授能先根據印尼語建立基本 AI 模
讓 AI 訓練、學習的語料來源。 型後,再逐一細修,「所以關鍵還是
在蒐集語料,資料量夠了、族語語料
makasi pa nguain, ’apaco’e Cau- 一來,就能讓 AI 往下訓練、學習,
Vuvurung tamna kari, ’una maan unʉmʉ 接著再從使用者的需求發想應用與服
cuku masʉpatʉʉn urucin karanana kari
makai marapusu, nakai noo ’una cu 務。」
ngaca’ʉ capai, ’apaica karanana kari
9
mati’ʉnʉʉ’ʉna ’inia, tia cu tʉni. makasi Ru ciau-so, arasuruusuru
makai kari-Inni mataa kari-Maraisiya, kʉ-ci, maraa ka’anʉ cu rangrang
’una maruun paseen maatʉa, Ru ciau- marikʉpʉ kari. macuvungu ’uruupaca
AI tarakanangʉ riang, mungangaan,
so ’uruupaca kari-Inni sipatarakanangʉ, marisaniivari kari tamna taiku,
tanamaʉn na kari-Maraisiya ia, tʉni put ucuc uru tʉni m ura nʉ kari -
maca’ivi. caukiaarasuruusuru.
64

