最新消息
臺灣客語語料庫試用版上線‧邀全民共下迎接客語數位新時代
發佈單位 | 客家事務科 |
---|---|
發佈時間 | 2022/01/05 |
詳細內容
客語數位化來臨!客家委員會透過建置AI客語語料庫,保存客家文化,迄今已收錄超過600萬字(含書面、口語)客語語料,語料庫系統於12月24日正式上線開放各界試用。
其臺灣客語語料庫系統具有多項功能:
1.資料視覺化與多媒體展示,於入口網頁設置客語常用詞文字雲、客語特色詞彙展示,將相關資訊視覺化,方便民眾快速瀏覽客語常用詞彙;同時設有「口語人物誌」,以多媒體形式展示本語料庫所收錄之口語語料。
2.語言典藏與保存,透過書面語料及口語語料的蒐集,完成臺灣客語六腔(四縣、海陸、大埔、饒平、詔安、南四縣)的基礎保存,其內涵包括保存語言資產、展現語言多樣性、記錄語言生命等多面向。
3.教學研究與數位化應用,語料檢索系統及客語斷詞及詞性標注器之設置,不僅能作為客語學術研究、教學推廣使用,更是完成臺灣客語的數位接軌,建立語言資料與資訊科技介接的管道,提供大數據分析能力,亦為後續臺灣客語數位應用的重要素材。
未來將有助於客語研究與教學推展,更可應用到日常生活中的各種大小事,讓學習客語變得很簡單,歡迎大家點選連結:https://corpus.hakka.gov.tw/ 一同徜徉珍貴的客語資料雲海,迎接全新客語時代。