【轉知】數位發展部有關「臺灣主權 AI 訓練語料庫」申請事宜,檢送申請須知及使用規範 1 份。
主旨
【轉知】數位發展部有關「臺灣主權 AI 訓練語料庫」申請事宜,檢送申請須知及使用規範 1 份。
說明
一、 為推動臺灣主權 AI 發展,本部打造「臺灣主權 AI 訓練語料庫」(下稱語料庫), 廣納高品質正體中文語料,支援 AI 模型訓練更貼近臺灣語言、文化與生活情境, 促進 AI 模型具備更高的本土辨識力與語意理解能力。
二、 語料庫目前已逾 200 個政府機關投入,上架累計超過 3,000 筆資料集, 語料規模超過 10 億詞元(token)並持續擴充,收錄內容為各機關具臺灣文化特色之 高品質資料集,涵蓋語言、文化、交通、教育、生物、地理環境等領域。
三、 歡迎有 AI 模型訓練需求之機關(構)、公私法人、研究機構、學校、 非法人團體或自然人申請使用,用臺灣的語料,打造理解臺灣的 AI。