臺灣台語語料庫應用檢索系統
首頁 語料申請

語料申請

本語料庫來源為「教育部閩南語語音語料庫建置計畫」之成果(計畫主持人:廖元甫教授)。語料內容包含:(1)57位作者、各6000字文章,共約30萬字的台語原生文章資料;(2)約400位錄音員,每句有4~6位發音人,共計208小時,同時6支麥克風錄製的音檔。


可供申請的資料如下:
1.「教育部完整語料庫(TAT_MOE)」為上述原始成果,包含完整語音及所有文字JSON檔案,較適用於訓練電腦模型。(103GB)
2.「教育部完整語料庫-lavalier」為上述原始成果,但音檔僅一隻領夾式麥克風,檔案較小,較適用於測試。(17GB)
3.「國教院整理文字檔」為本院刪除重複資料後重新整理之EXCEL檔,較適用於文字資料應用。(2.2MB)


請視需求勾選欲申請之語料類型,填畢以下欄位並送出後,請至您所提供之電子郵件信箱收信,並依信中說明完成申請,待本院審核通過後,會將語料下載連結位址寄送至您所提供之電子郵件信箱,請於 7 日內下載,逾期將失效。


本語料庫引用方式:Liao, Y.-F. (2022). TAT_MOE Corpus [2022]. Ministry of Education. (Available online at https://tggl.naer.edu.tw. Retrieved on [使用者自填取得日期])

*勾選欲申請之語料類型,可複選

*簡述用途說明(40字)

*申請人姓名

*電子信箱

*聯絡電話

單位全銜(非必填)

系(所)級/職稱(非必填)

本人同意切實遵守下列條款:

一、語音語料庫文件及音檔內容之著作權屬原始著作人所有。

二、本人不得將語音語料庫之全部或部份移轉給第三人,但經教育部同意者不在此限。

三、本人應用語音語料庫獲致成果(包括但不限論文、著作、程式、模型、軟體、產品、應用、服務等)時,應說明使用語料來源與內容,並向教育部致謝。

四、本人如對語音語料庫內容有所改進或擴充,願意無條件回饋教育部,以共同促進語文教育之發展。

五、本人如有侵犯語音語料庫著作權或智慧財產權之行為,應自行負擔法律責任。

六、如因使用語音語料庫而發生任何損害,語音語料庫之著作權人及授權單位不負任何損害賠償責任,本人願意放棄向著作權人及授權單位索賠之權利。

七、本人如有違反本申請書之任何規定,國家教育研究院有權立即終止授權,並要求本人立即停止使用所有相關資料與資訊。如因本人違反本申請書規定而導致教育部或國家教育研究院蒙受損害,本人願負完全賠償責任。

送出
關閉跳窗

我們已收到您的申請,請至您留下的信箱

並依說明送出簽名後的申請書。

國家教育研究院 LOGO
三峽總院區

電話:(02) 7740-7890 傳真:(02) 7740-1170

地址:237201 新北市三峽區三樹路2號

線上人數:5 累積總人次:283,762
© 2023 國家教育研究院. All Rights Reserved.