Taiwan-Tongues-ASR-CE-pretrained Model

本模型為 Taiwan-Tongues-ASR-CE 專案所使用的 Automatic Speech Recognition (ASR) 模型，配合對應的語料庫進行預訓練與微調。

📂 模型檔案結構

模型包含以下檔案：

請參考 Taiwan-Tongues-ASR-CE 專案最新且完整訓練方法及步驟

請先安裝 Python 3.8+ 及以下套件（建議使用虛擬環境）：

pip install torch transformers datasets evaluate

依照專案資料集格式放置語音資料與標註檔案。

推薦使用 WebDataset tar 檔 (train/train-000000.tar...) 搭配 metadata，能更方便地進行流式訓練。
也可使用 train.tsv / test.tsv 載入，但不建議。

可直接執行 run.sh，或根據需求修改參數：

bash run.sh

主要參數說明：

訓練完成後，模型與相關設定會儲存在 output/ 目錄：

output/
├── config.json
├── model.bin
├── preprocessor_config.json
├── tokenizer.json
├── vocabulary.json

已訓練好的國語、台語、客語、英語模型存放於 models/ 目錄，包含：
- model.bin：模型權重
- config.json、preprocessor_config.json、tokenizer.json、vocabulary.json

這些檔案可以直接放入 Hugging Face transformers 進行推論或微調。

歡迎研究人員與開發者使用本模型，並透過 Issue 或 Pull Request 回饋改進。

本模型依照 Taiwan-Tongues-ASR-CE 專案授權條款釋出，使用者需遵守相關規範。

Safetensors

Model size

2B params

Tensor type

F16