起點:商業 TTS 不支援南島語系

Google、Amazon 等主流語音合成服務均不支援南島語系語言,巴賽語自然也不在其中。要讓已滅絕的巴賽語「開口說話」,只能自己動手。 開發歷程

❌ 第一次嘗試:FFmpeg 音素合成

以逐一拼接音素 wav 檔的方式進行合成——失敗。音節間的銜接過於生硬,無法產生自然語流。

🔧 第二次嘗試:改造 eSpeak 現有語言 Profile

利用 eSpeak 既有的語言設定加以改造,雛形完成。然而發現兩個根本性問題: 發音規則受限:仍被原有語言的音韻邏輯所束縛。 母音明顯失真:合成音與歷史錄音中的母音音質差距顯著。

🎯 突破口:解析歷史音檔,復元母音

解析珍貴的歷史錄音,成功重建巴賽語母音。將其置入 eSpeak 後,才深刻體會到一件事:

母音音檔的品質,決定了一個語言合成正確性的 80% 以上。

這是整個開發過程中最關鍵的發現。

🔊 子音系統調整:依據南島語系一般知見

根據南島語系的語音學通則,重新調整子音發音規則。 里程碑達成:PC 本地版巴賽語語音合成器完成。

📱 安卓移植:接近完成,暫時擱置

嘗試將 PC 本地版移植為 Android 應用程式(App),目前已接近完成。但在手邊的 Motorola 入門機上音效不佳,無其他裝置可供測試,暫時保留,尚未於 Google Play Store 公開發布。

🌐 basay.tw 網站上線

利用 GitHub Pages 架設 basay.tw。網站上的每個例句皆可點選播放音檔,讓讀者直接聆聽巴賽語發音。

☁️ 雲端 TTS:HuggingFace 整合

將 PC 本地版巴賽語語音合成移植至 HuggingFace,建立網頁版:

👉 https://inkuei-basaytts.hf.space

並與 basay.tw 整合——讀者現在可以直接輸入任意巴賽語文字,令其即時發音。

這對語言學習非常有幫助。我現在每天都在用,單字記得比以前快,對文法的理解也更加融會貫通。

📲 行動化更新:從手機即可更新「本日的巴賽語」

basay.tw 的「本日的巴賽語 Daily Basay」欄目,原本只能從 PC 端更新,十分不便。重新改造 inkuei-basaytts.hf.space 的架構後,現在已可直接從手機進行更新。

📝 新增「研究筆記」部落格

basay.tw 增設「研究筆記」部落格,記錄巴賽語復原研究的點滴——

音韻分析

文法考察

語音合成工程

田野的聲音

今日的巴賽語

Kisaizi a kawase a Basay(巴賽語復振)