巴賽語音節目錄的重新分析
— 來源分離分析對混合分析的訂正及語言接觸證據 —
摘要 Abstract
本文訂正了先前對巴賽語(Basay)音節目錄所進行的混合分析(B、T、M來源合併處理,得出486種音節),改以來源分離分析重新呈現結果。固有詞彙(source=B,1,117筆)的單獨分析確認了266種音節、22個起始輔音類別,CVC型(54%)為最主要結構。宜蘭方言(source=T+M,1,129筆)的單獨分析則得出315種音節、38個起始輔音類別,source=B中缺席的q、z、/ɮ/(z')、/ɭ/(l')等音素以近兩倍的規模出現。這些「多餘」音素與宜蘭平野相鄰之噶瑪蘭語(Kavalan)的音韻體系吻合,解釋為語言接觸所致的音韻借用。混合分析將上述音素描述為「巴賽語特徵」,屬方法論上的謬誤;本文予以訂正,同時論證來源分離分析對消滅語言音韻描述的不可或缺性。
📚 引用本文 / Cite this article
APA:
蔡永桂 (2026). 巴賽語音節目錄的重新分析——來源分離分析對混合分析的訂正及語言接觸證據. basay.tw. https://basay.tw/research/2026-06-basay-syllable-revised/
BibTeX:
@misc{tsai2026syllableRevised,
author = {蔡永桂 and Tsai, Yung-kuei},
title = {巴賽語音節目錄的重新分析——來源分離分析對混合分析的訂正及語言接觸證據},
year = {2026},
month = {6},
url = {https://basay.tw/research/2026-06-basay-syllable-revised/},
note = {Correction of mixed-source analysis and evidence for Kavalan language contact}
}
一、前言:混合分析的問題
1.1 先前分析的經過
前稿(混合分析版)將巴賽語詞典資料庫中扣除PAN重建形式後的2,364筆條目合併處理,提出486種音節目錄,並將q、z、/ɮ/(z')、/ɭ/(l')及複雜輔音叢起始輔音等描述為巴賽語的音韻特徵。
然而,此一分析存在重大的方法論問題。資料庫各條目附有來源代碼(表1),分別代表不同的詞彙層次。在未加區分的情況下合併處理,等同於將不同音韻體系混同為單一「巴賽語」分析。
表1 來源代碼別條目數
| 來源 | 條目數 | 詞彙層次 |
|---|---|---|
| B | 1,117 | 巴賽語固有詞彙 |
| T | 588 | Trobiawan方言(宜蘭系) |
| M | 541 | Trobiawan(語彙のみ採集) |
| S | 113 | 噶瑪蘭語混入疑慮(本文除外) |
| V | 5 | 不明(除外) |
| PAN | 960 | 祖先語重建形(除外) |
本文排除S、V、PAN,對B與T+M分別進行分析並加以比較,以訂正混合分析的謬誤。
二、方法
音節提取程序與前稿相同,並追加以下修正:以'起首的音節視為前音節韻尾的轉寫附帶現象予以排除;音節結構分類修正為反映起始輔音有無(前稿中VC、VV被誤分類為CVC、CVV的問題已予更正);S來源因大量噶瑪蘭語詞彙混入予以排除。
三、結果:B與T+M的比較
3.1 規模比較
表2 B vs. T+M 音節目錄規模比較
| 項目 | B(固有詞彙) | T+M(宜蘭方言) |
|---|---|---|
| 條目數 | 1,117 | 1,129 |
| 音節種數(詞頻≥2) | 266 | 315 |
| 起始輔音種數 | 22 | 38 |
| 共通音節 | 128種(B的48%) | 128種(T+M的41%) |
| 各自獨有音節 | 138種 | 187種 |
3.2 音節結構比較
表3 音節結構別種數比較
| 結構 | B | T+M | 增減 | 解讀 |
|---|---|---|---|---|
| V | 4 | 4 | 0 | 相同 |
| VC | 1 | 2 | +1 | 微差 |
| VV | 2 | 2 | 0 | 相同 |
| VVC | 1 | 0 | −1 | 微差 |
| CV | 75 | 73 | −2 | 近似 |
| CVC | 134 | 159 | +25 | T+M較多 |
| CVV | 36 | 27 | −9 | B較多 |
| CVVC | 7 | 26 | +19 | T+M顯著較多 |
| other(輔音叢) | 6 | 22 | +16 | T+M顯著較多 |
3.3 起始輔音比較
表4 B・T+M・共通起始輔音分布
| 區分 | 起始輔音 |
|---|---|
| B僅有 | h、s'(ʃ)、ts'(tʃ)、sj、sw、n'ts |
| T+M僅有 | q、z、z'(ɮ)、l'(ɭ)、ml'(mɭ)、vl'(vɭ)、y、km、kn、kt、ml、mn、mr、ms、mt、pr、pts、sm、tl、tm、tn、tr、zm |
| 共通 | ∅、b、j、k、l、m、n、n'(ŋ)、p、r、s、t、ts、v、w |
共通起始輔音僅15種,說明B與T+M的音韻體系在起始輔音層面存在根本差異。
四、討論
4.1 混合分析的謬誤與訂正
表5 混合分析的陳述與訂正後的事實
| 混合分析的陳述 | 訂正後 |
|---|---|
| 巴賽語有/q/(口蓋垂音) | T+M僅有,B中缺席 |
| 巴賽語有/z/(有聲擦音) | T+M僅有,B中缺席 |
| 巴賽語有/ɮ/(z') | T+M僅有,B中缺席 |
| 巴賽語有/ɭ/(l') | T+M僅有,B中缺席 |
| CV型優勢 | 混合假象;B單獨分析CVC型占54% |
| 音節種數486種 | B:266種;T+M:315種(重疊128種) |
4.2 T+M多餘音素的噶瑪蘭語來源假說
T+M獨有的六個起始輔音(q, z, z', l', ml', vl')均與噶瑪蘭語的基本音素對應。Thomason & Kaufman(1988)的語言接觸理論指出,此規模的音素系統性整合意味著深度接觸,而非偶發性借詞混入。q(128次、18種)與z(98次、21種)的高出現頻率尤為顯著。
4.3 B固有音素的再評價
B中特有、T+M中缺席的h、/ʃ/(s')、/tʃ/(ts')、sj應作為巴賽語音韻個性的核心音素重新評價。尤其是h起始輔音(20種、138次),構成固有詞彙基本音節(ha, hi, he等)的骨架,是巴賽語音韻體系的核心要素之一。
4.4 方法論的啟示
本文案例揭示了多方言多來源詞典資料在音韻分析中的四重錯誤風險:
- 音節種數的過大估計(266種+315種的重疊 → 混合486種)
- 音節結構實態的扭曲(CVC優勢 → 在混合中呈現CV優勢假象)
- 接觸來源音素被誤認為固有音素
- 低信賴度資料(S來源等)未能早期排除
五、結論
本文訂正了先前的混合分析,分別提出固有詞彙(B)266種、22個起始輔音及宜蘭方言(T+M)315種、38個起始輔音的獨立音節目錄。主要發現如下:
- 巴賽語固有詞彙以CVC型為主(54%),混合分析所呈現的CV型優勢係誤判
- T+M的多餘音素(q, z, z', l'等)極可能源自噶瑪蘭語接觸
- h、s'、ts'才是巴賽語音韻個性的核心音素
- 來源分離分析是消滅語言音韻描述不可缺少的方法論步驟
參考文獻
- Blust, R. (1999). Subgrouping, circularity and extinction. In E. Zeitoun & P. J.-K. Li (Eds.), Selected papers from the Eighth International Conference on Austronesian Linguistics (pp. 31–94). Academia Sinica.
- Blevins, J. (1995). The syllable in phonological theory. In J. A. Goldsmith (Ed.), The handbook of phonological theory (pp. 206–244). Blackwell.
- Fenk-Oczlon, G., & Fenk, A. (2021). Linguistic complexity. Frontiers in Communication, 6, 626032.
- 李壬癸 (1996). 《宜蘭縣南島民族與語言》. 宜蘭縣:宜蘭縣政府.
- 李壬癸 (2000). 《台灣南島語言的語音符號系統》. 台北:文鶴出版.
- Thomason, S. G., & Kaufman, T. (1988). Language contact, creolization, and genetic linguistics. University of California Press.
- 中央研究院語言學研究所(編). 《巴賽語詞典資料庫》(
basay_dict.jsonl). 台北:中央研究院.