中文 日本語 English

巴賽語固有詞彙(source=B)音節目錄

— 以來源分離分析重建音韻體系 —

作者:蔡永桂(Yung-kuei Tsai)
日期:2026年6月23日
類型:原創研究(語言類型學 / 音韻計量分析)
授權:CC BY 4.0 引用識別:basay.tw/research/2026-06-basay-syllable-B/

摘要 Abstract

本文以巴賽語詞典資料庫中的固有詞彙(source=B,1,117筆條目)為唯一分析對象,計量提取音節目錄,描述其音韻體系。先前的混合分析(B、T、M來源合併處理)得出486種音節;本文採用來源分離分析,從固有詞彙中確認了詞頻2次以上的266種音節及22個起始輔音(onset)類別。CVC型(134種,54%)為最主要的音節結構,推翻了混合分析所呈現的CV型優勢的錯誤印象。起始輔音h、/ʃ/(s')、/tʃ/(ts')及sj為固有詞彙所特有,宜蘭方言資料(T+M)中未見其蹤跡。反之,混合分析中顯著出現的q、z、/ɮ/(z')、/ɭ/(l')在source=B中完全缺席,表明這些音素並不屬於巴賽語的核心音韻體系。本文成果說明,來源分離是多層次詞典資料庫音韻描述的方法論前提。

關鍵詞:巴賽語・固有詞彙・音節目錄・來源分離分析・音韻體系・台灣南島語

📚 引用本文 / Cite this article

APA:

蔡永桂 (2026). 巴賽語固有詞彙(source=B)音節目錄——以來源分離分析重建音韻體系. basay.tw. https://basay.tw/research/2026-06-basay-syllable-B/

BibTeX:

@misc{tsai2026syllableB,
  author = {蔡永桂 and Tsai, Yung-kuei},
  title  = {巴賽語固有詞彙(source=B)音節目錄——以來源分離分析重建音韻體系},
  year   = {2026},
  month  = {6},
  url    = {https://basay.tw/research/2026-06-basay-syllable-B/},
  note   = {Source-separated syllable inventory analysis of Basay native vocabulary}
}

一、前言

巴賽語(Basay)是台灣北部平埔族巴賽族所使用的消亡南島語系語言,17世紀荷蘭統治時期文獻及清代史料中均有詞彙記錄,20世紀前半葉已無母語使用者(李壬癸 1996;2000)。中央研究院語言學研究所持續推動記錄保存與語言復振工作。

前稿(混合分析版)將辭書中所有非PAN條目(2,364筆)合併處理,提出486種音節目錄,並將q、z、/ɮ/、/ɭ/等音素描述為巴賽語的音韻特徵。然而,此分析存在方法論上的重大問題:資料庫各條目附有來源代碼,分別代表不同的詞彙層次,若不加區分地合併處理,實際上是將不同的音韻體系混同為單一的「巴賽語」加以分析。

表1 來源代碼分布

來源條目數內容
B1,117巴賽語固有詞彙
T588Trobiawan方言(宜蘭系)
M541Trobiawan(語彙のみ採集)
S113噶瑪蘭語混入疑慮(本文除外)
V5不明(除外)
PAN960祖先語重建形(除外)

本文以source=B的1,117筆條目為唯一分析對象。宜蘭方言(T+M)及噶瑪蘭語接觸假說另文討論。


二、方法

音節提取程序沿用前稿,並進行以下兩項修正:其一,音節結構分類修正為反映起始輔音有無——無起始輔音的音節歸入V系(V、VC、VV、VVC),而非與有起始輔音的CV系混淆;其二,複合起始輔音叢(含兩個以上輔音音素)歸入「other」類,與ts、n'、s'、l'、z'、ts'等表記雖為二字符但實為單一音素者區別處理。

2.1 正字法對照

表2 source=B 正字法・IPA對照表

正字法IPA說明
n'ŋ軟顎鼻音
s'ʃ齦顎擦音
o'ə央元音
'(韻尾)ʔ聲門塞音(音節末韻尾)
tsts齒齦塞擦音
ts'齦顎塞擦音
sjsj顎化擦音變體
jj〜dʒ近音或塞擦音

注:source=B中/ɭ/(l')、/ɮ/(z')、/q/、/z/均未出現。


三、結果

3.1 整體統計

表3 source=B音節目錄概況

項目數值
分析條目數1,117筆
音節種數(詞頻≥2)266種
起始輔音種數22種
最高詞頻音節la(148次)
高頻(≥50次)12種
中頻(10〜49次)53種
低頻(2〜9次)201種

3.2 音節結構分布

表4 音節結構別種數(source=B)

注:o'は単一元音/ə/のため、no'/nə/、ko'/kə/等はCV型として分類。

結構種數占比說明
V41.5%純元音(a, i, o, u)
VC10.4%元音+韻尾(at)
VV20.8%雙元音(ai, au)
VVC10.4%雙元音+韻尾(oat)
CV7524.8%基本音節型
CVC13453.8%最主要類型
CVV3613.5%雙元音核
CVVC72.6%雙元音核+韻尾
other62.3%輔音叢等
合計266100%

CVC型占54%為最主要結構,此一結果在混合分析中因大量T+M的CV型借詞混入而遭遮蔽。

3.3 起始輔音分布

表5 主要起始輔音別種數(source=B)

起始輔音IPA種數出現次數代表音節
841a, i, o, u
bb19207ba, be, bu
hh20138ha, hi, he
jj〜dʒ644ja, jen
kk23228ka, ke, ku
ll32434la, li, lu
mm21215ma, man, mu
nn20211na, nan, nu
n'ŋ317n'a, n'o
pp22243pa, pu, pi
rr1065ra, ri, ru
ss30476se, sa, su
s'ʃ316s'i, s'a
sjsj313sja, sje
tt26328te, ta, ti
tsts860tsa, tse
ts'29ts'i, ts'a
vv25va, ve
ww552wa, wan

四、討論

4.1 CVC優勢:一項訂正

CVC型占54%是對混合分析的重要訂正。台灣南島語分支普遍保留了源自原始南島語的音節末輔音,與波里尼西亞語言的無韻尾傾向形成對照(Blust 1999)。source=B的CVC優勢與這一保守的台灣南島語類型學特徵吻合,說明混合分析所呈現的「CV型優勢」是T+M借詞層混入所造成的假象。

4.2 固有詞彙的顎化音系

source=B中存在的/ʃ/(s')、/tʃ/(ts')及sj,在T+M中完全缺席,顯示固有音韻體系中存在顎化音對立。類似的顎化音系列在泰雅語(Atayal)中亦有記錄(李壬癸 1996),或可視為台灣北部語言圈的地域型音韻特徵。

4.3 缺席音素的意涵

/q/、/z/、/ɮ/(z')、/ɭ/(l')在source=B中完全缺席,表明這些音素不屬於巴賽語固有音韻目錄。其在混合分析中的出現,係宜蘭方言(T+M)條目的混入所致,而後者又可進一步與噶瑪蘭語接觸假說相連結(詳見姊妹篇論文)。


五、結論

source=B單獨分析得出266種音節、22個起始輔音類別,CVC為主要結構(54%)。本文糾正了混合分析的三項錯誤:(1)CV型優勢之誤;(2)/q/、/z/、/ɭ/、/ɮ/被歸屬為巴賽語音素之誤;(3)音節種數486種之過大估計。來源分離被確立為多層次詞典資料庫音韻描述不可或缺的方法論步驟。

參考文獻


📥 下載 PDF(中文) 📥 PDF(日本語) 📥 PDF(English)

← 返回研究成果一覽