巴賽語固有詞彙（source=B）音節目錄——以來源分離分析重建音韻體系

蔡永桂

中文日本語 English

巴賽語固有詞彙（source=B）音節目錄

— 以來源分離分析重建音韻體系 —

作者：蔡永桂（Yung-kuei Tsai）

日期：2026年6月23日

類型：原創研究（語言類型學 / 音韻計量分析）

授權：CC BY 4.0　引用識別：basay.tw/research/2026-06-basay-syllable-B/

摘要 Abstract

本文以巴賽語詞典資料庫中的固有詞彙（source=B，1,117筆條目）為唯一分析對象，計量提取音節目錄，描述其音韻體系。先前的混合分析（B、T、M來源合併處理）得出486種音節；本文採用來源分離分析，從固有詞彙中確認了詞頻2次以上的266種音節及22個起始輔音（onset）類別。CVC型（134種，54%）為最主要的音節結構，推翻了混合分析所呈現的CV型優勢的錯誤印象。起始輔音h、/ʃ/（s'）、/tʃ/（ts'）及sj為固有詞彙所特有，宜蘭方言資料（T+M）中未見其蹤跡。反之，混合分析中顯著出現的q、z、/ɮ/（z'）、/ɭ/（l'）在source=B中完全缺席，表明這些音素並不屬於巴賽語的核心音韻體系。本文成果說明，來源分離是多層次詞典資料庫音韻描述的方法論前提。

關鍵詞：巴賽語・固有詞彙・音節目錄・來源分離分析・音韻體系・台灣南島語

📚 引用本文 / Cite this article

APA：

蔡永桂 (2026). 巴賽語固有詞彙（source=B）音節目錄——以來源分離分析重建音韻體系. basay.tw. https://basay.tw/research/2026-06-basay-syllable-B/

BibTeX：

@misc{tsai2026syllableB,
  author = {蔡永桂 and Tsai, Yung-kuei},
  title  = {巴賽語固有詞彙（source=B）音節目錄——以來源分離分析重建音韻體系},
  year   = {2026},
  month  = {6},
  url    = {https://basay.tw/research/2026-06-basay-syllable-B/},
  note   = {Source-separated syllable inventory analysis of Basay native vocabulary}
}

一、前言

巴賽語（Basay）是台灣北部平埔族巴賽族所使用的消亡南島語系語言，17世紀荷蘭統治時期文獻及清代史料中均有詞彙記錄，20世紀前半葉已無母語使用者（李壬癸 1996；2000）。中央研究院語言學研究所持續推動記錄保存與語言復振工作。

前稿（混合分析版）將辭書中所有非PAN條目（2,364筆）合併處理，提出486種音節目錄，並將q、z、/ɮ/、/ɭ/等音素描述為巴賽語的音韻特徵。然而，此分析存在方法論上的重大問題：資料庫各條目附有來源代碼，分別代表不同的詞彙層次，若不加區分地合併處理，實際上是將不同的音韻體系混同為單一的「巴賽語」加以分析。

表1　來源代碼分布

來源	條目數	內容
B	1,117	巴賽語固有詞彙
T	588	Trobiawan方言（宜蘭系）
M	541	Trobiawan（語彙のみ採集）
S	113	噶瑪蘭語混入疑慮（本文除外）
V	5	不明（除外）
PAN	960	祖先語重建形（除外）

本文以source=B的1,117筆條目為唯一分析對象。宜蘭方言（T+M）及噶瑪蘭語接觸假說另文討論。

二、方法

音節提取程序沿用前稿，並進行以下兩項修正：其一，音節結構分類修正為反映起始輔音有無——無起始輔音的音節歸入V系（V、VC、VV、VVC），而非與有起始輔音的CV系混淆；其二，複合起始輔音叢（含兩個以上輔音音素）歸入「other」類，與ts、n'、s'、l'、z'、ts'等表記雖為二字符但實為單一音素者區別處理。

2.1 正字法對照

表2　source=B 正字法・IPA對照表

正字法	IPA	說明
n'	ŋ	軟顎鼻音
s'	ʃ	齦顎擦音
o'	ə	央元音
'（韻尾）	ʔ	聲門塞音（音節末韻尾）
ts	ts	齒齦塞擦音
ts'	tʃ	齦顎塞擦音
sj	sj	顎化擦音變體
j	j〜dʒ	近音或塞擦音

注：source=B中/ɭ/（l'）、/ɮ/（z'）、/q/、/z/均未出現。

三、結果

3.1 整體統計

表3　source=B音節目錄概況

項目	數值
分析條目數	1,117筆
音節種數（詞頻≥2）	266種
起始輔音種數	22種
最高詞頻音節	la（148次）
高頻（≥50次）	12種
中頻（10〜49次）	53種
低頻（2〜9次）	201種

3.2 音節結構分布

表4　音節結構別種數（source=B）

注：o'は単一元音/ə/のため、no'/nə/、ko'/kə/等はCV型として分類。

結構	種數	占比	說明
V	4	1.5%	純元音（a, i, o, u）
VC	1	0.4%	元音＋韻尾（at）
VV	2	0.8%	雙元音（ai, au）
VVC	1	0.4%	雙元音＋韻尾（oat）
CV	75	24.8%	基本音節型
CVC	134	53.8%	最主要類型
CVV	36	13.5%	雙元音核
CVVC	7	2.6%	雙元音核＋韻尾
other	6	2.3%	輔音叢等
合計	266	100%

CVC型占54%為最主要結構，此一結果在混合分析中因大量T+M的CV型借詞混入而遭遮蔽。

3.3 起始輔音分布

表5　主要起始輔音別種數（source=B）

起始輔音	IPA	種數	出現次數	代表音節
∅	—	8	41	a, i, o, u
b	b	19	207	ba, be, bu
h	h	20	138	ha, hi, he
j	j〜dʒ	6	44	ja, jen
k	k	23	228	ka, ke, ku
l	l	32	434	la, li, lu
m	m	21	215	ma, man, mu
n	n	20	211	na, nan, nu
n'	ŋ	3	17	n'a, n'o
p	p	22	243	pa, pu, pi
r	r	10	65	ra, ri, ru
s	s	30	476	se, sa, su
s'	ʃ	3	16	s'i, s'a
sj	sj	3	13	sja, sje
t	t	26	328	te, ta, ti
ts	ts	8	60	tsa, tse
ts'	tʃ	2	9	ts'i, ts'a
v	v	2	5	va, ve
w	w	5	52	wa, wan

四、討論

4.1 CVC優勢：一項訂正

CVC型占54%是對混合分析的重要訂正。台灣南島語分支普遍保留了源自原始南島語的音節末輔音，與波里尼西亞語言的無韻尾傾向形成對照（Blust 1999）。source=B的CVC優勢與這一保守的台灣南島語類型學特徵吻合，說明混合分析所呈現的「CV型優勢」是T+M借詞層混入所造成的假象。

4.2 固有詞彙的顎化音系

source=B中存在的/ʃ/（s'）、/tʃ/（ts'）及sj，在T+M中完全缺席，顯示固有音韻體系中存在顎化音對立。類似的顎化音系列在泰雅語（Atayal）中亦有記錄（李壬癸 1996），或可視為台灣北部語言圈的地域型音韻特徵。

4.3 缺席音素的意涵

/q/、/z/、/ɮ/（z'）、/ɭ/（l'）在source=B中完全缺席，表明這些音素不屬於巴賽語固有音韻目錄。其在混合分析中的出現，係宜蘭方言（T+M）條目的混入所致，而後者又可進一步與噶瑪蘭語接觸假說相連結（詳見姊妹篇論文）。

五、結論

source=B單獨分析得出266種音節、22個起始輔音類別，CVC為主要結構（54%）。本文糾正了混合分析的三項錯誤：（1）CV型優勢之誤；（2）/q/、/z/、/ɭ/、/ɮ/被歸屬為巴賽語音素之誤；（3）音節種數486種之過大估計。來源分離被確立為多層次詞典資料庫音韻描述不可或缺的方法論步驟。

參考文獻

Blust, R. (1999). Subgrouping, circularity and extinction. In E. Zeitoun & P. J.-K. Li (Eds.), Selected papers from the Eighth International Conference on Austronesian Linguistics (pp. 31–94). Academia Sinica.
Blevins, J. (1995). The syllable in phonological theory. In J. A. Goldsmith (Ed.), The handbook of phonological theory (pp. 206–244). Blackwell.
李壬癸 (1996). 《宜蘭縣南島民族與語言》. 宜蘭縣：宜蘭縣政府.
李壬癸 (2000). 《台灣南島語言的語音符號系統》. 台北：文鶴出版.
Thomason, S. G., & Kaufman, T. (1988). Language contact, creolization, and genetic linguistics. University of California Press.
中央研究院語言學研究所（編）. 《巴賽語詞典資料庫》（basay_dict.jsonl）. 台北：中央研究院.

📥 下載 PDF（中文） 📥 PDF（日本語） 📥 PDF（English）

← 返回研究成果一覽