ISO 639-3

王朝百科·作者佚名 2010-09-30

宽屏版字体: 小 | 中 | 大 | 超大

ISO 639-3是个国际语种代号标准，在2007年2月5日出版。它延伸了 ISO 639-2 里的 Alpha-3 code（三个字母的代号），目标是涵盖所有的语言。所以，它是ISO 639-1的超集合。 ISO 639-3 是 ISO 639-2 个别语言的超集合，但是因为 ISO 639-3 没有 ISO 639-2 的语言集合，所以 ISO 639-3 不是整个 ISO 639-2 的超集合。

自2005年7月30日发布的计划草案，共有 7,602 个语言条目，这些语言的来源有三个：基本资料来自 ISO 639-2 所收录的个别语言，和取自《民族语》里的现代语言调查资料。而过去历史的各类语言及古老的语言和人工语言，则是出自 the Linguist List 的资料。

编码空间因为这是采用 3 个字母，所以这套 3 字母编码理论上最多可代表 26×26×26 = 17,576 种语言。但是，因 ISO 639-2 定义了4个特别代码、 520个预留区域和23个 B 类代码，故此 ISO 639-3 可用的编码只有 17,576 − 547 = 17,030 个。

其中有4个代码用来代表特殊情况：

mis──“uncoded languages”（未编码语言）；

mul──“multiple languages”（多语种）；

und──“undetermined language”（未确定的语种）；

zxx──“no linguistic content”。标准中亦有一个供私人使用的范围： qaa-qtz。

大语言在 ISO 639-3 代码中，以下的语言被视为是某些其他语言的大语言 (macrolanguage)，即这些语言可再细分为数种以上的语言。就以汉语为例，SIL 就把汉语细分为 14 种语言。

* 阿坎语（aka）

* 阿拉伯语（ara）

* 艾马拉语（aym）

* 阿塞拜疆语（aze）

* 俾路支语（bal）

* 比科尔语（bik）

* 布里亚特语（bua）

* 马里语（chm）

* 克里语（cre）

* 特拉华语（del）

* 史拉维语（den）

* 丁卡语（din）

* 多格拉语（doi）

* 爱沙尼亚语（est）自2008-043号修订，2009年1月16日生效

* 波斯语（fas）

* 弗里西亚语（fry）

* 富拉语（ful）

* 巴亚语（gba）

* 贡德语（gon）

* 格列博语（grb）

* 瓜拉尼语（grn）

* 海达语（hai）

* 塞尔维亚-克罗地亚语（hbs）

* 苗语（hmn）

* 因纽特语（iku）

* 依努庇克语（ipk）

* 犹太-阿拉伯语（jrb）

* 卡努里语（kau）

* Kalenjin（kln）自2007-169号修订，2008年1月14日生效

* 孔卡尼语（kok）

* 科米语（kom）

* 刚果语（kon）

* 克佩勒语（kpe）

* 库尔德语（kur）

* 拉亨达语（lah）

* Luyia（luy）自2007-171号修订，2008年1月14日生效

* 曼丁哥语（man）

* 马达加斯加语（mlg）

* 蒙古语（mon）

* 马来语（msa）

* 马尔瓦利语（mwr）

* 挪威语（nor）

* 奥克语（oci）由2007年3月14日取消

* 奥吉布瓦语（oji）

* 奥洛莫语（orm）

* 普什图语（pus）

* 凯楚亚语（que）

* 拉贾斯坦语（raj）

* 吉普赛语（rom）

* 阿尔巴尼亚语（sqi）

* 撒丁语（srd）

* 斯瓦希里语（swa）

* 古叙利亚语（syr）

* 塔马奇克语（tmh）

* 乌兹别克语（uzb）

* 依地语（yid）

* 萨波特克语（zap）

* 壮语（zha）

* 汉语（zho）

* 扎扎其语（zza）

集合语言SIL 在检视过七千多种语言之后，发现以下 11 种被列在 ISO 639-2 的语言，它们之下所包含的语言，并非属于同一语种，故在 ISO 639-3 代码中被删除。

列表参看ISO 639-2下的“用来代表集合语言的代码”段。