グジャラート文字 (Unicodeのブロック)

Unicodeのブロック

グジャラート文字(グジャラートもじ、英語: Gujarati)は、Unicodeの26個目のブロック

グジャラート文字 (Unicodeのブロック)
Gujarati
範囲 U+0A80..U+0AFF
(128 個の符号位置)
基本多言語面
用字 グジャラート文字
主な言語・文字体系
割当済 91 個の符号位置
未使用 37 個の保留
Unicodeのバージョン履歴
1.0.0 75 (+75)
1.1 78 (+3)
4.0 83 (+5)
6.1 84 (+1)
8.0 85 (+1)
10.0 91 (+6)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

解説

編集

インド西部のグジャラート州などで話されているグジャラート語を表記するグジャラート文字を収録している。

グジャラート文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるヴィラーマという記号を子音字の下に付加したりする。例えば子音字kaકの後にヴィラーマと子音字ssaષが後続するとkssaક્ષという合字が形成される。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。なお、デーヴァナーガリーやベンガル文字とは異なり文字の上部に水平線(シローレーカー)は持たない。

子音字は有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別する。そのため、各調音点における破裂音には計4種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられているが、現在のグジャラート語では発音上は区別されないものもある。

符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っている。

加えて、アラビア文字タイ文字などと同様に独自の数字体系(グジャラート数字)を有している。

Unicodeのバージョン1.0においても「グジャラート文字(Gujarati)」というブロック名で制定されていた。[1]

収録文字

編集

ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
各種記号
U+0A81 GUJARATI SIGN CANDRABINDU チャンドラビンドゥ。

母音字や母音記号に付き、母音を鼻母音で発音することを表す。

U+0A82 GUJARATI SIGN ANUSVARA アヌスヴァーラ

直後に音節が後続する子音字に付き、直後の子音と同じ調音点鼻音が挿入されることを表す。日本語における「」に相当する。

U+0A83 GUJARATI SIGN VISARGA ヴィサルガ

音節末に[h]を伴うことを表す。

独立母音字
U+0A85 GUJARATI LETTER A 母音[ə]を表す。 a
U+0A86 GUJARATI LETTER AA 母音[ɑ]を表す。元は長母音のāを表していた。 ā
U+0A87 GUJARATI LETTER I 母音[i]を表す。 i
U+0A88 GUJARATI LETTER II 母音[i]を表す。元は長母音のīを表していた。 ī
U+0A89 GUJARATI LETTER U 母音[u]を表す。 u
U+0A8A GUJARATI LETTER UU 母音[u]を表す。元は長母音のūを表していた。 ū
U+0A8B GUJARATI LETTER VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現在のグジャラート語では[ru]と発音される。

[2]
U+0A8C GUJARATI LETTER VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。

サンスクリット語の表記に用いられる。[3]

[4]
U+0A8D GUJARATI VOWEL CANDRA E 母音[ɛ]を表す。 ê
U+0A8E (予約済) ĕ
U+0A8F GUJARATI LETTER E 母音[e]を表す。 e
U+0A90 GUJARATI LETTER AI 二重母音[əɪ]を表す。 ai
U+0A91 GUJARATI VOWEL CANDRA O 母音[ɔ]を表す。 ô
U+0A92 (予約済) ŏ
U+0A93 GUJARATI LETTER O 母音[o]を表す。 o
U+0A94 GUJARATI LETTER AU 二重母音[əʊ]を表す。 au
子音字
U+0A95 GUJARATI LETTER KA 子音[k]を表す。 k
U+0A96 GUJARATI LETTER KHA 子音[kʰ]を表す。 kh
U+0A97 GUJARATI LETTER GA 子音[ɡ]を表す。 g
U+0A98 GUJARATI LETTER GHA 子音[ɡʱ]を表す。 gh
U+0A99 GUJARATI LETTER NGA 子音[ŋ]を表す。
U+0A9A GUJARATI LETTER CA 子音[c]を表す。 c
U+0A9B GUJARATI LETTER CHA 子音[cʰ]を表す。 ch
U+0A9C GUJARATI LETTER JA 子音[ɟ]を表す。 j
U+0A9D GUJARATI LETTER JHA 子音[ɟʱ]を表す。 jh
U+0A9E GUJARATI LETTER NYA 子音[ɲ]を表す。 ñ
U+0A9F GUJARATI LETTER TTA 子音[ʈ]を表す。
U+0AA0 GUJARATI LETTER TTHA 子音[ʈʰ]を表す。 ṭh
U+0AA1 GUJARATI LETTER DDA 子音[ɖ]を表す。
U+0AA2 GUJARATI LETTER DDHA 子音[ɖʱ]を表す。 ḍh
U+0AA3 GUJARATI LETTER NNA 子音[ɳ]を表す。
U+0AA4 GUJARATI LETTER TA 子音[t]を表す。 t
U+0AA5 GUJARATI LETTER THA 子音[tʰ]を表す。 th
U+0AA6 GUJARATI LETTER DA 子音[d]を表す。 d
U+0AA7 GUJARATI LETTER DHA 子音[dʱ]を表す。 dh
U+0AA8 GUJARATI LETTER NA 子音[n]を表す。 n
U+0AA9 (予約済)
U+0AAA GUJARATI LETTER PA 子音[p]を表す。 p
U+0AAB GUJARATI LETTER PHA 子音[pʰ]を表す。 ph
U+0AAC GUJARATI LETTER BA 子音[b]を表す。 b
U+0AAD GUJARATI LETTER BHA 子音[bʱ]を表す。 bh
U+0AAE GUJARATI LETTER MA 子音[m]を表す。 m
U+0AAF GUJARATI LETTER YA 子音[j]を表す。 y
U+0AB0 GUJARATI LETTER RA 子音[ɾ]を表す。 r
U+0AB1 (予約済) ṟ / r̆[5]
U+0AB2 GUJARATI LETTER LA 子音[l]を表す。 l
U+0AB3 GUJARATI LETTER LLA 子音[ɭ]を表す。
U+0AB4 (予約済)
U+0AB5 GUJARATI LETTER VA 子音[ʋ]を表す。 v
U+0AB6 GUJARATI LETTER SHA 子音[ʃ]を表す。 ś
U+0AB7 GUJARATI LETTER SSA 子音[ʃ]を表す。

元々は反り舌音の[ʂ]を表していた。

U+0AB8 GUJARATI LETTER SA 子音[s]を表す。 s
U+0AB9 GUJARATI LETTER HA 子音[h]を表す。 h
各種記号
U+0ABC GUJARATI SIGN NUKTA ヌクター。子音字を拡張して新たな発音を表す際に用いられる。[3]
U+0ABD GUJARATI SIGN AVAGRAHA アヴァグラハ。連音サンディ)によって語頭の母音 a が消えたことを表す。
従属母音記号
U+0ABE GUJARATI VOWEL SIGN AA 母音[ɑ]を表す。元は長母音のāを表していた。 ā
U+0ABF િ GUJARATI VOWEL SIGN I 母音[i]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。[3]

i
U+0AC0 GUJARATI VOWEL SIGN II 母音[i]を表す。元は長母音のīを表していた。 ī
U+0AC1 GUJARATI VOWEL SIGN U 母音[u]を表す。 u
U+0AC2 GUJARATI VOWEL SIGN UU 母音[u]を表す。元は長母音のūを表していた。 ū
U+0AC3 GUJARATI VOWEL SIGN VOCALIC R 音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。

現在のグジャラート語では[ru]と発音される。

[2]
U+0AC4 GUJARATI VOWEL SIGN VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。

現在のグジャラート語では[ru]と発音される。

r̥̄[6]
U+0AC5 GUJARATI VOWEL SIGN CANDRA E 母音[ɛ]を表す。 ê
U+0AC6 (予約済) ĕ
U+0AC7 GUJARATI VOWEL SIGN E 母音[e]を表す。 e
U+0AC8 GUJARATI VOWEL SIGN AI 二重母音[əɪ]を表す。 ai
U+0AC9 GUJARATI VOWEL SIGN CANDRA O 母音[ɔ]を表す。 ô
U+0ACA (予約済)
U+0ACB GUJARATI VOWEL SIGN O 母音[o]を表す。 o
U+0ACC GUJARATI VOWEL SIGN AU 二重母音[əʊ]を表す。 au
ヴィラーマ
U+0ACD GUJARATI SIGN VIRAMA ヴィラーマ(殺母音記号)。母音/-a/を発音せず子音のみが読まれることを表す。[3]

レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にヴィラーマ記号が子音字の下に書かれることもある。

各種記号
U+0AD0 GUJARATI OM ヒンドゥー教などにおける聖音のオームを表す記号。
サンスクリット語用の追加母音字
U+09E0 GUJARATI LETTER VOCALIC RR 音節主音化した長母音としてのR(IPA:[ɹ̩ː])を表す。 r̥̄[6]
U+09E1 GUJARATI LETTER VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[7]
U+09E2 GUJARATI VOWEL SIGN VOCALIC L 音節主音化した短母音としてのL(IPA:[l̩])を表す。 [4]
U+09E3 GUJARATI VOWEL SIGN VOCALIC LL 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 l̥̄[7]
予約済
U+0AE4 (予約済) .
U+0AE5 (予約済)
数字
U+0AE6 GUJARATI DIGIT ZERO グジャラート文字における数字の0 0
U+0AE7 GUJARATI DIGIT ONE グジャラート文字における数字の1 1
U+0AE8 GUJARATI DIGIT TWO グジャラート文字における数字の2 2
U+0AE9 GUJARATI DIGIT THREE グジャラート文字における数字の3 3
U+0AEA GUJARATI DIGIT FOUR グジャラート文字における数字の4 4
U+0AEB GUJARATI DIGIT FIVE グジャラート文字における数字の5 5
U+0AEC GUJARATI DIGIT SIX グジャラート文字における数字の6 6
U+0AED GUJARATI DIGIT SEVEN グジャラート文字における数字の7 7
U+0AEE GUJARATI DIGIT EIGHT グジャラート文字における数字の8 8
U+0AEF GUJARATI DIGIT NINE グジャラート文字における数字の9 9
省略記号
U+0AF0 GUJARATI ABBREVIATION SIGN グジャラート文字における略語記号。ラテン文字などにおける省略のピリオド(.)に相当する。[8] .
通貨記号
U+0AF1 GUJARATI RUPEE SIGN インド・ルピーのグジャラート文字における通貨記号。

現在は文字シーケンス0AB0 ર 0AC2 ૂ 0AF0 ૰ (રૂ૰)で表現することが推奨されている。[3]U+0AF0が収録される以前の版から存在していた文字のため分解された表現とは別に符号位置が割り当てられている。[9]

追加の子音字
U+0AF9 GUJARATI LETTER ZHA アヴェスター語アヴェスター文字)の翻字に用いられる。[3]

U+10B32 𐬲 AVESTAN LETTER ZHEに対応し、子音[ʒ]を表す。[10]

ž
翻字用記号
U+0AFA GUJARATI SIGN SUKUN イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。[3]

U+0652 ْ ARABIC SUKUNに対応し、無母音の子音を表す。機能としてはヴィラーマ(U+0ACD ્)と同じだが、母音字にも付くことができ、その場合クルアーンの朗唱において休止することを表す。[11]

U+0AFB GUJARATI SIGN SHADDA イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。[3]

U+0651 ّ ARABIC SHADDAに対応し、子音を重子音として読むことを表す。[11]

U+0AFC GUJARATI SIGN MADDAH イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。[3]

U+0653 ٓ ARABIC MADDAH ABOVEに対応し、母音を長母音として読むことを表す。[11]

U+0AFD GUJARATI SIGN THREE-DOT NUKTA ABOVE イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。[3]

アラビア語のいくつかの子音の表現用にグジャラート文字の子音を拡張するために用いられる。例えば字母a(અ)やi(ઇ)に付くとアラビア文字ain ع [ʕ]を、字母ka(ક)に付くとアラビア文字qaf ق [q]を、字母kha(ખ)に付くとアラビア文字khah خ [x]を表す。[11]

U+0AFE GUJARATI SIGN CIRCLE NUKTA ABOVE イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。[3]

字母sa(સ)に付いてアラビア文字theh ث [θ]の、字母jha(ઝ)に付いてアラビア文字thal ذ [ð]の音訳を表す。[11]

U+0AFF ૿ GUJARATI SIGN TWO-CIRCLE NUKTA ABOVE イスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される。[3]

字母jha(ઝ)に付いてアラビア文字zah (U+0638 ظ) [ðˤ]の音訳を表す。[11]

小分類

編集

このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「サンスクリット語用の追加母音字」(Additional vowels for Sanskrit)、「予約済」(Reserved)、「数字」(Digits)、「省略記号」(Abbreviation sign)、「通貨記号」(Currency symbol)、「追加の子音字」(Additional consonant)、「翻字用記号」(Transliteration signs)の12個となっている。[3]本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

各種記号(Various signs

編集

この小分類にはグジャラート文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

独立母音字(Independent vowels

編集

この小分類にはグジャラート文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

子音字(Consonants

編集

この小分類にはグジャラート文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。

従属母音記号(Dependent vowel signs

編集

この小分類にはグジャラート文字のうち、子音字に結合する母音記号が収録されている。文字によっては子音字の左側に結合されるため文字の符号上の順序とレンダー上の順序が入れ替わる場合があり、また、組み合わせる先の子音字によっては特殊な合字を形成することがある。

ヴィラーマ(Virama

編集

この小分類にはグジャラート文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。但し、文字によっては半子音字形を持たずただ単にヴィラーマが子音字の下に付く場合もある。

サンスクリット語用の追加母音字(Additional vowels for Sanskrit

編集

この小分類にはグジャラート文字のうち、サンスクリット語の表記に用いられる音節主音化した母音字としての流音の文字が収録されている。

予約済(Reserved

編集

この小分類には現在は文字が収録されていないが、将来的な追加のために領域が予約されている。デーヴァナーガリーにおける「インド諸文字用の一般句読点Generic punctuation for scripts of India)」に相当する。

なお、ヴィラム(viram)句読点には、デーヴァナーガリー文字ブロックにある一般的なインド諸文字用の句読点の U+0964 । と U+0965 ॥ を使用する。[3]

数字(Digits

編集

この小分類にはグジャラート文字で用いられる固有の数字が収録されている。

省略記号(Abbreviation sign

編集

この小分類にはグジャラート文字のうち、略語に用いられる省略記号1つのみが収録されている。

通貨記号(Currency symbol

編集

この小分類にはグジャラート文字のうち、インド・ルピーの通貨記号1つのみが収録されている。

追加の子音字(Additional consonant

編集

この小分類にはグジャラート文字のうち、アヴェスター語アヴェスター文字)の翻字に用いられる子音字1文字のみが収録されている。

翻字用記号(Transliteration signs

編集

この小分類にはイスマイリ・ホージャのコミュニティによってアラビア文字をグジャラート文字に音訳するために使用される記号[3]が収録されている。

文字コード

編集
グジャラート文字(Gujarati)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0A8x
U+0A9x
U+0AAx
U+0ABx િ
U+0ACx
U+0ADx
U+0AEx
U+0AFx ૿
注釈
1.^バージョン15.1時点


履歴

編集

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 U+0A81..0A83,0A85..0A8B,0A8F..0A90,0A93..0AA8,

0AAA..0AB0,0AB2..0AB3,0AB5..0AB9,0ABC..0AC5, 0AC7..0AC8,0ACB..0ACD,0AD0,0AE0,0AE6..0AEF

75 (to be determined)
1.1 U+0A8D,0A91,0AC9 3 (to be determined)
4.0 U+0A8C,0AE1..0AE3,0AF1 5 (to be determined)
6.1 U+0AF0 1 L2/09-330 Anshuman Pandey (2 October 2009), Proposal to Encode An Abbreviation Sign for Gujarati (英語)
L2/09-331 Anshuman Pandey (8 October 2009), Proposal to Deprecate GUJARATI RUPEE SIGN (英語)
8.0 U+0AF9 1 L2/13-066 Vinodh Rajan (23 April 2013), Proposal to encode Gujarati Sign Triple Nukta (英語)
L2/13-143 Vinodh Rajan (18 July 2013), Proposal to encode Gujarati Letter ZHA (英語)
10.0 U+0AFA..0AFF 6 L2/14-131 Anshuman Pandey (5 May 2014), Proposal to Encode Gujarati Signs for the Transliteration of Arabic (WG2 N4574) (英語)
L2/15-103 SEI; Anshuman Pandey (2 April 2015), Revised Proposal to Encode Gujarati Signs for the Transliteration of Arabic (replaces L2/14-131) (英語)
(提案中)PAO SIGN 1 L2/04-358 Manoj Jain (Govt India) (5 October 2004), Encoding of Gujarati Signs Pao, Addho & Pono in Gujarati code block (英語)
L2/04-402 Eric Muller (14 November 2004), Clarifications on L2/04-358, Gujarati fractions (英語)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

編集
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
  2. ^ a b IASTではṛと表記される。
  3. ^ a b c d e f g h i j k l m n o "The Unicode Standard, Version 15.1 - U0A80.pdf" (PDF). The Unicode Standard (英語). 2024年7月15日閲覧
  4. ^ a b IASTではḷと表記される。
  5. ^ まつ毛のRの時はr̆となる。
  6. ^ a b IASTではṝと表記される。
  7. ^ a b IASTではḹと表記される。
  8. ^ Anshuman Pandey (2009年10月2日). “Proposal to Encode An Abbreviation Sign for Gujarati” (英語). Unicode. 2024年7月15日閲覧。
  9. ^ Anshuman Pandey (2009年10月8日). “Proposal to Deprecate GUJARATI RUPEE SIGN” (英語). Unicode. 2024年7月15日閲覧。
  10. ^ Vinodh Rajan (2013年7月18日). “Proposal to encode Gujarati Letter ZHA” (英語). Unicode. 2024年7月15日閲覧。
  11. ^ a b c d e f SEI; Anshuman Pandey (2015年4月2日). “Revised Proposal to Encode Gujarati Signs for the Transliteration of Arabic (replaces L2/14-131)” (英語). Unicode. 2024年7月15日閲覧。

関連項目

編集