Table des caractères Unicode/U0E00
Table des caractères Unicode U+0E00 à U+0E7F (3 584 à 3 711 en décimal).
Thaï (Unicode 1.1)
Caractères utilisés pour l’écriture avec l’alphasyllabaire (ou abugida) thaï : consonnes, voyelles indépendantes, voyelles antéposées ou diacritiques, signe diacritique virama pali, marques diacritiques de ton, chiffres décimaux, symbole monétaire et signes de ponctuation.
Les caractères U+0E31, U+0E34 à U+0E3A, U+0E47 à U+0E4E sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont combinés ici avec la consonne thaïe ko kaï (= ka) « ก » (U+0E01) à des fins de lisibilité (et affichés sur fond bleu dans la table ci-dessous).
Noter également que les 5 voyelles (sara) diacritiques suivantes (dites antéposées et affichées sur fond jaune dans la table ci-dessous) :
- U+0E40 (เ) LETTRE THAÏE SARA É
- U+0E41 (แ) LETTRE THAÏE SARA Æ (= Ë)
- U+0E42 (โ) LETTRE THAÏE SARA O
- U+0E43 (ใ) LETTRE THAÏE SARA AÏ MAÏMOUAN (ou maï mouan)
- U+0E44 (ไ) LETTRE THAÏE SARA AÏ MAÏMALAÏ (ou maï malaï)
sont des exceptions à la règle Unicode usuelle de codage dans l’ordre logique des caractères : elles sont codées dans les textes avant la consonne de base (dont elles modifient la voyelle a implicite), bien qu’elles se prononcent après elle (ils sont aussi à gauche de cette consonne de base). Ces exceptions sont liées à la compatibilité avec des normes antérieures à Unicode (notamment la norme thaïe TIS 620-2533, citée en référence par Unicode, ainsi que d'autres anciens codages informatiques de texte thaï basés sur cette norme). On doit en tenir compte aussi dans la délimitation linguistique des grappes de graphèmes insécables. Dans la table ci-dessous, tous les diacritiques sont montrés associés avec la lettre thaïe ko kaï (= ka) « ก » (U+0E01), codée après chacune de ces voyelles.
Voir aussi
Liens externes
Articles connexes
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Télougou
- Singhalais
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Hanounóo
- Khmer
- Mongol (ou bitchig)
- Limbou
- Bougui (ou bouguinais, bugi, lontara)
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation – supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou (ou lisu, Fraser)
- Vaï
- Cyrillique étendu – B
- Bamoun (ou bamoum, shü-mom)
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Ougaritique
- Cunéiforme persépolitain (vieux perse)
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Yézidi
- Brâhmî
- Kaïthî (ou kayathi)
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Multanais (ou multanî)
- Dévanagari étendu – A
- Cunéiforme – nombres et ponctuation
- Mrou
- Vah bassa
- Adlam
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- Arabe étendu – B
- Bengalî
- Goudjarâtî
- Tamoul
- Thaï
- Khmer (ou cambodgien)
- Symboles monétaires
- Formes numérales communes indiennes
- Arabe – formes de présentation – A (3e partie)
- Petites variantes de forme
- Formes de demi et pleine chasse
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Singhalais – nombres archaïques
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Adlam
- Alphanumériques délimités – supplément
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de ISO/CEI 10646-1 avec Unicode 2.0) :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Cyrillique
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain (U+1000 à U+104F) obsolète car supprimé dans Unicode 2.0 (remplacé en Unicode 3.0 par le bloc « Birman ») – tous ces caractères tibétains ont plus tard été renormalisés différemment dans Unicode 2.0)
- Géorgien – assomtavrouli et mkhédrouli
- Hangûl (ou hangeul) – jamos
- Latin étendu – supplément
- Grec étendu
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Signes combinatoires pour des symboles
- Symboles de type lettre
- Formes numérales
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Pictogrammes de commande
- Reconnaissance optique de caractères (OCR)
- Symboles alphanumériques délimités
- Filets
- Pavés
- Formes géométriques
- Symboles divers
- Casseau
- Symboles et ponctuations unifiés CJC
- Hiragana
- Katakana
- Bopomofo
- Hangûl (ou hangeul) – jamos de compatibilité
- Kanboun
- Lettres et mois unifiés CJC délimités
- Compatibilité CJC
- Hangûl (ou hangeul) (U+3400 à U+4DFF) obsolète car supprimé dans Unicode 2.0 – tous ces caractères hangûl ont plus tard été renormalisés différemment dans Unicode 2.0) :
- Hangûl (ou hangeul) – syllabes coréennes (U+3400 à U+3D2D)
- Hangûl (ou hangeul) – supplément A (U+3D2E à U+44B7)
- Hangûl (ou hangeul) – supplément B (U+44B8 à U+4DFF)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Zone à usage privée : 1re partie, 2e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de présentation alphabétiques
- Formes de présentation arabes – A
- Demi-signes combinatoires
- Formes de compatibilité unifiés CJC
- Petites variantes de forme
- Formes de présentation arabes – B
- Formes de demi-chasse et de pleine chasse
- Caractères spéciaux
Notes et références
- DerivedAge.txt, base de données sur le site Unicode.
- Portail de l’informatique
- Portail de l’écriture