Table des caractères Unicode/U0A00
Table des caractères Unicode U+0A00 à U+0A7F.
Gourmoukhî (ou gurmukhi) (Unicode 1.1 à 11.0)
Caractères utilisés pour l’écriture avec l’alphasyllabaire (ou abugida) gourmoukhî, le plus utilisé pour écrire notamment le panjâbî (ou pendjabi) ou les textes religieux du sikhisme.
Les caractères U+0A01 à U+0A03, U+0A3C, U+0A3E à U+0A42, U+0A47, U+0A48, U+0A4B à U+0A4D, U+0A51, U+0A70, U+0A71 et U+0A75 sont des signes diacritiques se combinant avec le caractère de base après lequel ils sont codés ; ils sont présentés ici combinés avec la lettre gourmoukhî ka « ਕ » (U+0A15).
Pour la ponctuation viram en gourmoukhî, utiliser les signes génériques U+0964 et U+0965 unifiées avec la dévanagarî (les caractères U+0A64 et U+0A65 sont réservés et ne sont pas utilisés).
Note : le diacritique voyelle U+0A3F doit impérativement apparaître à gauche de la consonne de base, et non à sa droite (sinon cela causerait des problèmes sérieux d’interprétation du texte à la lecture). Les consonnes munies d’un diacritique noukta souscrit à droite (U+0A33), au centre (U+0A36 et U+0A5B) ou à gauche (U+0A59, U+0A5A et U+0A5E) et qui figurent dans le fichier CompositionExclusions.txt ne se recomposent pas au moment de la normalisation : la forme NFC est identique à la séquence décomposée : bien que le placement du glyphe pour le diacritique noukta souscrit varie selon la consonne de base auquel il se combine, il est recommandé de le coder avec U+0A3C séparément de la consonne de base dans les textes codés en Unicode ; toutefois certaines anciennes polices ou anciens moteurs de rendu s’appuyant sur d'anciens codages avant Unicode ou qui ne prennent pas en charge ce placement variable peuvent nécessiter un codage sous forme précombinée (cela ne doit toutefois pas changer l’équivalence canonique Unicode pour les moteurs de rendu ou d'analyse du texte conformes à Unicode, la non-recombinaison sous la forme NFC étant destinée à préserver la stabilité des anciens textes codés sous forme normalisée avant que leur stabilité ne soit devenue impérative et la compatibilité avec les anciens logiciels conformes à Unicode).
Table des caractères
en fr |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0A00 | ਕਁ | ਕਂ | ਕਃ | ਅ | ਆ | ਇ | ਈ | ਉ | ਊ | ਏ | ||||||
U+0A10 | ਐ | ਓ | ਔ | ਕ | ਖ | ਗ | ਘ | ਙ | ਚ | ਛ | ਜ | ਝ | ਞ | ਟ | ||
U+0A20 | ਠ | ਡ | ਢ | ਣ | ਤ | ਥ | ਦ | ਧ | ਨ | ਪ | ਫ | ਬ | ਭ | ਮ | ਯ | |
U+0A30 | ਰ | ਲ | ਲ਼ | ਵ | ਸ਼ | ਸ | ਹ | ਕ਼ | ਕਾ | ਕਿ | ||||||
U+0A40 | ਕੀ | ਕੁ | ਕੂ | ਕੇ | ਕੈ | ਕੋ | ਕੌ | ਕ੍ | ||||||||
U+0A50 | ਕੑ | ਖ਼ | ਗ਼ | ਜ਼ | ੜ | ਫ਼ | ||||||||||
U+0A60 | ੦ | ੧ | ੨ | ੩ | ੪ | ੫ | ੬ | ੭ | ੮ | ੯ | ||||||
U+0A70 | ਕੰ | ਕੱ | ੲ | ੳ | ੴ | ਕੵ | ੶ |
Version initiale Unicode 1.1
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0A00 | ਕਂ | ਅ | ਆ | ਇ | ਈ | ਉ | ਊ | ਏ | ||||||||
U+0A10 | ਐ | ਓ | ਔ | ਕ | ਖ | ਗ | ਘ | ਙ | ਚ | ਛ | ਜ | ਝ | ਞ | ਟ | ||
U+0A20 | ਠ | ਡ | ਢ | ਣ | ਤ | ਥ | ਦ | ਧ | ਨ | ਪ | ਫ | ਬ | ਭ | ਮ | ਯ | |
U+0A30 | ਰ | ਲ | ਲ਼ | ਵ | ਸ਼ | ਸ | ਹ | ਕ਼ | ਕਾ | ਕਿ | ||||||
U+0A40 | ਕੀ | ਕੁ | ਕੂ | ਕੇ | ਕੈ | ਕੋ | ਕੌ | ਕ੍ | ||||||||
U+0A50 | ਕੑ | ਖ਼ | ਗ਼ | ਜ਼ | ੜ | ਫ਼ | ||||||||||
U+0A60 | ੦ | ੧ | ੨ | ੩ | ੪ | ੫ | ੬ | ੭ | ੮ | ੯ | ||||||
U+0A70 | ਕੰ | ਕੱ | ੲ | ੳ | ੴ |
Compléments Unicode 4.0
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0A00 | ਕਁ | ਕਃ |
Compléments Unicode 5.1
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0A50 | ਕੑ | |||||||||||||||
U+0A70 | ਕੵ |
Compléments Unicode 11.0
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0A70 | ੶ |
Voir aussi
Liens externes
- (en) [PDF] Gurmukhi, tableau sur le site Unicode.
- (fr) [PDF] Gourmoukhî, tableau sur le site Unicode.
Articles connexes
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Singhalais
- Limbou
- Taï tham (ou lanna)
- Sylotî nâgrî
- Saurachtra
- Dévanâgarî étendu
- Meitei mayek – extensions
- Meitei mayek
- Brahmî
- Kaïthî
- Chakma
- Charada
- Singhalais – nombres archaïques
- Multanais (ou multanî)
- Tâkrî
- Dévanâgarî étendu – A
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Singhalais – nombres archaïques
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Adlam
- Alphanumériques délimités – supplément
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de ISO/CEI 10646-1 avec Unicode 2.0) :
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Cyrillique
- Arménien
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain (U+1000 à U+104F) obsolète car supprimé dans Unicode 2.0 (remplacé en Unicode 3.0 par le bloc « Birman ») – tous ces caractères tibétains ont plus tard été renormalisés différemment dans Unicode 2.0)
- Géorgien – assomtavrouli et mkhédrouli
- Hangûl (ou hangeul) – jamos
- Latin étendu – supplément
- Grec étendu
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Signes combinatoires pour des symboles
- Symboles de type lettre
- Formes numérales
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Pictogrammes de commande
- Reconnaissance optique de caractères (OCR)
- Symboles alphanumériques délimités
- Filets
- Pavés
- Formes géométriques
- Symboles divers
- Casseau
- Symboles et ponctuations unifiés CJC
- Hiragana
- Katakana
- Bopomofo
- Hangûl (ou hangeul) – jamos de compatibilité
- Kanboun
- Lettres et mois unifiés CJC délimités
- Compatibilité CJC
- Hangûl (ou hangeul) (U+3400 à U+4DFF) obsolète car supprimé dans Unicode 2.0 – tous ces caractères hangûl ont plus tard été renormalisés différemment dans Unicode 2.0) :
- Hangûl (ou hangeul) – syllabes coréennes (U+3400 à U+3D2D)
- Hangûl (ou hangeul) – supplément A (U+3D2E à U+44B7)
- Hangûl (ou hangeul) – supplément B (U+44B8 à U+4DFF)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Zone à usage privée : 1re partie, 2e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de présentation alphabétiques
- Formes de présentation arabes – A
- Demi-signes combinatoires
- Formes de compatibilité unifiés CJC
- Petites variantes de forme
- Formes de présentation arabes – B
- Formes de demi-chasse et de pleine chasse
- Caractères spéciaux
Nouveaux blocs ajoutés :
- Arabe – supplément
- Éthiopien – supplément
- Nouveau taï lü
- Bougui (ou bouguinais, bugi, lontara)
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Géorgien – supplément (nouskhouri)
- Éthiopien étendu
- Sinogrammes unifiés CJC – traits
- Lettres modificatives de ton
- Grec – nombres antiques
- Cunéiforme persépolitain (vieux perse)
- ...
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Diacritiques
- Grec et copte
- Cyrillique
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Tamoul
- Tibétain
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Latin étendu – extensions phonétiques
- Symboles monétaires
- Signes techniques divers
- Lettres et mois unifiés CJC délimités
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- ...
Nouveaux blocs ajoutés :
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Vaï
- Cyrillique étendu – A
- Cyrillique étendu – B
- Saurachtra
- Kayah-li
- Redjang (ou rejang)
- Cham
- Symboles antiques
- Disque de Phaïstos
- Lycien
- Carien
- Lydien
- Tuiles de mah-jong
- Dominos
Nouveaux caractères dans des blocs existants :
- Grec et copte
- Cyrillique
- Cyrillique – supplément
- Arabe
- Arabe – supplément
- Dévanâgarî
- Gourmoukhî
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Malayâlam
- Tibétain
- Birman
- Mongol (ou bitchig)
- Latin étendu – supplément phonétique
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Diacritiques pour symboles
- Symboles de type lettres
- Formes numérales
- Symboles divers
- Symboles mathématiques divers – A
- Symboles divers et flèches
- Latin étendu – C
- Ponctuation – supplément
- Bopomofo
- Sinogrammes unifiés CJC – traits
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Lettres modificatives de ton
- Latin étendu – D
- Demi-signes diacritiques
- Symboles musicaux byzantins
- Symboles musicaux occidentaux
Nouveaux blocs ajoutés :
- Géorgien étendu – mtavrouli
- Hanifi rohingya
- Masaram gondi
- Gunjala gondi
- Médéfaïdrine (ou médéfidrin)
- Numéraux siyaqs indiens
- ...
Nouveaux caractères dans des blocs existants :
- Arménien
- Hébreu
- N’ko
- Arabe étendu – A
- Bengalî
- Gourmoukhî
- Télougou
- Kannara (ou kannada)
- Mongol (ou bitchig)
- Symboles et flèches divers
- Ponctuation – supplément
- Bopomofo
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Latin étendu – D
- Dévanâgarî étendu
- Kaïthî (ou kayathi)
- Chakma (ou changma, ojhapath)
- Âhom
- ...
Notes et références
- DerivedAge.txt, base de données sur le site Unicode.
- Portail de l’informatique
- Portail de l’écriture