Locales
Locales et chaînes de locales
Présentation
Cette page explique la norme utilisée par General Translation pour représenter les locales et les langues, ainsi que la liste des locales actuellement prises en charge.
Chaînes de locale
General Translation utilise une variante de la norme BCP 47 d’étiquetage des langues pour représenter les locales et les langues. Les étiquettes BCP 47 constituent la recommandation BCP (Best Current Practices) sur Internet pour identifier les langues, à l’oral comme à l’écrit. Elles offrent un moyen uniforme de spécifier les langues, permettant aux applications d’adapter le contenu, le formatage et le comportement en fonction de la locale de l’utilisateur.
Les étiquettes de langue sont composées d’un ou plusieurs sous-tags séparés par le caractère "-". Les sous-tags incluent les composants suivants :
- Sous-tag de langue : représente la langue principale, p. ex., enpour l’anglais,espour l’espagnol.
- Sous-tag de région : spécifie un pays ou une région, p. ex., USpour les États‑Unis,FRpour la France.
- Sous-tag d’écriture (optionnel) : indique le système d’écriture, p. ex., Latnpour l’alphabet latin.
- Sous-tag de variante (optionnel) : identifie une variante spécifique d’une langue, p. ex., arevelapour l’arménien oriental.
Lorsque vous combinez ces tags, on parle d’une locale ou d’une étiquette de locale.
Balises courantes
En pratique, la plupart des balises de langue se composent de deux sous‑balises : une langue et une région. Voici quelques exemples courants :
| Balise de langue | Description | 
|---|---|
| en-US | Anglais tel qu’employé aux États‑Unis | 
| es-ES | Espagnol tel qu’employé en Espagne | 
| fr-CA | Français tel qu’employé au Canada | 
| zh-CN | Chinois simplifié (Chine) | 
| de-DE | Allemand tel qu’employé en Allemagne | 
Étiquettes étendues
Les étiquettes de langue peuvent inclure des sous-étiquettes supplémentaires pour plus de précision :
- Exemple : hy-Latn-IT-arevela- hy: arménien (langue)
- Latn: latin (écriture)
- IT: Italie (région)
- arevela: arménien oriental (variante)
 
Cette étiquette représente l’arménien oriental écrit en alphabet latin, tel qu’il est utilisé en Italie.
Exceptions à BCP 47 dans GT
🚧 Cette section est en cours de rédaction. 🚧
Langues/variantes prises en charge
Cette section répertorie toutes les locales actuellement prises en charge par General Translation.
Remarque sur les langues à faibles ressources
Notre système s’appuie sur certains des modèles LLM les plus avancés du marché pour fournir des traductions précises ; toutefois, ces modèles ont aussi leurs limites. Il se peut que certaines langues à faibles ressources ne soient pas prises en charge par le fournisseur de modèles que vous avez sélectionné ni par l’un des autres fournisseurs disponibles. Ces langues sont dites « langues à faibles ressources ».
Les langues à faibles ressources varient selon les modèles ; ainsi, si vous spécifiez un fournisseur de modèles préféré dans votre configuration, vous devriez vérifier la liste des langues prises en charge par ce fournisseur.
Liste officielle
- af🇿🇦afrikaans
- am🇪🇹amharique
- ar🇪🇬arabe
- ar-AE🇦🇪arabe (Émirats arabes unis)
- ar-EG🇪🇬arabe (Égypte)
- ar-LB🇱🇧arabe (Liban)
- ar-MA🇲🇦arabe (Maroc)
- ar-SA🇸🇦arabe (Arabie saoudite)
- bg🇧🇬bulgare
- bn🇧🇩bengali
- bs🇧🇦bosniaque
- ca🌍catalan
- cs🇨🇿tchèque
- cy🏴gallois
- da🇩🇰danois
- de🇩🇪allemand
- de-AT🇦🇹allemand autrichien
- de-CH🇨🇭allemand suisse
- de-DE🇩🇪allemand (Allemagne)
- el🇬🇷grec
- el-CY🇨🇾grec (Chypre)
- el-EL🌍grec (EL)
- en🇺🇸anglais
- en-AU🇦🇺anglais australien
- en-CA🇨🇦anglais canadien
- en-GB🇬🇧anglais britannique
- en-NZ🇳🇿anglais (Nouvelle-Zélande)
- en-US🇺🇸anglais américain
- es🇪🇸espagnol
- es-419🌍espagnol d’Amérique latine
- es-AR🇦🇷espagnol (Argentine)
- es-CL🇨🇱espagnol (Chili)
- es-CO🇨🇴espagnol (Colombie)
- es-ES🇪🇸espagnol d’Espagne
- es-MX🇲🇽espagnol du Mexique
- es-PE🇵🇪espagnol (Pérou)
- es-US🇺🇸espagnol (États-Unis)
- es-VE🇻🇪espagnol (Venezuela)
- et🇪🇪estonien
- fa🇮🇷persan
- fi🇫🇮finnois
- fil🇵🇭filipino
- fr🇫🇷français
- fr-BE🇧🇪français (Belgique)
- fr-CA🇨🇦français canadien
- fr-CH🇨🇭français suisse
- fr-CM🇨🇲français (Cameroun)
- fr-FR🇫🇷français (France)
- fr-SN🇸🇳français (Sénégal)
- gu🇮🇳goudjarati
- he🇮🇱hébreu
- hi🇮🇳hindi
- hr🇭🇷croate
- hu🇭🇺hongrois
- hy🇦🇲arménien
- id🇮🇩indonésien
- is🇮🇸islandais
- it🇮🇹italien
- it-CH🇨🇭italien (Suisse)
- it-IT🇮🇹italien (Italie)
- ja🇯🇵japonais
- ka🇬🇪géorgien
- kk🇰🇿kazakh
- kn🇮🇳kannada
- ko🇰🇷coréen
- la🇻🇦latin
- lt🇱🇹lituanien
- lv🇱🇻letton
- mk🇲🇰macédonien
- ml🇮🇳malayalam
- mn🇲🇳mongol
- mr🇮🇳marathi
- ms🇲🇾malais
- my🇲🇲birman
- nl🇳🇱néerlandais
- nl-BE🇧🇪flamand
- nl-NL🇳🇱néerlandais (Pays-Bas)
- no🇳🇴norvégien
- pa🇮🇳pendjabi
- pl🇵🇱polonais
- pt🇧🇷portugais
- pt-BR🇧🇷portugais brésilien
- pt-PT🇵🇹portugais européen
- qbr🌍qbr
- ro🇷🇴roumain
- ru🇷🇺russe
- sk🇸🇰slovaque
- sl🇸🇮slovène
- so🇸🇴somali
- sq🇦🇱albanais
- sr🇷🇸serbe
- sv🇸🇪suédois
- sw🇹🇿swahili
- sw-KE🇰🇪swahili (Kenya)
- sw-TZ🇹🇿swahili (Tanzanie)
- ta🇮🇳tamoul
- te🇮🇳télougou
- th🇹🇭thaï
- tl🇵🇭filipino
- tr🇹🇷turc
- uk🇺🇦ukrainien
- ur🇵🇰ourdou
- vi🇻🇳vietnamien
- zh🇨🇳chinois
- zh-CN🇨🇳chinois (Chine)
- zh-HK🇭🇰chinois (R.A.S. chinoise de Hong Kong)
- zh-Hans🇨🇳chinois simplifié
- zh-Hant🇹🇼chinois traditionnel
- zh-SG🇸🇬chinois (Singapour)
- zh-TW🇹🇼chinois (Taïwan)
Remarques
- General Translation utilise des balises de locale (locales) pour identifier les langues et les régions en interne.
Prochaines étapes
- Consultez notre liste des locales prises en charge pour connaître les balises de langue disponibles dans General Translation.
- Référez-vous au registre officiel des étiquettes de langue de l’IETF ainsi qu’à la norme d’étiquetage de langue BCP 47 pour plus d’informations.
Que pensez-vous de ce guide ?

