ISO 639

De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a buscar

ISO 639 es un conjunto de normas de la Organización Internacional de Normalización que se ocupa de la representación de nombres para idiomas y grupos de idiomas .

También era el nombre de la norma original, aprobada en 1967 (como ISO 639/R ) [1] y retirada en 2002. [2] El conjunto ISO 639 consta de cinco partes.

Uso de códigos ISO 639

Los códigos de idioma definidos en las diversas secciones de ISO 639 se utilizan con fines bibliográficos y, en entornos informáticos y de Internet, como elemento clave de los datos locales . Los códigos también encuentran uso en varias aplicaciones, como las URL de Wikipedia para sus ediciones en diferentes idiomas.

Partes actuales e históricas del estándar

Estándar Nombre ( Códigos para la representación de nombres de idiomas – ... ) Autoridad de Registro Primera edición Actual No. en la lista (al 18 de febrero de 2021 )
ISO 639-1 Parte 1: código alfa-2 Infotérmino 1967 (como ISO 639) 2002 184
ISO 639-2 Parte 2: código Alpha-3 Biblioteca del Congreso 1998 1998 482 + 20 B-solo + 4 especiales + 520 para uso local [3] [4]
ISO 639-3 Parte 3: código Alpha-3 para una cobertura completa de idiomas SIL Internacional 2007 2007 7.893 + 4 especiales + 520 para uso local [5]
ISO 639-4 Parte 4: Pautas de implementación y principios generales para la codificación de idiomas ISO/TC 37 / SC 2 2010-07-16 2010-07-16 (no es una lista)
ISO 639-5 Parte 5: código alfa-3 para familias y grupos de idiomas Biblioteca del Congreso 2008-05-15 2013-02-11 [6] 115 (incluyendo 36 restantes + 29 grupos regulares de ISO 632-2) [7]
ISO 639-6 Parte 6: Representación alfa-4 para una cobertura completa de las variantes lingüísticas (retirada) Geolenguaje 2009-11-17 retirado 21,000+

Cada parte del estándar es mantenida por una agencia de mantenimiento, que agrega códigos y cambia el estado de los códigos cuando es necesario. ISO 639-6 se retiró en 2014. [8]

Características de los códigos individuales

Alcances:

  • Idiomas individuales
  • Macrolenguajes (Parte 3)
  • Colecciones de idiomas (Partes 1, 2, 5). La Parte 1 contiene solo una colección ( bh), algunas colecciones ya estaban en la Parte 2 y otras se agregaron solo en la Parte 5:
    • Grupos restantes: 36 colecciones tanto en la Parte 2 como en la 5 son de este tipo (incluida una que también se codificó en la Parte 1): para compatibilidad con la Parte 2 cuando la Parte 5 aún no se había publicado, los grupos restantes no contienen ningún idioma ni colección. que ya estaba codificado en la Parte 2 (sin embargo, las nuevas aplicaciones compatibles con la Parte 5 pueden tratar estos grupos de manera inclusiva, siempre que respeten la jerarquía de contención publicada en la Parte 5 y usen la colección más específica al agrupar idiomas);
    • Grupos regulares: 29 colecciones en las Partes 2 y 5 son de este tipo; por compatibilidad con la Parte 2, no pueden contener otros grupos;
    • Familias: 50 colecciones nuevas codificadas solo en la Parte 5 (incluida una que contiene un grupo regular ya codificado en la Parte 2); para compatibilidad con la Parte 2, pueden contener otras colecciones, excepto grupos restantes.
  • Dialectos : estaban destinados a ser cubiertos por la Parte 6 (propuesto pero ahora retirado).
  • Situaciones especiales (Partes 2, 3).
  • Reservado para uso local (Partes 2, 3). También se usa a veces en aplicaciones que necesitan un código alfa-2 como los códigos estándar en las Partes 1 y 2 (donde el código especial misno es adecuado), o un código alfa-3 para colecciones como los códigos estándar en la Parte 5.

Tipos (para idiomas individuales):

  • Idiomas vivos (Partes 2, 3) (todos los macrolenguajes son idiomas vivos) [9]
  • Idiomas extintos (Partes 2, 3) (608, [10] 5 de ellos están en la Parte 2: chb, chg, cop, lui, sam; ninguno está en la Parte 1)
  • Idiomas antiguos (Partes 1, 2, 3) (124, [11] 19 de ellos están en la Parte 2; y 5 de ellos, a saber ave, chu, lat, pliy san, también tienen un código en la Parte 1: ae, cu, la, pi, sa)
  • Idiomas históricos (Partes 2, 3) (83, [12] 16 de ellos están en la Parte 2; ninguno está en la Parte 1)
  • Lenguajes construidos (Partes 1, 2, 3) (23, [13] 9 de ellos en la Parte 2: afh, epo, ido, ile, ina, jbo, tlh, vol, zbl; 5 de ellos en la Parte 1: eo, ia, ie, io, vo)

Lenguajes individuales y macrolenguajes con dos códigos alfa-3 distintos en la Parte 2:

  • Bibliográficos (algunos de ellos quedaron en desuso, ninguno se definió en la Parte 3): estos son códigos heredados (basados ​​en nombres de idiomas en inglés).
  • Terminológicos (también definidos en la Parte 3): estos son los códigos preferidos (basados ​​en nombres de idiomas nativos, romanizados si es necesario).
  • Todos los demás (incluidas las colecciones de idiomas y los códigos especiales/reservados) solo tienen un único código alfa-3 para ambos usos.

Relaciones entre las partes

Las diferentes partes de ISO 639 están diseñadas para trabajar juntas, de tal manera que ningún código signifique una cosa en una parte y otra cosa en otra. Sin embargo, no todos los idiomas están en todas las partes, y hay una variedad de formas diferentes en que los idiomas específicos y otros elementos se tratan en las diferentes partes. Esto depende, por ejemplo, de si un idioma figura en la lista de las Partes 1 o 2, si tiene códigos B/T separados en la Parte 2 o si está clasificado como un macrolenguaje en la Parte 3, etc.

Estos diversos tratamientos se detallan en el siguiente cuadro. En cada grupo de filas (una para cada alcance de ISO 639-3), las últimas cuatro columnas contienen códigos para un lenguaje representativo que ejemplifica un tipo específico de relación entre las partes de ISO 639, la segunda columna proporciona una explicación de la relación , y la primera columna indica el número de elementos que tienen ese tipo de relación. Por ejemplo, hay cuatro elementos que tienen un código en la Parte 1, tienen un código B/T y se clasifican como macrolenguajes en la Parte 3. Un representante de estos cuatro elementos es "persa " fa// per.fas

Alcance Numero de casos Descripción Ejemplo de códigos coincidentes
ISO 639-1 ISO 639-2 ISO 639-3 ISO 639-5
Idiomas individuales
("I")
128 Idiomas individuales que no forman parte de un macrolenguaje, con código en cada Parte 1, 2 y 3 (solo un código en la Parte 2).
Hay 184 códigos asignados en la Parte 1 para idiomas individuales, macrolenguajes o grupos; reste los contados en las filas de abajo, esto deja: 184 - (2 "I (antiguo B/T)") ‒ (3+11 "I") ‒ (3+2 "I (B/T)") ‒ (28 +4+1+1 "M") ‒ (1 "C") = 128 códigos.
es ing
2 Idiomas individuales, con código en cada Parte 1, 2 y 3, que tenían códigos B / T separados en la Parte 2, pero cuyos códigos B se retiraron (desde el 28 de junio de 2008) manteniendo sus códigos T para todos los usos. Estos son: hr/( scr)/ hrv, y sr/( ser)/ srp.
Ambos son parte del mismo macrolenguaje hbsagregado en la Parte 3 para incluir también otros lenguajes individuales recién codificados, pero su código shen la Parte 1 también fue retirado y no tenía código definido en la Parte 2.
hora (scr)/hrv (B/T) hrv
3 Idiomas individuales que pertenecen a un macrolenguaje en la Parte 3, con un solo código en la Parte 2 y que también tienen un código en la Parte 1. Estos son: bs/ bos(parte del macrolenguaje hbs), nb/ noby nn/ non(ambos parte del macrolenguaje no/ nor). nótese bien cabeza
11 Idiomas individuales con códigos B/T separados en la Parte 2, pero no en ninguno de los casos especiales en las líneas siguientes.
Hay 20 pares de códigos B/T separados asignados en la Parte 2 a idiomas individuales o macrolenguajes; reste los casos especiales a continuación, esto deja: 20 ‒ (3+2 "M") ‒ (4 "C") = 11 pares de códigos.
Delaware ger/deu (B/T) deu
3 Idiomas individuales con códigos B/T separados en la Parte 2, pero las letras del código de la Parte 1 no son las dos primeras letras del código T de la Parte 2. Estos son: cs/ cze/ ces, mi/ mao/ mri​​, y sk/ slo/ slk. cs checa/ces (B/T) ces
3 Lenguajes individuales en las Partes 2 y 3 (no pertenecen a un macrolenguaje), pero que fueron cubiertos en la Parte 1 por un código cuyo equivalente en la parte 2 es un colectivo. Estos son: bho, maiy mag. (bh) bho
pocos Cualquier otro idioma individual en las Partes 2 y 3, sin código en la Parte 1. rápido
1 Idiomas individuales agregados en la Parte 3 sin códigos en las Partes 1 y 2, pero que estaban cubiertos por un macrolenguaje en las Partes 2 y 3 también codificados en la Parte 1. (Arkansas) (ara) árbitro
1 Un idioma individual en la Parte 3, sin código en la Parte 2, pero que estaba cubierto en la Parte 1 por un código cuyo equivalente en la Parte 2 es un grupo colectivo (ver la entrada a continuación para este grupo). (bh) (bih) sck
> 7,000 Cualquier otro idioma individual en la Parte 3 sin ningún código en las Partes 1 y 2 (posiblemente cubierto en la Parte 2 por un código colectivo, como nic"Niger-Kodofanian (Otro)", que es un grupo restante). (nic) aaa
Macrolenguajes
("M")
28 Macrolenguajes en la Parte 3 que también tienen códigos en las Partes 1 y 2.
Hay 62 códigos asignados en la Parte 3 para macrolenguajes; reste aquellos con casos especiales a continuación, esto deja: 62 ‒ (4 "B/T") ‒ 1 ‒ (25+1+3 "no en la Parte 1") = 28 códigos.
Arkansas ara
4 Macrolenguajes en la Parte 3 con códigos B/T separados en la Parte 2. Estos son: fa/ per/ fas, ms/ may/ msa​​, sq/ alb/ sqi​​, y zh/ chi/ zho. fa por/fa (B/T) FAS
1 Macrolenguaje en la Parte 3 que contiene idiomas que tienen códigos en la Parte 1. Solo: no/ nor(que contiene: nb/ nob, y nn/ non). no ni
25 Macrolenguajes en las Partes 2 y 3, pero sin código en la Parte 1. bola
1 Macrolenguaje en la Parte 3, sin código en la Parte 2, y cuyo código en la Parte 1 está en desuso. (sh) hbs
3 Macrolenguajes en la Parte 3, sin códigos en la Parte 1 o 2. Estos son: bnc, klny luy. bnc
Familias y grupos (colectivo)
("C")
1 Bihari está marcado como colectivo y tiene un código ISO 639-2 y es el único grupo de idiomas que también tiene un código ISO 639-1 (donde todos los demás códigos son idiomas individuales o reservados). La razón es que tres idiomas bihari individuales (que son lo suficientemente diferentes como para que no puedan formar el mismo macrolenguaje para ISO 639-3) recibieron códigos distintivos ISO 639-2 ( bho, mai, mag), lo que convirtió a Bihari en un grupo restante a los efectos de ISO 639-2 (que contiene los idiomas del grupo excepto estos tres). bh bih bih
35 Grupos restantes en la Parte 2, es decir, el mismo código pero se incluyen diferentes idiomas. En la Parte 2, afase refiere a un idioma afroasiático que no tiene un identificador de idioma individual en la Parte 2 y que no se incluye en los tres grupos restantes: ber"Bereber (Otro)", cus"Cushitic (Otro)" o sem"Semítico (Otro)", todos los cuales son grupos lingüísticos afroasiáticos. afa afa
29 Grupo regular en la Parte 2, igual que la familia lingüística en la Parte 5, sin código en la Parte 1. Entre ellos, el grupo regular ypken la Parte 2 fue el único que se codificó en la Parte 5 como parte de otro nuevo grupo regular en la Parte 5 que no fue codificado en la Parte 2 (ver más abajo). aus aus
50 Grupos regulares agregados solo en la Parte 5, no codificados previamente en las Partes 1, 2 y 3. La mayoría de estos nuevos grupos regulares pueden haber sido representados previamente por otro código colectivo en la Parte 2 como parte de un grupo restante (por ejemplo, el grupo restante inepara el nuevo grupo regular sqj), excepto 7 de ellos: aav, esx, euq, hmx, jpx, urj, así como syd(parte del nuevo grupo regular urj). Sin embargo, el grupo regular ypk(parte del nuevo grupo regular esx) ya estaba codificado en la Parte 2. Consulte la jerarquía de los grupos de idiomas en la Lista de códigos ISO 639-5 . sqj
Códigos especiales
("S")
1 Disponible para usarse en un contexto monolingüe donde se requiere un código de idioma individual, pero el idioma en sí no tiene un código estándar. Una alternativa más precisa podría ser usar un grupo restante de ISO 639-2 o un código de familia de idiomas de ISO 639-5, a menos que se deban excluir otros idiomas en dicho grupo (ya que están separados con su propio código) o ningún código colectivo estándar es adecuado. Algunas aplicaciones pueden preferir usar un código más específico dentro de los reservados para uso local. mal
1 Contenido multilingüe (incluye al menos dos idiomas en partes separables). Para ser utilizado cuando se espera un único código de idioma para todo el contenido. Los lenguajes individuales o macrolenguajes para cada parte del contenido posiblemente aún no estén codificados (y representable como miso más precisamente con un código colectivo). Mul
1 Indeterminado (el contenido incluye cero, uno o varios idiomas, en combinación arbitraria). und
1 No hay información lingüística en absoluto (agregado 2006-01-11). El contenido (por ejemplo, gráficos, fotos o registros de audio/video que no incluyan texto en un idioma humano, o metadatos técnicos y la mayoría del código fuente de programación) se puede usar tal cual con cualquier idioma y no debe traducirse (excepto por su descripción posiblemente asociada en contenidos, o para fragmentos no esenciales del contenido). zxx
Reservado para uso local
("R")
20 Códigos Alpha2 en la Parte 1, en el rango qa.. qt. Estos códigos no se recomiendan, pero se dejan sin asignar en la Parte 1. qa
520 Códigos Alpha3 en las Partes 2 y 3, en el rango qaa... qtz. Estos códigos también se pueden usar para idiomas colectivos (u otros casos especiales), pero no se les asignarán familias ni grupos de idiomas estándar en la Parte 5. qaa

Estas diferencias se deben a los siguientes factores.

En ISO 639-2 , se asignaron dos códigos distintos a 22 idiomas individuales, a saber, un código bibliográfico y uno terminológico (códigos B/T). [14] Los códigos B se incluyeron por razones históricas porque los sistemas bibliográficos ampliamente utilizados anteriormente usaban códigos de idioma basados ​​en el nombre en inglés del idioma. Por el contrario, los códigos ISO 639-1 se basaron en el nombre nativo del idioma, y ​​también hubo un fuerte deseo de tener códigos 639-2 (códigos T) para estos idiomas que fueran similares al código de 2 caracteres correspondiente en Norma ISO 639-1.

  • Por ejemplo, el idioma alemán (Parte 1:) detiene dos códigos en la Parte 2: ger(código B) y deu(código T), mientras que solo hay un código en la Parte 2 eng, para el idioma inglés .
  • Se retiraron 2 códigos B anteriores, quedando hoy solo 20 pares de códigos B/T.

Los idiomas individuales en la Parte 2 siempre tienen un código en la Parte 3 (solo se reutiliza el código de terminología de la Parte 2), pero pueden o no tener un código en la Parte 1, como se ilustra en los siguientes ejemplos:

  • La Parte 3 engcorresponde a la Parte 2 engy la Parte 1en
  • La Parte 3 astcorresponde a la Parte 2 astpero carece de un código en la Parte 1.

Algunos códigos (62) en la Parte 3 son macrolenguajes. Estos son grupos que contienen múltiples idiomas individuales que tienen un buen entendimiento mutuo y comúnmente se mezclan o confunden. Algunos macrolenguajes desarrollaron una forma estándar predeterminada en uno de sus idiomas individuales (p. ej., el mandarín está implícito de forma predeterminada para el macrolenguaje chino, otros idiomas individuales aún pueden distinguirse si es necesario, pero el código específico cmnpara mandarín rara vez se usa).

  • 1 macrolenguaje tiene un código de la Parte 2 y un código de la Parte 1, mientras que sus idiomas individuales miembros también tienen códigos en la Parte 1 y la Parte 2: nor/ nocontiene non/ nn, nob/ nb; o
  • 4 macrolenguajes tienen dos códigos de la Parte 2 (B/T) y un código de la Parte 1: per/ fas/ fa, may/ msa/ ms​​, alb/ sqi/ sq​​y chi/ zho/ zh;
  • 28 macrolenguajes tienen un código de la Parte 2 pero ningún código de la Parte 1;
  • Otros 29 macrolenguajes solo tienen códigos en la Parte 3.

Los códigos colectivos en la Parte 2 tienen un código en la Parte 5: por ejemplo aus, en las Partes 2 y 5, que significa idiomas australianos .

  • Un código colectivo en la Parte 2 también tiene un código en la Parte 1: bih/ bh.
  • Se agregaron algunos códigos en la Parte 5 pero no tenían código en la Parte 2: por ejemplosqj

Las partes 2 y 3 también tienen un rango reservado y cuatro códigos especiales:

  • Los códigos qaahasta qtzestán reservados para uso local.
  • Hay cuatro códigos especiales: mispara idiomas que aún no tienen código asignado, mulpara "múltiples idiomas", undpara "indefinido" y zxxpara "sin contenido lingüístico, no aplicable".

Espacio de código

Espacio de código alfa-2

Los códigos "Alpha-2" (para códigos compuestos por 2 letras del alfabeto latino básico ISO ) se utilizan en ISO 639-1 . Cuando se deseaban códigos para una gama más amplia de idiomas, más de 2 combinaciones de letras podían cubrir (un máximo de 26 2 = 676), se desarrolló ISO 639-2 usando códigos Alpha-3. (Sin embargo, este último se publicó formalmente primero. [15] [16] )

Espacio de código alfa-3

Los códigos "Alpha-3" (para códigos compuestos por 3 letras del alfabeto latino básico ISO ) se utilizan en ISO 639-2 , ISO 639-3 e ISO 639-5 . El número de lenguas y grupos de lenguas que se pueden representar así es 26 3 = 17.576.

El uso común de códigos Alpha-3 por tres partes de ISO 639 requiere cierta coordinación dentro de un sistema más grande.

La Parte 2 define cuatro códigos especiales mis, mul, und, zxx, un rango reservado qaa-qtz(20 × 26 = 520 códigos) y tiene 20 entradas dobles (los códigos B/T), más 2 entradas con códigos B en desuso. Esto suma 520 + 22 + 4 = 546 códigos que no se pueden usar en la parte 3 para representar idiomas o en la parte 5 para representar familias o grupos de idiomas. El resto es 17 576 – 546 = 17 030.

Hay alrededor de seis o siete mil idiomas en la Tierra hoy. [17] Entonces, esos 17,030 códigos son adecuados para asignar un código único a cada idioma, aunque algunos idiomas pueden terminar con códigos arbitrarios que no se parecen en nada a los nombres tradicionales de ese idioma.

Espacio de código Alpha-4 (retirado)

Se propuso el uso de códigos "Alfa-4" (para códigos compuestos por 4 letras del alfabeto latino básico ISO ) en ISO 639-6 , que ha sido retirado. El límite superior para el número de idiomas y dialectos que se pueden representar es 26 4 = 456.976.

Véase también

Notas y referencias

  1. ^ "ISO/R 639: 1967" . iso.org. 1988-03-01 . Consultado el 5 de agosto de 2012 .
  2. ^ "ISO 639: 1988" . iso.org . Consultado el 5 de agosto de 2012 .
  3. ^ "Códigos ordenados alfabéticamente por código alfa-3/ISO 639-2" . Biblioteca del Congreso. 2013-07-25 . Consultado el 10-01-2019 .
  4. ^ "Códigos ISO-639-2" . Biblioteca del Congreso . Consultado el 10-01-2019 .
  5. ^ "Tablas de códigos ISO 639" . Sil.org . Consultado el 07-04-2021 .
  6. ^ "Aviso de cambio de ISO 639-5" . Oficina de Desarrollo de Redes y Estándares MARC . Biblioteca del Congreso . Consultado el 12 de diciembre de 2018 .
  7. ^ "Códigos ISO 639-5 ordenados por identificador" . Oficina de Desarrollo de Redes y Estándares MARC . Biblioteca del Congreso . Consultado el 12 de diciembre de 2018 .
  8. ^ ISO 639-6:2009 , ISO .
  9. ^ "Tablas de códigos ISO 639: macrolenguajes" . Sil.org . Consultado el 5 de agosto de 2012 .
  10. ^ "Tablas de códigos ISO 639: extintas" . Sil.org . Consultado el 5 de agosto de 2012 .
  11. ^ "Tablas de códigos ISO 639: antiguas" . Sil.org . Consultado el 10-01-2019 .
  12. ^ "Tablas de códigos ISO 639: histórico" . Sil.org . Consultado el 5 de agosto de 2012 .
  13. ^ "Tablas de códigos ISO 639: construidas" . Sil.org . Consultado el 07-02-2022 .
  14. ^ "ISO 639-2 - Preguntas frecuentes" . loc.gov. 2014-05-05 . Consultado el 12 de diciembre de 2014 .
  15. ^ "Códigos para la representación de nombres de idiomas - Parte 2: código Alpha-3" . Organización Internacional de Normalización . ISO . Consultado el 10 de enero de 2019 . Fecha de publicación: 1998-10
  16. ^ "Códigos para la representación de nombres de idiomas - Parte 1: código Alpha-2" . Organización Internacional de Normalización . ISO . Consultado el 15 de febrero de 2018 . Fecha de publicación: 2002-07
  17. ^ "Resúmenes estadísticos" . Etnólogo . Consultado el 5 de agosto de 2012 .

Enlaces externos