Internacionalización, localización, codificación, Islandia e tradución dun sitio web de fotos de gatos xaponeses

tradución de internacionalización

internacionalizaciónHai moita información cando se trata de internacionalización, localización e codificación dentro de aplicacións web. Tamén hai moitos malentendidos sobre o que cada un proporciona para unha aplicación web. Aquí está a miña idea ...

Cando un navegador web realiza unha conexión a un servidor web, pasa bastantes variables e realiza solicitudes adicionais, aquí tes un exemplo:

GET / HTTP / 1.1
Anfitrión: www.dknewmedia.com
Axente de usuario: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-EU; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Aceptar: HTTP Aceptar = texto / xml, aplicación / xml, aplicación / xhtml + xml, texto / html; q = 0.9, texto / sinxelo; q = 0.8, imaxe / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Codificación de aceptación: gzip, desinflar
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

internacionalización

A internacionalización é un composto de moitas cousas:

  1. Localización: A capacidade de identificar de que idioma e localización está visitando un visitante. Isto faise a través de solicitudes HTTP onde o visitante é identificado por unha configuración local. No meu caso, iso é en EU. "En" é inglés e "US" son os Estados Unidos. Esta é unha configuración dentro do meu sistema operativo.
  2. Fusos horarios: A posibilidade de axustarse aos fusos horarios. Isto normalmente conséguese configurando o servidor nun Greenwich Mean Time (GMT) e logo permitindo aos usuarios configurar o seu desprazamento local de GMT.
  3. Codificación de caracteres: Esta é a capacidade de amosar correctamente os conxuntos de caracteres de idioma. É diferente da localización xa que a localización pode indicarme o idioma e a rexión do ordenador desde o que realiza a solicitude, pero non me indicará de que idioma lector está a solicitar ... iso depende do lector!

Aviso na miña cabeceira HTTP cando o navegador realizou a solicitude, dixo ao servidor que solicitaba a miña configuración local (Accept-Language: en-us); con todo, tamén ten que indicarlle ao servidor que xogo de caracteres se solicita (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 e utf -8 son conxuntos de caracteres permitidos.

localización

Neste fantástico mundo confuso, a localización nunca máis dita a linguaxe. Aínda que estou en Estados Unidos, podo ler absolutamente un idioma diferente usando un conxunto de caracteres diferente ... iso é o que ocorre cando o uso Google hindi (Realmente non uso Google Hindi). A miña solicitude de configuración rexional e o conxunto de caracteres son idénticas a cando solicito o Google inglés páxina, pero en realidade estou alimentado cunha páxina que non sei ler porque non teño o conxunto de caracteres. Todo aparece ??????????? ... Non obstante, podo cargar ese conxunto de caracteres en Firefox (Firefox> Preferencias> Avanzado> Idiomas):

Idioma de carga de Firefox

Se cargo ese idioma, podo solicitar a páxina no seu conxunto de caracteres nativo e amosala no meu computador aínda que a miña configuración predeterminada sexa en EE. UU.

Entón ... se son estudante de hindi, estou inglés en Purdue e estou conectado a través de VPN ao servidor da escola, de vacacións en Australia ... hai 3 axustes diferentes que hai que aplicar á aplicación para ser realmente internacionalizados - e ningún dependen do outro.

A miña configuración local aparecería en EE. UU., Pero a miña zona horaria é Australia, pero o idioma que solicito do sitio web pode ser o hindi. Se programase a miña solicitude suposicións baseado na configuración local do meu ordenador, equivocaríame totalmente: alimentar á persoa inglesa nunha zona horaria do leste. O ideal sería programar a miña aplicación para ofrecer tanto axustes de idioma e zona horaria ... pero non os asumiría en función da configuración rexional.

Islandia: o último exemplo

Descoñecemos os desafíos multilingües e multi-locais nos Estados Unidos onde nos atopamos todo fala inglés [sarcasmo implícito]. Nalgúns países, como Islandia, aínda que o idioma nativo é o islandés, a incrible xente islandesa crece aprendendo 3 idiomas. Dado que Islandia é un país no medio de Europa e América do Norte, as súas empresas traballan en varios continentes, idiomas, dialectos de idiomas e varias zonas horarias dende o seu escritorio.

Moitos sitios web islandeses están construídos en inglés dos Estados Unidos, inglés do Reino Unido, islandés, español, español, francés e alemán. Imaxina o difícil que sería construír De Icelandair aplicacións de sitios web e sistemas de venda de entradas ... wow!

AVISO DE RESPONSABILIDADE: Tiven o absoluto pracer de traballar coa boa xente de Icelandair e pódoche dicir que son algúns dos profesionais máis talentosos e simpáticos cos que tiven o pracer de traballar. É simplemente un país incrible e xente. Vaia a visitar ... tome Icelandair e non deixe de visitar o Lagoa Azul!

Lingua versus Codificación

Incluso hai diferentes codificacións de caracteres nunha mesma lingua que non se xogan ben entre si. Exemplo: un correo electrónico xaponés escrito en Shift-JIS pode resultar ilegible no ordenador dunha persoa xaponesa coa localización configurada en ja-JP porque o seu servidor de correo só recoñece EUC-JP. O ideal sería que un cliente poida definir que codificación quere e que idioma, simplemente asegurándose de que a codificación e o idioma son compatibles co que o cliente solicita.

Se desexo ler xaponés, é posible que teña que seleccionar o xaponés como idioma e Shift-JIS para codificar para mostrar ese idioma correctamente. Aquí hai máis confusión para engadir á mestura ... algúns tipos de codificación admiten varios idiomas. UNICODE / UTF8 admite decenas. O reverso tamén é certo. Algúns idiomas pódense ler en moitos tipos de codificación. Se iso non ten sentido ... Pido desculpas, é un tema moi complexo.

Algún día creo (espero) que todo isto cambie. Creo que os deseñadores orixinais de códigos de localización esperaban que o combinado lingua-país fose todo o necesario ... pero volvémonos moito máis sofisticados. Lembre, gran parte diso desenvolveuse antes de que existise Internet. Coa chegada de GIS, quizais unha persoa poida seleccionar a súa codificación e o SIX manexará a información sobre a zona horaria e a configuración local.

internacionalización

Volver ao apoio á internacionalización. Se desexa proporcionar unha solicitude internacionalizada, ten que:

  1. Admite varios tipos de codificación, idiomas e ten ficheiros de tradución para mostrar esas traducións.
  2. Permitir ao cliente establecer o seu idioma, e quizais o seu tipo de codificación, se é necesario.
  3. Soporte os fusos horarios permitindo aos usuarios facer referencia á súa zona horaria en comparación con GMT.
  4. Utilice os códigos de localización con precaución ... NON representan con precisión o que realmente solicita o usuario nin o que pode ler.

Tradución

A tradución automática aínda está nos seus inicios. Hai unha serie de sitios web (e WordPress Complementos) que ofrecen tradución automática do seu sitio. Non te tentes facelo ... hai dúas razóns polas que:

  1. Se a tradución automática funciona, o usuario que estea a comprobar o seu sitio xa terá un tradutor co que traballar.
  2. A tradución automática é unha merda.

Non me creas? Aquí tes unha tradución ao xaponés:
Pegado de Ficheiro Masatsu - un tío cunha chea de fotos de gatos:

Entrada de blog xaponés

?
- 00:29:35 por masatsu

????????????????????????????
????????????????????????????

?????????? (?)?

?????????????????????????????????????????
?????????????????????????????????

???????????????????????????????????? (?)

??????????????????

??????????????
?
?

???????????????????????????????????????

???????????????????????????????

????????????????????????????????????????
???????????????????????????????????
?????????? Ag ??????????????

??????????????????????????????????????

Tradución automática:

?? Hann ?????
-00: 29: 35 por masatsu

O nome do santo do puño dun / o elefante que apareceu onte na "flota de puños da besta ?? garda forestal "" ?? Hann ???? ” cun / a actor de radio Yutaka Mizushima ....

? (?) que fai os chocos facilmente.

Porque ata o actor de radio do santo puño, mestre ????? dun / o gato son o marmelo chinés dun Nagai Ichiro = bola de dragón o bastón dun / o ?? O garda forestal semella que a xente que sabe con facilidade.

?????? (A suor) que esquecía completamente este ano "o segredo do nome da super flota", da práctica habitual todos os anos?,

?????? Se escribo tarde este ano,

??????? santuario ??? (como pode?)? corte de punta (?? non cortar) Fukami ?? (? ou observar capaz de?) an / the is it that does

?????? Con, convértese en "unha lata /? /?", Noutras palabras, "kung fu", cando se aliña e cambia a cabeza dun / o nome.

?????? Aínda que se di que aumenta outros dous supostamente, pode converterse en que tipo de nome.

Dise que a verdade é "idade" porque o símbolo do elemento prateado é Ag ?, aínda que o nome de "o ????" prata ”o Takaoka? técnico de ??????? estaba a pensar que o personaxe chamábase "?" usouse coa asociación dunha película de pantalla de prata, se a chama cun membro adicional.

?????? Non obstante, estou pensando egoístamente, que a miña teoría non ten ningunha relación que "?" inclúese nun carácter chinés.

Estou seguro de que invertir a polaridade desta tradución proporcionaría unha dicción igual de lexible en inglés. Comprendeu a entrada, non?

2 Comentarios

  1. 1

¿Que pensas?

Este sitio usa Akismet para reducir o spam. Aprende a procesar os teus datos de comentarios.