Site Map    |    Site Index    | 
Quick Links:
Search:

Internet Corporation for Assigned Names and Numbers

^ Home

^ Current Topics

> Internationalized Domain Names

Nomes de Domínio Internacionalizados - Glossário

Em uma tentativa de garantir que as discussões em relação aos IDNs (Internationalized Domain Names, Nomes de Domínio Internacionalizados) sejam utilizadas de forma consistente, a ICANN criou um glossário sobre IDN. Os termos do glossário podem ser utilizados livremente. Ao longo do tempo, pretendemos ampliar o glossário. Se você tiver sugestões de acréscimos e/ou alterações no glossário, envie-as para idn-glossary@icann.org. Os comentários serão divulgados publicamente no fórum de discussão em http://forum.icann.org/lists/idn-glossary/.

Historicamente, os nomes de domínios na Internet eram restritos ao uso de um conjunto limitado de caracteres ASCII (ou seja, a-z, 0-9 e "-"). No entanto, com o crescente uso da Internet em todas as regiões e por diversos grupos lingüísticos do mundo, a demanda por nomes de domínios multilíngües tornou-se mais intensa. Vários acrônimos são amplamente utilizados nas comunicações sobre a internacionalização do espaço de nomes de domínios. São apresentadas a seguir explicações desses acrônimos, a fim de facilitar a compreensão desse assunto.

ACE (ASCII Compatible Encoding, Codificação Compatível com ASCII)

O ACE é um sistema para codificação de Unicode, de forma que cada caractere possa ser transmitido com o uso de apenas um conjunto limitado de caracteres ASCII (ou seja, a-z, 0-9 e "-"). Ele é utilizado devido à possibilidade de que os aplicativos que usam o protocolo DNS não possam lidar de forma confiável com outros valores.

ASCII (American Standard Code for Information Interchange, Código Padrão Americano para a Troca de Informações)

O ASCII é um código numérico comum para os computadores e outros dispositivos que funcionam com texto. Os computadores podem compreender somente números; portanto, um código ASCII é a representação numérica de um caractere, como "a" ou "@". Quando mencionado em relação aos nomes de domínios ou cadeia de caracteres, o ASCII refere-se ao fato de que, antes da internacionalização, somente as letras a-z, os dígitos 0-9 e o hífen "-" podiam ser utilizados em nomes de domínios.

Caractere

Para fins de discussões sobre os IDNs, um "caractere" pode ser melhor compreendido como a unidade gráfica básica de um sistema escrito, que é um script mais um conjunto de regras, que determinam como ele será utilizado para representar um idioma específico. No entanto, os rótulos de domínios não transmitem quaisquer informações intrínsecas sobre o idioma com o qual eles pretendem estar associados, embora eles revelem o script no qual estão baseados. Essa dependência de idioma não pode, infelizmente, ser eliminada pela restrição da definição para script, pois em vários casos (consulte os exemplos a seguir) os idiomas que compartilham o mesmo script diferem no que diz respeito aos seus elementos individuais. Dessa forma, o termo caractere não pode ser definido independentemente do contexto no qual é utilizado.

Nos sistemas escritos com base na fonética, um caractere é geralmente uma letra ou representa uma sílaba, e nos sistemas ideográficos (ou alternativamente, sistemas pictográficos ou logográficos), um caractere pode representar um conceito ou uma palavra.

Os exemplos a seguir têm o objetivo de ilustrar que a definição de um caractere é de, pelo menos, duas vias, uma sendo a unidade da base lingüística e a outra está associada ao ponto do código.

Rótulo U 酒 : Jiu; a palavra chinesa para "bebida alcoólica"; o ponto de código Unicode é U+9152 (também referido como: IDEOGRAMA UNIFICADO CJK-9152); o rótulo A é um xn—jj4

Rótulo U 北京 : a palavra chinesa para "Pequim", os pontos de código Unicode são U+5300 U+4EAC; o rótulo A é xn—1lq90i

Rótulo U 東京 : a palavra japonesa para "Tóquio", os pontos de código Unicode são U+6771 U+4EAC; o rótulo A é xn—1lqs71d

Rótulo U ایكوم; acrônimo Farsi para ICOM, os pontos de código Unicode são U+0627 U+06CC U+0643 U+0648 U+0645; o rótulo A é xn—mgb0dgl27d.

Consórcio Unicode

Uma organização sem fins lucrativos, fundada para desenvolver, ampliar e promover o uso do padrão Unicode. Para obter mais informações, acesse http://www.unicode.org.

DNS (Domain Name System, Sistema de Nomes de Domínio)

O DNS facilita o uso da Internet ao permitir que seja usada uma cadeia de caracteres familiar de letras (o "nome de domínio") em vez do misterioso endereço IP. Assim, em vez de digitar 207.151.159.3, você pode digitar www.internic.net.

IDNA (Internationalized Domain Names in Application, Nomes de Domínio Internacionalizados em Aplicações)

O IDNA é um protocolo definido no RFC 3490 pela Força-Tarefa de Engenharia de Internet (Internet Engineering Task Force) (http://www.ietf.org) que possibilita que aplicativos lidem com nomes de domínios com caracteres que não sejam ASCII. O IDNA converte as cadeias de caracteres de nomes de domínios com caracteres que não sejam ASCII em rótulos de nomes de domínios ASCII, que os aplicativos que usam o DNS possam compreender com precisão. Nem todos os caracteres utilizados nos idiomas mundiais estarão disponíveis para uso nos nomes domínios. Assim, o IDNA não pode converter todos esses caracteres em rótulos ASCII.

IDN (Internationalized Domain Name, Nome de Domínio Internacionalizado)

Os IDNs são nomes de domínios representados pelos caracteres de idiomas locais. Tais nomes de domínios podem ter caracteres com marcas diacríticas, conforme necessário por muitos idiomas europeus, ou caracteres de scripts não latinos (por exemplo, arábico ou chinês).

Os IDNs exibem o rótulo do nome de domínio como ele é exibido e visualizado pelo usuário final, diferentemente do transmitido no DNS. Para evitar confusão, a seguinte terminologia é utilizada:

O rótulo A é o que deve ser transmitido pelo protocolo DNS e é compatível com a forma do sistema ASCII (ACE) de uma cadeia de caracteres IDNA; por exemplo, "xn--11b5bs1di". O rótulo U é o que deve ser exibido ao usuário e é a representação do IDN (Internationalized Domain Name, Nome de Domínio Internacionalizado) em Unicode; por exemplo, " परीका " (versão de "teste" em hindu, cadeia de caracteres Devanagari ). Por fim, o rótulo LDH refere-se estritamente a um rótulo totalmente ASCII, que está de acordo com as convenções de "nome de host" (LDH) e que não é um IDN; por exemplo, "icann" no nome de domínio "icann.org".

(As definições de rótulos anteriores foram extraídas de: http://www.ietf.org/internet-drafts/draft-klensin-idnabis-issues-01.txt)

LDH (Letter, Digit, Hyphen) (Letra, Dígito, Hífen)

A convenção do nome de host definida no RFC 952 (posteriormente modificada pelo RFC 1123) foi utilizada pelos Registros de domínio de nível superior antes da internacionalização. Isso significa que os nomes de domínios poderiam conter praticamente as letras a-z, os dígitos 0-9 e o hífen "-". O termo "pontos de código LDH" refere-se a esse subconjunto. Com a introdução de IDNs, essa regra não é mais relevante para todos os nomes de domínios, embora com o uso de IDNA, o que aparece no DNS permanecerá LDH.

Linguagens | Scripts | Alfabetos

Linguagens são utilizadas pelas comunidades de discussões. Os scripts são utilizados para escrever as informações em várias linguagens; isso é feito com o uso dos alfabetos correspondentes ou sistemas de escrita alternativos.

Punycode

O Punycode é o algoritmo de codificação compatível com LDH descrito no padrão de Internet [RFC3492] e é o utilizado atualmente. Esse é o método utilizado para codificar IDNs em seqüências de caracteres ASCII LDH ASCII, para que os aplicativos usando o Sistema DNS (Domain Name System) compreendam e gerenciem os nomes. A intenção é que os registrantes de nomes de domínios e os usuários nunca vejam essa forma codificada de um nome de domínio. O objetivo exclusivo é que o DNS possa solucionar, por exemplo, um URL que contém caracteres locais. Para obter exemplos, consulte o rótulo A em "IDN".

O prefixo em um rótulo A de Punycode é sempre "xn--". Dessa forma, o prefixo deve ser reservado pelos Registros de domínio de nível superior, a fim de evitar confusão quando e se os registros de IDNs forem introduzidos sob o respectivo domínio de nível superior.

Rótulo

Um rótulo é uma parte individual de um nome de domínio. Os rótulos são geralmente exibidos separados por pontos; por exemplo, o nome de domínio "exemplo.com" é composto de dois rótulos: "exemplo" e "com".

SLDs de IDN ou 2LDs de IDN

Geralmente, uma referência a nomes de domínios com caracteres locais de nível secundário, enquanto o nível superior permanece em caracteres somente ASCII. Por exemplo: [παράδειγμα .test] ("exemplo.teste" em grego).

TLDs de IDN

Geralmente, a referência abreviada para os domínios de nível superior internacionalizados, permitindo que o nome completo de domínio seja representado por caracteres locais. Por exemplo: [실례.테스트] ("exemplo.teste" em Hangul).

Unicode

O Unicode é um esquema único de codificação comumente utilizado, que fornece um número exclusivo para cada caractere em uma ampla variedade de linguagens e scripts. O padrão Unicode contém tabelas que relacionam os "pontos de código" (números exclusivos) para cada caractere local identificado. Essas tabelas continuam sendo ampliadas à medida que os caracteres são digitalizados.

No Unicode, os caracteres recebem códigos que definem com exclusividade cada caractere em muitos dos scripts em todo o mundo. Esses "pontos de código" são números exclusivos de um caractere ou algum aspecto de caractere, como uma ênfase ou ligatura. O Unicode é compatível com mais de um milhão de pontos de código, os quais são escritos com um "U" seguido por um sinal de mais e o número exclusivo na anotação hexadecimal; por exemplo, a palavra "Hello" é escrita como U+0048 U+0065 U+006C U+006C U+006F.

URL

O acrônimo de "Uniform Resource Locator", uma cadeia de caracteres que descreve o endereço de documentos e outros recursos na Internet. Definido pelo IETF no RFC 2396, um URL é composto de duas partes separadas por dois-pontos (":"). A primeira parte do endereço indica qual protocolo utilizar, p. ex., http, ftp, etc., e a segunda parte especifica o endereço IP ou o nome de domínio em que o recurso está localizado.

UTF-8

UTF-8 -bit Unicode Transformation Format (Formato de Transformação Unicode de 8 bits) é um sistema para codificação de Unicode, de forma que cada caractere possa ser transmitido usando valores numéricos de 8 bits. Isso é comumente utilizado como transmissão de dados de 8 bits, que é muito utilizada na Internet.

This file last modified 23-Jan-2008

© 2008 Internet Corporation For Assigned Names and Numbers