O que são padrões de codificação de caracteres?
Os padrões de codificação de caracteres consistem em uma relação entre determinados caracteres com um grupo de outras coisas como pulsos elétricos ou números com o objetivo de armazenar texto em computadores ou transmiti-lo através de redes de comunicação. Alguns exemplos são o código Morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos elétricos de longa e curta duração e também o ASCII que codifica os mesmos grafemas do código Morse além de outros símbolos através de números inteiros e da representação binária em sete bits destes mesmos números.
Código ASCII
ASCII significa traduzindo código padrão americano para o intercâmbio de informação. É um código binário (cadeias de bits: 0s e 1s) que codifica um conjunto de 128 sinais: 95 sinais gráficos (letras do alfabeto latino, sinais de pontuação e sinais matemáticos) e 33 sinais de controle, utilizando 7 bits para representar todos os seus símbolos. Note que como cada byte possui 8 bits, o bit não utilizado pela tabela ASCII pode ser utilizado de formas diferentes. Este bit é chamado "bit excedente". O código ASCII é usado para representar textos em computadores, equipamentos de comunicação, entre outros dispositivos que trabalham com texto. Os sinais não-imprimíveis, conhecidos como caracteres de controle, são amplamente utilizados em dispositivos de comunicação e afetam o processamento do texto. Foi desenvolvido a partir de 1960 e maioria dos outros códigos o herdaram como base. Este tipo de código também é maioritariamente utilizado para a conversão de código binário em letras do alfabeto.
Código Unicode
Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Este padrão foi publicado no livro "The Unicode Standard 1, 2" e consiste em cerca de 138 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição e ordenação alfabética.Webgrafia:
Comentários
Enviar um comentário