Um
pouco sobre char sets
No
DVP642, se enquanto estivermos assistindo um DivX com legenda
apertarmos o botão SUBTITLE, alternaremos as seguintes
mensagens:
- ENCODING
LATIN1
- ENCODING
LATIN2
- ENCODING
CYRILIC
Por
algum tempo, eu estive me referindo a isso como "fonte
LATIN1, fonte LATIN2 e fonte CYRILIC". Eu sabia que isso
não estava correto, porém não achava
necessário explicar o conceito de char sets.
Mas
agora com a introdução dos firmwares modificados,
a distinção entre o que é fonte e o que
é um char set precisa ser feita, para não
provocar uma confusão danada no texto.
Um
char set (character set = conjunto de caracteres)
é, explicando de uma forma simplificada, uma tabela
contendo todos os símbolos usados em uma linguagem.
Isso inclui as letras do alfabeto (maiúsculas e minúsculas,
com e sem acento), os números, simbolos de moeda, sinais
de pontuação, etc.
Em
um computador, e por tabela qualquer dispositivo de tecnologia
digital (como um DVD player), cada caractere é armazenado
como um código. Por razões técnicas e
históricas, existe um número limitado de códigos
que podem ser usados para representar os caracteres, que é
bem inferior ao número total de caracteres usados em
todas as linguagens do mundo inteiro. Por isso foram criadas
tabelas diferentes de correspondência entre caracteres
e seus respectivos códigos. Estas tabelas são
chamadas de char sets ou charsets.
A
tabela correta para nós da America Latina é
a ISO 8859-1, mais conhecida como Latin1, que
pode ser vista aqui:
http://www.microsoft.com/globaldev/reference/iso/28591.htm
Já
muitos países europeus usam uma tabela diferente: a
ISO 8859-2, mais conhecida como Latin2, que
pode ser vista aqui:
http://www.microsoft.com/globaldev/reference/iso/28592.htm
E
outros usam uma ainda mais estranha, chamada Cyrilic (sem
link ainda)
Se
você imprimir a primeira página de cada uma delas,
verá que alguns de nossos caracteres acentuados não
são usados e são substituídos por outros.
É por isso que no DVP642 do jeito que vem da fábrica
ou usando firmwares baseados em LATIN2, parte da acentuação
não funciona como esperado. O que você vê,
quando abre a legenda no seu computador, é o caractere
acentuado correto, porque seu computador está usando
a tabela LATIN 1. Mas o DVDPlayer, ao usar a LATIN
2, interpreta o caractere de uma forma diferente.