Unicode
Unicode é o padrão de codificação de caracteres. Simplificando, esta é uma tabela de correspondência de caracteres de texto (números, letras, elementos de pontuação) para códigos binários. O computador entende apenas a seqüência de zeros e uns. Para saber exatamente o que deve ser exibido na tela, você deve atribuir cada número exclusivo a cada símbolo. Nos anos oitenta, os caracteres foram codificados em um byte, ou seja, oito bits (cada bit é 0 ou 1). Assim, descobriu-se que uma tabela (a mesma codificação ou conjunto) pode conter apenas 256 caracteres. Isso pode não ser suficiente para um idioma. Portanto, muitas codificações diferentes apareceram, a confusão com a qual muitas vezes levou ao aparecimento de sinais estranhos na tela em vez do texto lido. Um único padrão era obrigatório, o que se tornou Unicode. A codificação mais usada — UTF-8 para a imagem de símbolo usa de 1 a 4 bytes.