ASCII e suas representações diante do binário, você precisa entender melhor

Rodolfo Peixoto

26 de Dez de 2023 — 8 min read

Para entender como um computador representa e processa caracteres como a letra "A", é importante compreender como os sistemas de codificação de caracteres funcionam, especialmente o ASCII (American Standard Code for Information Interchange), que é um dos mais comuns. Vamos explorar este processo e também como calcular a quantidade de dados em termos de bits e bytes.

Representação de Caracteres: O Caso do 'A'

Codificação ASCII: No padrão ASCII, cada caractere é representado por um número único. Por exemplo, a letra maiúscula 'A' é representada pelo número 65.
Representação Binária: Este número é então convertido em uma sequência binária (bits). O número 65 em binário é 01000001. Em ASCII, cada caractere é representado por um byte (8 bits), então 'A' é representado por esses oito bits.
Processamento pelo Computador: Quando você digita 'A' em um teclado, o computador recebe o sinal correspondente ao número 65, processa essa informação e, dependendo do contexto (por exemplo, um programa de processamento de texto), exibe o caractere 'A' na tela.

Quantidade de Caracteres, Bits e Bytes

Bits e Bytes: Como mencionado, cada caractere ASCII é representado por um byte, que é composto por 8 bits. Portanto, se você tem um texto com 1.000 caracteres, ele ocupará 1.000 bytes (ou aproximadamente 1 kilobyte, já que 1 KB é igual a 1.024 bytes).
Cálculo de Bits e Bytes: Para calcular o número total de bits, você simplesmente multiplica o número de caracteres pelo número de bits que cada caractere usa. No caso do ASCII, isso seria 1.000 caracteres x 8 bits/charactere = 8.000 bits.

a close up of a clock with green numbers on it — Photo by Artturi Jalli / Unsplash

Caracteres e Codificações Mais Complexas

Unicode: Enquanto o ASCII é suficiente para representar caracteres do inglês, ele não abrange caracteres de muitos outros idiomas. Unicode é um padrão mais abrangente que pode representar caracteres de praticamente todos os idiomas e símbolos. Em Unicode, a quantidade de bits necessária para representar um caractere pode variar.
UTF-8: Uma das codificações mais comuns de Unicode é o UTF-8, que usa entre 1 e 4 bytes para representar cada caractere. Isso significa que a quantidade de espaço necessário para armazenar texto pode variar significativamente dependendo dos caracteres usados.

Decimal	Binário	ASCII
32	00100000	(espaço)
33	00100001	!
34	00100010	"
35	00100011	#
36	00100100	$
37	00100101	%
38	00100110	&
39	00100111	'
40	00101000	(
41	00101001	)
42	00101010	*
43	00101011	+
44	00101100	,
45	00101101	-
46	00101110	.
47	00101111	/
48	00110000	0
49	00110001	1
50	00110010	2
51	00110011	3
52	00110100	4
53	00110101	5
54	00110110	6
55	00110111	7
56	00111000	8
57	00111001	9
58	00111010	:
59	00111011	;
60	00111100	<
61	00111101	=
62	00111110	>
63	00111111	?
64	01000000	@
65	01000001	A
66	01000010	B
67	01000011	C
68	01000100	D
69	01000101	E
70	01000110	F
71	01000111	G
72	01001000	H
73	01001001	I
74	01001010	J
75	01001011	K
76	01001100	L
77	01001101	M
78	01001110	N
79	01001111	O
80	01010000	P
81	01010001	Q
82	01010010	R
83	01010011	S
84	01010100	T
85	01010101	U
86	01010110	V
87	01010111	W
88	01011000	X
89	01011001	Y
90	01011010	Z
91	01011011	[
92	01011100	\
93	01011101	]
94	01011110	^
95	01011111	_
96	01100000	`
97	01100001	a
98	01100010	b
99	01100011	c
100	01100100	d
101	01100101	e
102	01100110	f
103	01100111	g
104	01101000	h
105	01101001	i
106	01101010	j
107	01101011	k
108	01101100	l
109	01101101	m
110	01101110	n
111	01101111	o
112	01110000	p
113	01110001	q
114	01110010	r
115	01110011	s
116	01110100	t
117	01110101	u
118	01110110	v
119	01110111	w
120	01111000	x
121	01111001	y
122	01111010	z
123	01111011	{
124	01111100	\|
125	01111101	}
126	01111110	~

Esta tabela mostra os valores decimais de 32 a 126, que incluem a maioria dos caracteres imprimíveis comuns no padrão ASCII, juntamente com suas representações binárias. Os caracteres ASCII abaixo de 32 são principalmente caracteres de controle e não são frequentemente usados em texto comum.

Claro, vamos detalhar esses processos de conversão com exemplos para facilitar o entendimento.

Conversão de Binário para Decimal

A conversão de um número binário para decimal envolve somar as potências de 2 correspondentes a cada dígito binário que é 1. Vamos usar o número binário 101 como exemplo.

a large number of numbers are arranged in rows — Photo by Enric Moreu / Unsplash

Número Binário: 101

Para converter isso em decimal, analisamos cada dígito do número binário, começando da direita para a esquerda (ou seja, do dígito menos significativo para o mais significativo):

O dígito mais à direita é 1. Como está na posição 0 (começando a contar do 0), multiplicamos 1 por (2^0). (2^0 = 1), então (1 \times 2^0 = 1).
O próximo dígito é 0. Está na posição 1, então multiplicamos 0 por (2^1). (2^1 = 2), mas como estamos multiplicando por 0, o resultado é 0.
O último dígito, à esquerda, é 1. Está na posição 2, então multiplicamos 1 por (2^2). (2^2 = 4), então (1 \times 2^2 = 4).

Agora, somamos esses valores: (1 + 0 + 4 = 5).

Portanto, o número binário 101 é igual a 5 em decimal.

Conversão de Decimal para Binário

A conversão de um número decimal para binário envolve dividir o número por 2 e anotar o resto, repetindo o processo com o quociente até que o quociente seja 0. Vamos usar o número decimal 5 como exemplo.

Número Decimal: 5

Divida 5 por 2. O quociente é 2 e o resto é 1.
Divida o quociente (2) por 2. O novo quociente é 1 e o resto é 0.
Divida o quociente (1) por 2. O novo quociente é 0 e o resto é 1.

Agora, lemos os restos de trás para frente (do último para o primeiro): 101.

Portanto, o número decimal 5 é igual a 101 em binário.

Exemplo Adicional: Convertendo 13 para Binário

Vamos converter o número decimal 13 para binário:

13 dividido por 2 é 6, com resto 1.
6 dividido por 2 é 3, com resto 0.
3 dividido por 2 é 1, com resto 1.
1 dividido por 2 é 0, com resto 1.

Lendo os restos de trás para frente, obtemos 1101.

Portanto, o número decimal 13 é igual a 1101 em binário.

Esses processos são fundamentais na computação, pois permitem a conversão entre diferentes sistemas numéricos usados em hardware e software.

A representação de caracteres em computadores, como a letra 'A', é um processo que envolve a conversão de caracteres em números (usando padrões como ASCII ou Unicode) e, em seguida, em sequências binárias para processamento e exibição. O entendimento de como os caracteres são codificados e quantificados em termos de bits e bytes é fundamental para compreender o armazenamento e processamento de dados em sistemas computacionais.

A forma como um computador interpreta uma sequência de bits, como "01100110" (que representa o caractere 'f' em ASCII), depende inteiramente do contexto em que esses bits são usados. Vamos explorar como isso funciona:

1. Codificação e Decodificação de Dados

Codificação de Caracteres: Quando digitamos um texto, cada caractere é convertido em uma sequência de bits usando um esquema de codificação, como ASCII ou Unicode. No ASCII, 'f' é representado por 01100110.
Codificação de Cores: Em gráficos de computador, as cores são frequentemente codificadas usando esquemas como.. Cada componente de cor pode ser representado por um byte. Por exemplo, um tom específico de vermelho pode ser representado como 11111111 00000000 00000000 em RGB.

2. Contexto de Uso

Software de Processamento de Texto: Quando você está usando um processador de texto e digita 'f', o programa interpreta a sequência de bits 01100110 como um caractere de texto, baseado no esquema de codificação de caracteres que está utilizando.
Software Gráfico: Se você estiver trabalhando com um software gráfico, a mesma sequência de bits pode ser interpretada como parte de uma informação de cor, dependendo de como o software processa esses dados.

3. Metadados e Formatos de Arquivo

Metadados: Arquivos contêm metadados que informam ao computador como interpretar os bits. Por exemplo, um arquivo de texto pode ter um metadado especificando que está codificado em UTF-8, enquanto uma imagem pode ter metadados indicando que é um arquivo PNG ou JPEG.
Formatos de Arquivo: Diferentes formatos de arquivo têm estruturas específicas. Um arquivo .txt é interpretado como texto, enquanto um arquivo .png é interpretado como imagem. Cada formato tem regras sobre como os dados são organizados e interpretados.

4. Sistemas Operacionais e Drivers

space gray MacBook Pro — Photo by Devon Janse van Rensburg / Unsplash

Sistemas Operacionais: O sistema operacional (SO) desempenha um papel crucial na interpretação dos dados. Ele usa informações sobre o formato do arquivo e o aplicativo que está sendo usado para determinar como processar uma sequência de bits.
Drivers: Drivers de hardware também são importantes. Por exemplo, o driver da placa gráfica interpreta dados destinados à exibição na tela, enquanto o driver do teclado interpreta as entradas do teclado.

5. Exemplo Prático

Imagine que você tem o seguinte byte: 01100110.

Como Texto: Em um editor de texto, com base no padrão ASCII, este byte será interpretado como 'f'.
Como Cor: Em um software de edição de imagem, este byte pode ser parte de uma informação de cor. Se estiver no contexto de um canal de cor em um esquema RGB, pode representar uma intensidade específica para esse canal.

A interpretação de uma sequência de bits como um caractere, uma cor ou qualquer outro tipo de dado depende inteiramente do contexto em que esses bits são usados. O software e o hardware trabalham juntos, utilizando metadados, formatos de arquivo e esquemas de codificação para determinar como esses bits devem ser interpretados e processados.

A tabela ASCII (American Standard Code for Information Interchange) e os emojis são representados por diferentes quantidades de bits e são interpretados de maneiras distintas pelos computadores.

Tabela ASCII

Quantidade de Bits: A tabela ASCII original representa caracteres usando 7 bits, permitindo 128 caracteres diferentes (de 0 a 127). No entanto, a versão estendida do ASCII usa 8 bits, permitindo 256 caracteres diferentes (de 0 a 255). Esses caracteres adicionais incluem símbolos gráficos e caracteres de diferentes idiomas.
Funcionamento: Cada caractere na tabela ASCII é mapeado para um número específico. Por exemplo, o caractere 'A' é representado pelo número 65 (ou 01000001 em binário na versão de 8 bits). Quando um computador lê o byte 01000001 em um contexto de texto, ele interpreta isso como o caractere 'A'.

Emojis

Quantidade de Bits: Os emojis são representados usando a codificação Unicode, que é significativamente mais abrangente do que o ASCII. O Unicode utiliza diferentes "planos", e a maioria dos caracteres comuns, incluindo emojis, está no Plano Multilíngue Básico, que é codificado em UTF-16 (16 bits). No entanto, alguns emojis e caracteres especiais podem exigir mais de 16 bits e são codificados usando pares substitutos em UTF-16.
Funcionamento: Em Unicode, cada emoji tem seu próprio código. Por exemplo, o emoji de coração ❤️ é U+2764. Em UTF-16, isso é representado por um par de bytes. Quando um computador encontra esses bytes em um contexto onde o Unicode é esperado (como em um aplicativo de mensagens), ele interpreta esses bytes como o emoji correspondente.
Variações e Modificadores: Alguns emojis têm variações, como diferentes tons de pele ou gêneros. Essas variações são realizadas usando sequências de caracteres Unicode, onde um emoji base é seguido por um ou mais modificadores.

Interpretação de Emojis

A interpretação de emojis é mais complexa do que a de caracteres ASCII devido à sua maior variedade e ao uso de modificadores. Os aplicativos e sistemas operacionais devem ser capazes de interpretar a codificação Unicode e renderizar o emoji apropriado. Além disso, a aparência dos emojis pode variar entre diferentes dispositivos e plataformas, pois cada fabricante pode ter seu próprio conjunto de imagens para representar cada emoji.

Em resumo, enquanto a tabela ASCII usa até 8 bits por caractere, os emojis em Unicode podem usar 16 bits ou mais, dependendo do caractere específico e de quaisquer modificadores aplicados. A interpretação correta dos emojis depende do suporte ao Unicode e da capacidade do software de renderizar as imagens correspondentes aos códigos de emoji.