Algumas coisas nesse mundo me deixam fascinado e uma delas é a tecnologia. Quando enfim decidi o que eu queria estudar, para minha felicidade ou desespero, comecei a fazer Ciências da Computação; definitivamente é algo muito encantador, que preenche uma grande lacuna de curiosidades na minha mente.

Uma das coisas que mais fazemos durante nossa vida é escutar música, e claro, isso é algo que nos comove, nos impulsiona, nos inspira; é uma válvula de escape para nossa mente também em muitos momentos, que nos desencadeia sentimentos e faz nossa realidade se tornar menos cruel. Quando vibramos as cordas vocais ou um instrumento vibra, o ar oscila em ondas contínuas de pressão. Essas ondas não têm interrupções, entre o silêncio e o volume máximo existem infinitos pontos intermediários. Esse é o coração de um sinal analógico: ele é contínuo tanto no tempo quanto no valor.

Resistores, capacitores e transistores processam essas grandezas de forma direta. Por isso, durante muito tempo essa tecnologia dominou dispositivos como amplificadores de áudio, mas esses pequenos grandes sinais analógicos possuíam uma limitação, mais conhecidos por nós, meros mortais, como ruídos e distorções; a cada cópia de uma fita, a cada repetição de um sinal, trazia cada vez um pouquinho a mais de imperfeição.

Para nossa alegria, grandes mentes passam por esse planeta e, com a chegada dos sistemas digitais, essas ondas contínuas passaram a ser representadas de forma mais discreta. Agora usamos apenas dois estados que conhecemos bem: 0 e 1, os bits. No começo do século XX, ou 20 para quem não sabe números romanos, era apenas uma teoria ainda, que acabou ganhando força com os trabalhos de Claude Shannon, que em 1948 publicou sua Teoria Matemática da Comunicação no Bell Labs. Esse senhor nos mostrou que qualquer uma de nossas tranqueiras como músicas, imagens ou textos poderiam ser representadas em bits, com uma precisão limitada apenas pela taxa de amostragem e pela profundidade em bits. Shannon provou matematicamente que era possível transformar o mundo analógico em números sem perder a essência da informação, desde que você soubesse quantas amostras coletar e quantos bits usar para representá-las. Isso abriu as portas para tudo que conhecemos hoje: CDs, MP3s, streaming, chamadas de vídeo, tudo. Esse cara é um gênio de verdade.

O processo de conversão acontece em duas etapas: amostragem e quantização. Na amostragem, o sinal analógico é como uma curva suave e ele é medido em intervalos regulares; isso quer dizer que o sistema tira milhares de "fotografias" por segundo dessas ondas. No caso de um áudio de CD, são 44.100 amostras por segundo; isso é muita coisa e impressionante, mas isso também não é aleatório. É um critério que Harry Nyquist em 1928 estabeleceu e depois foi formalizado por Shannon, conhecido como teorema de Nyquist-Shannon. Pois para representar um sinal fielmente é preciso coletar pelo menos o dobro da maior frequência presente nele; como o ouvido humano alcança até cerca de 20kHz, 44,1kHz garante que não perceberemos as lacunas existentes entre o tempo de coleta das amostras.

Depois disso, obviamente, vem a quantização. Cada ponto que foi medido precisa ser traduzido em um número; pensa num fone de ouvido Bluetooth, quando você transmite a música do celular para eles, esse processo acontece. A maioria dos codecs atuais, como o aptX HD ou o LDAC da Sony, trabalha com 24 bits de resolução; segundo minha calculadora científica, isso dá 16.777.216 milhões de níveis possíveis para representar a altura da onda em cada amostra, bem mais do que eram os finados CDs, que trabalhavam em 16 bits e que davam um total de 65.536 representações por amostragem.

Se não ficou claro, quanto mais bits usamos, mais degraus a régua tem, e mais fiel o digital se aproxima do analógico. Podemos pensar que o sinal analógico é como uma rampa ondulada e o sinal digital é como uma escadinha, a escada nunca vai ser idêntica à rampa, mas se os degraus forem pequenos o bastante, conseguimos alcançar uma semelhança muito impressionante.

Diagrama mostrando a diferença entre sinal analógico contínuo (linha curva suave) e sinal digital discretizado (escada com degraus)
Comparação entre sinal analógico (rampa) e sinal digital (escada). Quanto mais degraus, mais fiel a representação.

Agora os números, organizados em cadeias binárias, passam a ser manipulados pelo computador, e isso mostra a força que o sistema binário tem. Diferente do decimal, que usamos no dia a dia com base 10, o binário usa apenas dois símbolos: 0 e 1, e cada pequeno bit ocupa uma posição específica associada a uma potência de 2 (2⁰, 2¹, 2²…). Assim, uma sequência de bits pode representar praticamente qualquer número, instrução ou dado, e isso é fascinante de fato. Com isso temos dois conceitos fundamentais: o MSB (Most Significant Bit), conhecido como o bit mais significativo, que obviamente é o bit de maior peso, e também temos o LSB (Least Significant Bit), o de menor peso. Não entendeu? Sem desespero, aqui vai um exemplo: no binário 1100, o MSB é o 1 mais à esquerda, que tem o peso de 2³=8, e o LSB é o 0 mais à direita, de peso 2⁰ = 1. Se não entendeu, pode desistir, brincadeira.

Ilustração mostrando a estrutura de um número binário, destacando o MSB (Most Significant Bit) à esquerda e o LSB (Least Significant Bit) à direita, com suas respectivas potências de 2
Estrutura de um número binário: MSB (bit mais significativo) e LSB (bit menos significativo).

Pois é, galera, e esse ciclo magnífico de sinal analógico sendo convertido para o sinal digital, processado e depois voltando ao estado analógico de novo, acontece o tempo todo à nossa volta. Está no microfone capturando a voz em uma chamada de vídeo, onde a vibração do ar gera um sinal analógico que é convertido em números por um conversor analógico-digital (ADC). Aí, depois dessa loucura feita ao vivo de coleta de milhões de amostras, esses números viajam pela rede e chegam no outro dispositivo, onde outro conversor digital-analógico (DAC) vai transformar de digital para analógico, transformando 0 e 1 novamente em uma vibração contínua analógica, fazendo vibrar os fones de ouvido de quem ouve. O mesmo processo acontece com uma câmera digital: a luz captada pelo sensor é analógica, mas é convertida em milhões de valores numéricos que se tornam a imagem digital exibida na tela; assim, com cada valor, o processador sabe quais pixels acender e mostrar a imagem. É realmente uma loucura pensar que zeros e uns são capazes de tanto, que são estados, de verdadeiro ou falso, ou, na sua forma original, pulsos de energia elétrica ligados ou desligados.

Hoje, vivemos em meio a esses dois universos. O mundo físico é analógico, contínuo e infinito em detalhes. Já o mundo digital é discreto, formado por recortes e números. A genialidade da ciência e da engenharia está em construir pontes perfeitas entre eles, de modo que possamos ouvir música, gravar vídeos, conversar em tempo real e até controlar máquinas, sem perceber que o que ouvimos e vemos é, na verdade, uma tradução matemática impecável.