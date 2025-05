Mesmo as mentes humanas mais brilhantes que desenvolvem a inteligência artificial (IA) generativa que está prestes a mudar o mundo admitem que não compreendem como pensam os cérebros digitais.

"Os que não atuam no setor costumam se surpreender e alarmar-se ao descobrir que não entendemos como funcionam nossas próprias criações de IA", escreveu Dario Amodei, cofundador da Anthropic, em um ensaio publicado na internet em abril.

"Essa falta de compreensão não tem precedentes na história da tecnologia", ressaltou.

Ao contrário dos softwares tradicionais, que seguem rotas lógicas preestabelecidas por programadores, os modelos de IA generativa são treinados para encontrar seu próprio caminho para o sucesso uma vez que receberem um pedido.

Em um recente episódio de podcast, Chris Olah, que fez parte da OpenAI (criadora do ChatGPT) antes de se juntar à Anthropic, descreveu a IA generativa como um "andaime" sobre o qual crescem os circuitos.

Olah é considerado uma autoridade na chamada interpretabilidade mecanicista, um método de engenharia reversa para compreender como funcionam os modelos de IA.

Essa ciência, nascida há aproximadamente uma década, busca determinar exatamente como a inteligência artificial chega de uma demanda a uma resposta.

"Compreender a totalidade de um modelo de linguagem extensivo é uma tarefa incrivelmente ambiciosa", disse à AFP Neel Nanda, principal pesquisador do laboratório de IA DeepMind do Google.

É "de certo modo análogo a tentar compreender completamente o cérebro humano", algo que os neurocientistas ainda não conseguiram, acrescentou Nanda.

Explorar as mentes digitais para compreender seu funcionamento transformou-se em um campo acadêmico de grande interesse, entre outros motivos, por seu potencial de tornar a IA mais poderosa.

"Os estudantes se sentem muito atraídos por isso porque percebem o impacto que pode ter", afirmou Mark Crovella, professor de informática da Universidade de Boston.

- Uma IA honesta -

Segundo Crovella, a interpretabilidade mecanicista envolve estudar não apenas os resultados fornecidos pela IA, mas também analisar os cálculos realizados quando a tecnologia examina as consultas.

"Pode-se analisar o modelo... observar os cálculos que estão sendo realizados e tentar compreendê-los", explicou o professor.

A startup Goodfire utiliza um software de IA capaz de representar dados em forma de passos de raciocínio para compreender melhor o processamento da IA generativa e corrigir erros.

A ferramenta também está desenhada para evitar que os modelos de IA sejam utilizados com fins maliciosos ou que decidam por si mesmos enganar os humanos sobre o que estão fazendo.

"Parece uma corrida contra o tempo para chegar antes que sejam implementados modelos de IA extremamente inteligentes no mundo sem a compreensão de omo funcionam", afirmou Eric Ho, diretor executivo da Goodfire.

Em seu ensaio, Amodei diz que os recentes avanços o tornaram otimista quanto à possibilidade de que a chave para decifrar completamente a inteligência artificial será encontrada em dois anos.

"Concordo que para 2027, poderíamos ter uma interpretabilidade que detecte de forma confiável os vieses e as intenções prejudiciais dos modelos", apontou Anh Nguyen, professor associado da Universidade de Auburn.

De acordo com Crovella, da Universidade de Boston, "ao contrário do cérebro humano", no caso da IA os pesquisadores têm "o equivalente a cada neurônio instrumentado dentro desses modelos".

"Tudo o que ocorre dentro do modelo conhecemos perfeitamente. A questão é descobrir a forma correta de analisá-lo", esclareceu o acadêmico.

Decifrar o funcionamento interno da IA generativa poderia abrir caminho para sua adoção em áreas onde pequenos erros podem ter consequências drásticas, como a segurança nacional, aponta Amodei.

Para Nanda, também poderia impulsionar as descobertas humanas, de forma semelhante a como o modelo AlphaZero, da DeepMind, revelou jogadas de xadrez completamente novas.

Bem entendido, um modelo de inteligência artificial generativa com um selo de confiabilidade obteria uma vantagem competitiva no mercado.

Um avanço deste tipo por parte de uma empresa americana também seria uma vitória para o país em sua rivalidade tecnológica com a China.

"Uma IA potente moldará o destino da humanidade", escreveu Amodei. "Merecemos compreender nossas próprias criações antes que transformem radicalmente nossa economia, nossas vidas e nosso futuro."

