O Google revelou nesta quarta-feira (10), durante o evento Google I/O, seu mais recente serviço de tradução denominado 'Universal Translator'.

Utilizando inteligência artificial (IA), a ferramenta é capaz de traduzir vídeos para outros idiomas, imitando o tom de voz do falante e sincronizando os movimentos labiais com as falas traduzidas.

No exemplo apresentado, um vídeo de uma palestra em inglês de um curso online gravado por uma mulher passa por quatro etapas até a versão final traduzida.

  • Inicialmente, o áudio é identificado e transcrito pela IA
  • Em seguida, o conteúdo é traduzido para o idioma desejado e um arquivo de áudio correspondente é gerado, mantendo o estilo e tom de voz do original
  • Por último, o algoritmo ajusta a imagem do vídeo para sincronizar os movimentos labiais do apresentador com o áudio no novo idioma, criando a impressão de que as palavras traduzidas foram realmente pronunciadas

O projeto está sendo desenvolvido em colaboração com a Arizona State University e, de acordo com o Google, representa um grande avanço na compreensão da aprendizagem. Resultados promissores já foram alcançados, com aumento nas taxas de conclusão dos cursos. Entretanto, a empresa está ciente das preocupações relacionadas à possibilidade de criação de deepfakes, onde a IA pode ser usada para manipular áudios e imagens, gerando arquivos falsos com pessoas em situações fictícias.

James Manyika, líder do novo departamento de 'Tecnologia e Sociedade' do Google, abordou a questão em seu discurso, destacando os benefícios do serviço, mas reconhecendo que as tecnologias subjacentes podem ser exploradas por atores mal-intencionados para criar deepfakes.