A Dadosfera, startup de dados, inteligência artificial (IA) e análises avançadas, e a Universidade Federal de Minas Gerais (UFMG) anunciam parceria para desenvolver uma tecnologia inédita no mundo em IA, um modelo de linguagem natural brasileiro para análise de dados tabulares do Datasus, o Departamento de Informação e Informática do Sistema Único de Saúde (SUS).

O projeto, que tem o apoio da Empresa Brasileira de Pesquisa e Inovação Industrial (Embrapii) e do Serviço Brasileiro de Apoio às Micro e Pequenas Empresas (Sebrae), pretende tornar acessíveis informações atualmente disponíveis em uma base de difícil interpretação. O ineditismo da solução está no fato de ela ser aplicada a uma base de dados grandiosa e ao viés de análise de informações que ela suportará.

A aplicação inédita de IA à análise de dados tabulares confere ao projeto não apenas relevância nacional, mas também potencial internacional. A Universidade Federal do Amazonas (UFAM) também é uma instituição parceira no projeto.



Como vai funcionar?



Hoje, o Datasus concentra milhões de registros sobre internações, tratamentos e indicadores de saúde no Brasil. Embora os dados sejam públicos, eles estão organizados em grandes tabelas técnicas, que exigem conhecimento avançado para serem consultadas.

A nova tecnologia permitirá que qualquer pessoa faça perguntas em português simples ao Datasus e receba uma resposta, sem precisar navegar por planilhas. Ela poderá acessar dados provenientes de diferentes domínios do Datasus que atualmente não são fáceis de serem interconectados por um ser humano sem conhecimento dos dados.

Um usuário poderá, por exemplo, perguntar “Quantas internações por dengue aconteceram no estado de São Paulo em 2024?”. O sistema irá processar a pergunta, buscar os dados corretos em sua base e devolver a resposta de forma compreensível, trazendo mais velocidade e inteligência às análises de dados provenientes de diferentes fontes.



Qual será o impacto?

A ideia nasceu dentro da Dadosfera, que procurou a universidade para desenvolver a tecnologia em conjunto. Para o COO e sócio da startup, Brian Zaki, o impacto vai além da inovação tecnológica: “Queremos democratizar o acesso aos dados de saúde pública. Dar às pessoas o poder de analisar e compreender indicadores de saúde é fundamental para jornalistas, estudantes, pesquisadores e qualquer cidadão interessado em acompanhar o histórico do país e as políticas públicas nesse campo.”



Como explica Marcos André Gonçalves, coordenador do projeto e professor titular do Departamento de Ciência da Computação da UFMG, mesmo sendo informações oficiais e abertas, hoje elas estão em planilhas complexas, que acabam restritas a especialistas. “Com essa tecnologia, qualquer cidadão poderá fazer perguntas em português simples e obter respostas estruturadas.”

O projeto terá duração de 12 meses e o objetivo é que os primeiros protótipos fiquem prontos em seis meses. Inicialmente, o desenvolvimento dos modelos e tecnologia será hospedado em um misto de infraestrutura da UFMG e Dadosfera, mas existem planos para disponibilização da tecnologia para a população e empresas, sendo uma segunda parte do projeto para exploração da tecnologia desenvolvida na parceria.

A iniciativa conta com a subcoordenação de Altigran Soares da Silva, professor titular do Instituto de Computação da Universidade Federal do Amazonas (IComp/UFAM), e outros 11 pesquisadores: oito de iniciação científica (graduação), dois de mestrado e um de pós-doutorado.



Brian ressalta a importância de unir mercado e academia. “Tenho uma história de proximidade com a UFMG desde os meus primeiros anos no Google, quando ajudei, por volta de 2007, a construir o escritório de engenharia de Belo Horizonte. Mais tarde, como diretor de recrutamento de recém-formados nas Américas, aprofundei ainda mais esse relacionamento com a comunidade acadêmica. É um orgulho retomar essa parceria agora em um projeto que pode transformar a forma como o Brasil entende seus próprios dados de saúde.”

Siga nosso canal no WhatsApp e receba notícias relevantes para o seu dia