Brasil quer fazer IA, mas esquece o essencial: dados confiáveis

Luiz Ugeda*

A ministra da Ciência, Tecnologia e Inovação, Luciana Santos, anunciou semana passada na CNN que o Brasil pretende desenvolver seu próprio modelo de inteligência artificial (IA). Segundo a ministra, o avanço da DeepSeek na China reforça a viabilidade de países emergentes, como Brasil e China, competirem no mercado global de IA mesmo com menos recursos do que as nações mais ricas. No entanto, soberania digital começa nos dados, não nos servidores, sendo que a visão do governo Lula ignora um problema estrutural que continua sem solução: a governança dos dados públicos brasileiros.

O plano “IA para o Bem de Todos” prevê um investimento de R$ 23 bilhões entre 2024 e 2028. Anunciado originalmente em julho de 2024, o plano ganha novo fôlego com os avanços da IA chinesa, que demonstram ser possível competir globalmente sem os orçamentos bilionários de grandes potências. O governo brasileiro aposta na construção de um supercomputador e na criação de uma “nuvem soberana” para armazenar dados públicos com grau de sigilo. No entanto, o histórico da gestão de dados no Brasil mostra que o problema é mais profundo do que a infraestrutura física: é uma questão de governança, interoperabilidade e transparência.

O Brasil e sua crise de dados públicos

Diferentes países desenvolvem estratégias de dados alinhadas às suas histórias e prioridades. A União Europeia, por exemplo, prioriza a proteção de dados pessoais e impõe regulações restritivas, o que impacta sua capacidade de inovação. Nos Estados Unidos e na China, o foco é a utilização massiva de dados para fortalecer sua indústria tecnológica.

Portugal e Espanha apresentam abordagens distintas sobre a questão da IA e da soberania digital e os discursos são, invariavelmente, de proteção linguística. Portugal aposta no modelo de inteligência artificial “Amália”, projetado para preservar a variante do português falado em Portugal e garantir a autonomia nacional no desenvolvimento tecnológico. Embora essa seja uma iniciativa relevante, ela não se sustenta sem uma política nacional de dados bem estruturada. Do mesmo modo, a Espanha lançou o modelo ALIA, coordenado pelo Barcelona Supercomputing Center, com o objetivo de atender às necessidades específicas das línguas espanholas (castelhano, catalão, basco e galego) e de reduzir a dependência de modelos de IA desenvolvidos por grandes corporações americanas. No entanto, a criação desses modelos por si só não soluciona o problema central: quais dados serão trabalhados?

No Brasil, o problema se amplifica pelo fato de não termos dados confiáveis e organizados. A fragmentação das bases governamentais cria um cenário de desarticulação, onde diferentes órgãos possuem sistemas não integrados, dificultando a formulação de políticas públicas baseadas em evidências.

O Cadastro Ambiental Rural (CAR), por exemplo, deveria ser a base para monitoramento ambiental, mas sofre com inconsistências e falta de integração com outros sistemas fundiários. O Supremo Tribunal Federal (STF) determinou esta semana que o Conselho Nacional do Meio Ambiente (Conama) promova a integração de todos os dados ambientais ao Sistema Nacional de Controle da Origem dos Produtos Florestais (Sinaflor), garantindo a adesão obrigatória de estados e municípios. O problema é que, muitas vezes, os dados dos estados e dos municípios são muito melhores do que os dados federais. No setor de segurança, a ausência de um padrão unificado de coleta de informações inviabiliza análises eficazes sobre criminalidade. Na saúde, a pandemia escancarou o caos na centralização e gestão de dados epidemiológicos.

A urgência de um “Plano Real” de dados

Para que o Brasil seja protagonista em IA, não basta um supercomputador ou uma nuvem governamental. É necessário um plano estruturado de dados públicos, tal como foi feito com o Plano Real para estabilização da economia.

Isso envolve:

· Criação de uma infraestrutura de dados nacional: padronização, interoperabilidade e transparência na gestão das bases governamentais.

· Independência dos órgãos produtores de dados: reduzir interferências políticas na produção e divulgação das estatísticas nacionais.

· Integração de bases setoriais: cruzamento de informações para tomada de decisões embasadas.

· Transparência e abertura de dados: garantir que informações de interesse público estejam acessíveis para pesquisadores e a sociedade.

Sem dados, não há IA

Se o Brasil deseja realmente se inserir na corrida da inteligência artificial, precisa primeiro organizar a própria casa. Investir em um supercomputador sem uma base confiável de dados é como construir um foguete sem saber onde pousar.

Os exemplos português e espanhol demonstram que desenvolver modelos próprios de IA sem resolver os problemas estruturais da governança dos dados é apenas uma solução parcial. A inovação tecnológica só será efetiva se estiver acompanhada de uma base sólida de dados nacionais confiáveis.

Os desafios são grandes, mas sem um compromisso real com a estruturação dos dados públicos, o Brasil seguirá refém de soluções estrangeiras e com pouca capacidade de inovar no setor. O futuro da IA nacional depende, antes de tudo, de um “Plano Real” de dados, para que a inteligência artificial seja, de fato, brasileira. É hora de agir: a consolidação de uma estratégia nacional de dados exige mobilização, debate e decisões concretas. Participe dessa discussão e ajude a construir um ecossistema de IA verdadeiramente soberano.

*Advogado e Geógrafo. Pós-doutor em Direito (Universidade Federal de Minas Gerais, UFMG) e doutor em Geografia (Universidade de Brasília, UnB). Doutorando em Direito (Universidade de Coimbra, FDUC). Ocupou funções de gestão em diversas empresas, associações e órgãos públicos do setor elétrico, do aeroportuário e de concessões de rodovias. É sócio-fundador de startups de dados para setores regulados. Autor da obra “Direito Administrativo Geográfico”.

Veja também

Geo e Legislação

Opinião: Tecnologia da informação deveria ter governança como a eletricidade

O pesquisador, escritor e jornalista bielorusso Evgery Morozov está em viagem pela América do Sul divulgando sua pesquisa sobre os efeitos nocivos que as grandes empresas de tecnologia, as big techs, podem causar às economias que fazem uso dos serviços oferecidos pelas gigantes da tecnologia, como é o caso do