Luiz Ugeda*
A ministra da Ciência, Tecnologia e Inovação, Luciana Santos, anunciou semana passada na CNN que o Brasil pretende desenvolver seu próprio modelo de inteligência artificial (IA). Segundo a ministra, o avanço da DeepSeek na China reforça a viabilidade de países emergentes, como Brasil e China, competirem no mercado global de IA mesmo com menos recursos do que as nações mais ricas. No entanto, soberania digital começa nos dados, não nos servidores, sendo que a visão do governo Lula ignora um problema estrutural que continua sem solução: a governança dos dados públicos brasileiros.
O plano “IA para o Bem de Todos” prevê um investimento de R$ 23 bilhões entre 2024 e 2028. Anunciado originalmente em julho de 2024, o plano ganha novo fôlego com os avanços da IA chinesa, que demonstram ser possível competir globalmente sem os orçamentos bilionários de grandes potências. O governo brasileiro aposta na construção de um supercomputador e na criação de uma “nuvem soberana” para armazenar dados públicos com grau de sigilo. No entanto, o histórico da gestão de dados no Brasil mostra que o problema é mais profundo do que a infraestrutura física: é uma questão de governança, interoperabilidade e transparência.
O Brasil e sua crise de dados públicos
Diferentes países desenvolvem estratégias de dados alinhadas às suas histórias e prioridades. A União Europeia, por exemplo, prioriza a proteção de dados pessoais e impõe regulações restritivas, o que impacta sua capacidade de inovação. Nos Estados Unidos e na China, o foco é a utilização massiva de dados para fortalecer sua indústria tecnológica.
Portugal e Espanha apresentam abordagens distintas sobre a questão da IA e da soberania digital e os discursos são, invariavelmente, de proteção linguística. Portugal aposta no modelo de inteligência artificial “Amália”, projetado para preservar a variante do português falado em Portugal e garantir a autonomia nacional no desenvolvimento tecnológico. Embora essa seja uma iniciativa relevante, ela não se sustenta sem uma política nacional de dados bem estruturada. Do mesmo modo, a Espanha lançou o modelo ALIA, coordenado pelo Barcelona Supercomputing Center, com o objetivo de atender às necessidades específicas das línguas espanholas (castelhano, catalão, basco e galego) e de reduzir a dependência de modelos de IA desenvolvidos por grandes corporações americanas. No entanto, a criação desses modelos por si só não soluciona o problema central: quais dados serão trabalhados?
No Brasil, o problema se amplifica pelo fato de não termos dados confiáveis e organizados. A fragmentação das bases governamentais cria um cenário de desarticulação, onde diferentes órgãos possuem sistemas não integrados, dificultando a formulação de políticas públicas baseadas em evidências.
O Cadastro Ambiental Rural (CAR), por exemplo, deveria ser a base para monitoramento ambiental, mas sofre com inconsistências e falta de integração com outros sistemas fundiários. O Supremo Tribunal Federal (STF) determinou esta semana que o Conselho Nacional do Meio Ambiente (Conama) promova a integração de todos os dados ambientais ao Sistema Nacional de Controle da Origem dos Produtos Florestais (Sinaflor), garantindo a adesão obrigatória de estados e municípios. O problema é que, muitas vezes, os dados dos estados e dos municípios são muito melhores do que os dados federais. No setor de segurança, a ausência de um padrão unificado de coleta de informações inviabiliza análises eficazes sobre criminalidade. Na saúde, a pandemia escancarou o caos na centralização e gestão de dados epidemiológicos.
A urgência de um “Plano Real” de dados
Para que o Brasil seja protagonista em IA, não basta um supercomputador ou uma nuvem governamental. É necessário um plano estruturado de dados públicos, tal como foi feito com o Plano Real para estabilização da economia.
Isso envolve:
· Criação de uma infraestrutura de dados nacional: padronização, interoperabilidade e transparência na gestão das bases governamentais.
· Independência dos órgãos produtores de dados: reduzir interferências políticas na produção e divulgação das estatísticas nacionais.
· Integração de bases setoriais: cruzamento de informações para tomada de decisões embasadas.
· Transparência e abertura de dados: garantir que informações de interesse público estejam acessíveis para pesquisadores e a sociedade.
Sem dados, não há IA
Se o Brasil deseja realmente se inserir na corrida da inteligência artificial, precisa primeiro organizar a própria casa. Investir em um supercomputador sem uma base confiável de dados é como construir um foguete sem saber onde pousar.
Os exemplos português e espanhol demonstram que desenvolver modelos próprios de IA sem resolver os problemas estruturais da governança dos dados é apenas uma solução parcial. A inovação tecnológica só será efetiva se estiver acompanhada de uma base sólida de dados nacionais confiáveis.
Os desafios são grandes, mas sem um compromisso real com a estruturação dos dados públicos, o Brasil seguirá refém de soluções estrangeiras e com pouca capacidade de inovar no setor. O futuro da IA nacional depende, antes de tudo, de um “Plano Real” de dados, para que a inteligência artificial seja, de fato, brasileira. É hora de agir: a consolidação de uma estratégia nacional de dados exige mobilização, debate e decisões concretas. Participe dessa discussão e ajude a construir um ecossistema de IA verdadeiramente soberano.
*Advogado e Geógrafo. Pós-doutor em Direito (Universidade Federal de Minas Gerais, UFMG) e doutor em Geografia (Universidade de Brasília, UnB). Doutorando em Direito (Universidade de Coimbra, FDUC). Ocupou funções de gestão em diversas empresas, associações e órgãos públicos do setor elétrico, do aeroportuário e de concessões de rodovias. É sócio-fundador de startups de dados para setores regulados. Autor da obra “Direito Administrativo Geográfico”.