Palavra de Sá

quinta-feira, 11 de junho de 2026

A era da IA barata acabou

Quando a OpenAI lançou o ChatGPT no final de 2022, ele rapidamente quebrou recordes como o produto tecnológico de crescimento mais rápido da história. Fornecedores de modelos de IA, como OpenAI, Anthropic e Google, inicialmente usaram preços fixos artificialmente baixos para impulsionar a adoção de seus produtos e conquistar participação de mercado, confiando que poderiam queimar o capital dos investidores para gerar dependência e, em seguida, monetizar uma base de usuários cativa. Mas, em comparação com outras plataformas voltadas para o consumidor que seguiram essa estratégia desde os anos 2000, como Facebook, Uber ou Instagram, a IA generativa difere em dois aspectos cruciais.

Primeiro, cada usuário adicional gera um custo contínuo enorme por consulta, em uma escala que nenhuma rede social jamais alcançou. Especificamente, os chatbots consomem uma quantidade imensa de poder computacional, que depende de eletricidade, água para refrigeração de servidores, terrenos para data centers e bilhões de dólares em investimentos em hardware. Segundo, à medida que os modelos se tornam mais avançados, também se tornam mais caros de operar. Nesse sentido, eles se aproximam de tecnologias de computação em nuvem, como a Amazon Web Services.

Em 2023, a empresa de pesquisa SemiAnalysis estimou que o ChatGPT já custava cerca de US$ 700.000 por dia para funcionar. Os modelos só se tornaram mais complexos e exigentes em recursos desde então. No início de 2026, com 800 a 900 milhões de usuários ativos semanais e apenas 35 milhões de assinantes pagantes, o custo para manter o acesso global ao ChatGPT nessa escala era de cerca de US$ 17 bilhões por ano, ou perto de US$ 47 milhões por dia.

Nas palavras do professor de administração de Harvard, Andy Wu, a maioria das pessoas não percebe o quão “ridiculamente cara” é a IA. A maioria está ciente dos altos custos fixos, mas não dos custos variáveis de inferência incorridos cada vez que o modelo gera uma imagem. A OpenAI prevê gastar mais de US$ 150 bilhões apenas com custos de inferência até 2030. Embora a grande maioria dos usuários continue acessando a plataforma gratuitamente, a questão é como a diferença entre recursos e receita será eventualmente solucionada e quem arcará com os custos.

<><> O problema da concretização da IA

De 2022 a 2025, o setor enfrentou um problema de realização. Esse termo marxista se refere ao momento no circuito do capital (do dinheiro ao investimento em capacidade produtiva e de volta ao dinheiro) em que os bens são convertidos em vendas lucrativas. Um problema de realização surge quando as empresas conseguem produzir enormes quantidades de bens ou serviços, mas não encontram compradores suficientes para recuperar os custos.

Em outras palavras, um problema de realização ocorre quando a capacidade produtiva se expande mais rapidamente do que a demanda. Nos primeiros anos da IA, as empresas de tecnologia investiram somas enormes em IA generativa — fazendas de servidores, treinamento de modelos, mão de obra de engenharia e assim por diante — mas a demanda era insuficiente. No final de 2025, Wu afirmou que o número de pessoas dispostas a pagar US$ 20 por mês por IA generativa era menor do que o número de pessoas dispostas a pagar US$ 20 por mês pela Netflix. Para gerar demanda por um produto com o qual seus empregadores estavam financeiramente envolvidos, as empresas de tecnologia pressionaram os funcionários a usar os chatbots, independentemente de essa demanda produzir resultados proporcionais.

Por exemplo, a Meta e a Shopify criaram rankings internos para rastrear e recompensar o uso de tokens. O CEO da Nvidia, Jensen Huang, disse que ficaria “profundamente alarmado” se um engenheiro não usasse pelo menos o equivalente a US$ 250.000 em tokens em um ano, e que “isso não é diferente de um de nossos projetistas de chips que diz: ‘Adivinhem? Vou usar papel e caneta’”. Isso, claro, depois que a Nvidia investiu US$ 30 bilhões na OpenAI, financiando a demanda por seu próprio produto.

Em janeiro, a Accenture informou a seus funcionários seniores que eles deveriam usar ferramentas de IA regularmente para serem considerados para promoções. Como um funcionário anônimo da Accenture disse à Jacobin: “Gostaria que houvesse mais transparência na aplicação das regras de uso de IA entre os funcionários seniores. A política é vaga. Temo que isso incentive as pessoas a usar IA apenas para atingir alguma meta.”

O problema da concretização foi, portanto, adiado por meio de uma combinação de criação de demanda fictícia e preços subsidiados. Ele foi ainda mais obscurecido pela lógica de financiamento circular do setor, onde um pequeno grupo de empresas se isolava da disciplina de mercado financiando, fornecendo e vendendo umas às outras em um ciclo fechado.

<><> Estratificação de classes de IA

No final de 2025, a Anthropic lançou seu modelo Claude Opus 4.5, um modelo de IA agentiva voltado para “trabalhadores do conhecimento”. O Opus 4.5 representa uma conquista tecnológica genuína, segundo qualquer critério convencional. O modelo também é consideravelmente mais caro de operar e levou a uma mudança na estratégia de preços, além de romper com a retórica anterior de IA como uma utilidade universal.

Os tokens são a unidade básica de dados que os modelos de IA processam. Uma conversa com um chatbot utiliza centenas de tokens por parágrafo. Tarefas de IA agentiva, nas quais os modelos navegam na web de forma autônoma, escrevem e executam código ou gerenciam fluxos de trabalho complexos, podendo consumir milhões de recursos rapidamente. De acordo com Vasudev Bhandarkar, empreendedor e investidor do Vale do Silício, a principal razão pela qual a IA agentiva é exponencialmente mais cara reside em sua multiplicidade (a capacidade de lidar com muitas chamadas simultaneamente), na quantidade de contexto que pode armazenar, em sua capacidade de verificação, no uso de ferramentas externas e no alto custo quando apresenta falhas. A transição da IA conversacional para a IA agentiva representa um salto enorme na intensidade de recursos.

Desde o início de 2026, a Anthropic vem introduzindo progressivamente sobretaxas baseadas em tokens, níveis de inferência premium, faturamento separado para agentes autônomos e medição baseada em créditos para uso de ferramentas e integrações. No início de maio, a empresa anunciou que os assinantes do Claude passariam a ter uma medição mensal de créditos separada para ferramentas agentivas e implementações de terceiros (ferramentas que utilizam o modelo Claude), faturadas de acordo com as taxas integrais da API (Interface de Programação de Aplicativos) a partir de meados de junho. Procurado para comentar, um pesquisador anônimo especializado em grandes modelos de linguagem (LLMs) disse à Jacobin:

Desde o Claude Opus 4.5, os fornecedores de modelos têm priorizado cada vez mais as capacidades agentivas e os negócios entre empresas (B2B), em detrimento dos consumidores finais. Empresas como Google e OpenAI, embora ainda interessadas na adoção massiva de IA, estão mudando de estratégia. A Anthropic priorizou o B2B desde o início.

A direção é clara: as formas de IA mais poderosas e que exigem maior poder computacional são a prioridade e serão cada vez mais destinadas a profissionais de escritório em grandes empresas cujos empregadores podem pagar o alto preço por elas. No início de março, o Claude ultrapassou brevemente o ChatGPT em número de usuários ativos diários, registrando um aumento de 1.487% no uso. A demanda existe. O modelo de preços para sustentá-la em níveis de acesso democráticos e acessíveis, não. Nas palavras de Bhandarkar, “a questão é: a IA se tornará como a eletricidade ou os jatos particulares?”

<><> A transição pela qual ninguém votou

Atualmente, a resposta da indústria para essa contradição é que a IA se pagará por meio de ganhos de “produtividade”. A experiência recente da Uber sugere que isso pode não ser tão simples. Depois de investir US$ 3,4 bilhões em IA em 2025, a Uber pressionou fortemente seus cinco mil engenheiros para que adotassem o Claude, com rankings incentivando o uso máximo. A empresa esgotou todo o seu orçamento de IA para 2026 já em abril. O diretor de tecnologia da Uber admitiu que estava “voltando à prancheta porque o orçamento que eu achava que precisaria já foi totalmente consumido”.

O valor de uso da IA e seus custos de capital divergiram. Os ganhos de produtividade provavelmente são reais, mas insuficientes. Por exemplo, o consumo por desenvolvedor na Uber aumentou de cinco a vinte vezes, mas nenhum indicador público mostra um aumento correspondente no “valor da produção”. De acordo com o pesquisador de LLMs, “seja um provedor de modelos ou uma empresa de tecnologia na economia da IA, a competição é acirrada e você sente a pressão para manter os gastos altos, mesmo que esteja investindo mais do que deveria ou pode”. Por enquanto, não há evidências de que os cálculos estejam corretos e, mais importante, não há evidências de que precisem estar. O mesmo financiamento circular permite que o setor continue gastando sem conciliar custo e retorno.

Mesmo que a IA eventualmente se pague em uma empresa como a Uber, o que isso significa para a maioria dos trabalhadores que são excluídos desses ganhos? Em outras palavras, mesmo que a IA seja produtiva no agregado, para quem esse valor de produtividade se concretiza? Os ganhos de eficiência são principalmente para o trabalho intelectual, mas os custos — preços mais altos, acesso restrito, precariedade trabalhista e, mais urgentemente, devastação ambiental — são compartilhados de forma desigual.

Embora as empresas de IA que nos impuseram o consumo de seus produtos não tenham um plano claro para financiar o aumento dos custos, elas demonstraram uma capacidade notável de garantir financiamento inovador e adiar o ajuste de contas por meio dos mercados de capitais. A principal preocupação não são os balanços da economia da IA, mas sim se este é um acordo que o resto de nós deseja aceitar passivamente. Será possível renegociar os termos dessa transição?

Fonte: Por Sophie Bandarkar - Tradução Pedro Silva, para Jacobin Brasil

Nenhum comentário:

Postar um comentário