A
era da IA barata acabou
Quando
a OpenAI lançou o ChatGPT no final de 2022, ele rapidamente quebrou recordes
como o produto tecnológico de crescimento mais rápido da história. Fornecedores
de modelos de IA, como OpenAI, Anthropic e Google, inicialmente usaram preços
fixos artificialmente baixos para impulsionar a adoção de seus produtos e
conquistar participação de mercado, confiando que poderiam queimar o capital
dos investidores para gerar dependência e, em seguida, monetizar uma base de
usuários cativa. Mas, em comparação com outras plataformas voltadas para o
consumidor que seguiram essa estratégia desde os anos 2000, como Facebook, Uber
ou Instagram, a IA generativa difere em dois aspectos cruciais.
Primeiro,
cada usuário adicional gera um custo contínuo enorme por consulta, em uma
escala que nenhuma rede social jamais alcançou. Especificamente, os chatbots
consomem uma quantidade imensa de poder computacional, que depende de
eletricidade, água para refrigeração de servidores, terrenos para data centers
e bilhões de dólares em investimentos em hardware. Segundo, à medida que os
modelos se tornam mais avançados, também se tornam mais caros de operar. Nesse
sentido, eles se aproximam de tecnologias de computação em nuvem, como a Amazon
Web Services.
Em
2023, a empresa de pesquisa SemiAnalysis estimou que o ChatGPT já custava cerca
de US$ 700.000 por dia para funcionar. Os modelos só se tornaram mais complexos
e exigentes em recursos desde então. No início de 2026, com 800 a 900 milhões
de usuários ativos semanais e apenas 35 milhões de assinantes pagantes, o custo
para manter o acesso global ao ChatGPT nessa escala era de cerca de US$ 17
bilhões por ano, ou perto de US$ 47 milhões por dia.
Nas
palavras do professor de administração de Harvard, Andy Wu, a maioria das
pessoas não percebe o quão “ridiculamente cara” é a IA. A maioria está ciente
dos altos custos fixos, mas não dos custos variáveis de inferência incorridos
cada vez que o modelo gera uma imagem. A OpenAI prevê gastar mais de US$ 150
bilhões apenas com custos de inferência até 2030. Embora a grande maioria dos
usuários continue acessando a plataforma gratuitamente, a questão é como a
diferença entre recursos e receita será eventualmente solucionada e quem arcará
com os custos.
<><>
O problema da concretização da IA
De 2022
a 2025, o setor enfrentou um problema de realização. Esse termo marxista se
refere ao momento no circuito do capital (do dinheiro ao investimento em
capacidade produtiva e de volta ao dinheiro) em que os bens são convertidos em
vendas lucrativas. Um problema de realização surge quando as empresas conseguem
produzir enormes quantidades de bens ou serviços, mas não encontram compradores
suficientes para recuperar os custos.
Em
outras palavras, um problema de realização ocorre quando a capacidade produtiva
se expande mais rapidamente do que a demanda. Nos primeiros anos da IA, as
empresas de tecnologia investiram somas enormes em IA generativa — fazendas de
servidores, treinamento de modelos, mão de obra de engenharia e assim por
diante — mas a demanda era insuficiente. No final de 2025, Wu afirmou que o
número de pessoas dispostas a pagar US$ 20 por mês por IA generativa era menor
do que o número de pessoas dispostas a pagar US$ 20 por mês pela Netflix. Para
gerar demanda por um produto com o qual seus empregadores estavam
financeiramente envolvidos, as empresas de tecnologia pressionaram os
funcionários a usar os chatbots, independentemente de essa demanda produzir
resultados proporcionais.
Por
exemplo, a Meta e a Shopify criaram rankings internos para rastrear e
recompensar o uso de tokens. O CEO da Nvidia, Jensen Huang, disse que ficaria
“profundamente alarmado” se um engenheiro não usasse pelo menos o equivalente a
US$ 250.000 em tokens em um ano, e que “isso não é diferente de um de nossos
projetistas de chips que diz: ‘Adivinhem? Vou usar papel e caneta’”. Isso,
claro, depois que a Nvidia investiu US$ 30 bilhões na OpenAI, financiando a
demanda por seu próprio produto.
Em
janeiro, a Accenture informou a seus funcionários seniores que eles deveriam
usar ferramentas de IA regularmente para serem considerados para promoções.
Como um funcionário anônimo da Accenture disse à Jacobin: “Gostaria que
houvesse mais transparência na aplicação das regras de uso de IA entre os
funcionários seniores. A política é vaga. Temo que isso incentive as pessoas a
usar IA apenas para atingir alguma meta.”
O
problema da concretização foi, portanto, adiado por meio de uma combinação de
criação de demanda fictícia e preços subsidiados. Ele foi ainda mais
obscurecido pela lógica de financiamento circular do setor, onde um pequeno
grupo de empresas se isolava da disciplina de mercado financiando, fornecendo e
vendendo umas às outras em um ciclo fechado.
<><>
Estratificação de classes de IA
No
final de 2025, a Anthropic lançou seu modelo Claude Opus 4.5, um modelo de IA
agentiva voltado para “trabalhadores do conhecimento”. O Opus 4.5 representa
uma conquista tecnológica genuína, segundo qualquer critério convencional. O
modelo também é consideravelmente mais caro de operar e levou a uma mudança na
estratégia de preços, além de romper com a retórica anterior de IA como uma
utilidade universal.
Os
tokens são a unidade básica de dados que os modelos de IA processam. Uma
conversa com um chatbot utiliza centenas de tokens por parágrafo. Tarefas de IA
agentiva, nas quais os modelos navegam na web de forma autônoma, escrevem e
executam código ou gerenciam fluxos de trabalho complexos, podendo consumir
milhões de recursos rapidamente. De acordo com Vasudev Bhandarkar, empreendedor
e investidor do Vale do Silício, a principal razão pela qual a IA agentiva é
exponencialmente mais cara reside em sua multiplicidade (a capacidade de lidar
com muitas chamadas simultaneamente), na quantidade de contexto que pode
armazenar, em sua capacidade de verificação, no uso de ferramentas externas e
no alto custo quando apresenta falhas. A transição da IA conversacional para a
IA agentiva representa um salto enorme na intensidade de recursos.
Desde o
início de 2026, a Anthropic vem introduzindo progressivamente sobretaxas
baseadas em tokens, níveis de inferência premium, faturamento separado para
agentes autônomos e medição baseada em créditos para uso de ferramentas e
integrações. No início de maio, a empresa anunciou que os assinantes do Claude
passariam a ter uma medição mensal de créditos separada para ferramentas
agentivas e implementações de terceiros (ferramentas que utilizam o modelo
Claude), faturadas de acordo com as taxas integrais da API (Interface de
Programação de Aplicativos) a partir de meados de junho. Procurado para
comentar, um pesquisador anônimo especializado em grandes modelos de linguagem
(LLMs) disse à Jacobin:
Desde o
Claude Opus 4.5, os fornecedores de modelos têm priorizado cada vez mais as
capacidades agentivas e os negócios entre empresas (B2B), em detrimento dos
consumidores finais. Empresas como Google e OpenAI, embora ainda interessadas
na adoção massiva de IA, estão mudando de estratégia. A Anthropic priorizou o
B2B desde o início.
A
direção é clara: as formas de IA mais poderosas e que exigem maior poder
computacional são a prioridade e serão cada vez mais destinadas a profissionais
de escritório em grandes empresas cujos empregadores podem pagar o alto preço
por elas. No início de março, o Claude ultrapassou brevemente o ChatGPT em
número de usuários ativos diários, registrando um aumento de 1.487% no uso. A
demanda existe. O modelo de preços para sustentá-la em níveis de acesso
democráticos e acessíveis, não. Nas palavras de Bhandarkar, “a questão é: a IA
se tornará como a eletricidade ou os jatos particulares?”
<><>
A transição pela qual ninguém votou
Atualmente,
a resposta da indústria para essa contradição é que a IA se pagará por meio de
ganhos de “produtividade”. A experiência recente da Uber sugere que isso pode
não ser tão simples. Depois de investir US$ 3,4 bilhões em IA em 2025, a Uber
pressionou fortemente seus cinco mil engenheiros para que adotassem o Claude,
com rankings incentivando o uso máximo. A empresa esgotou todo o seu orçamento
de IA para 2026 já em abril. O diretor de tecnologia da Uber admitiu que estava
“voltando à prancheta porque o orçamento que eu achava que precisaria já foi
totalmente consumido”.
O valor
de uso da IA e seus custos de capital divergiram. Os ganhos de produtividade
provavelmente são reais, mas insuficientes. Por exemplo, o consumo por
desenvolvedor na Uber aumentou de cinco a vinte vezes, mas nenhum indicador
público mostra um aumento correspondente no “valor da produção”. De acordo com
o pesquisador de LLMs, “seja um provedor de modelos ou uma empresa de
tecnologia na economia da IA, a competição é acirrada e você sente a pressão
para manter os gastos altos, mesmo que esteja investindo mais do que deveria ou
pode”. Por enquanto, não há evidências de que os cálculos estejam corretos e,
mais importante, não há evidências de que precisem estar. O mesmo financiamento
circular permite que o setor continue gastando sem conciliar custo e retorno.
Mesmo
que a IA eventualmente se pague em uma empresa como a Uber, o que isso
significa para a maioria dos trabalhadores que são excluídos desses ganhos? Em
outras palavras, mesmo que a IA seja produtiva no agregado, para quem esse
valor de produtividade se concretiza? Os ganhos de eficiência são
principalmente para o trabalho intelectual, mas os custos — preços mais altos,
acesso restrito, precariedade trabalhista e, mais urgentemente, devastação
ambiental — são compartilhados de forma desigual.
Embora
as empresas de IA que nos impuseram o consumo de seus produtos não tenham um
plano claro para financiar o aumento dos custos, elas demonstraram uma
capacidade notável de garantir financiamento inovador e adiar o ajuste de
contas por meio dos mercados de capitais. A principal preocupação não são os
balanços da economia da IA, mas sim se este é um acordo que o resto de nós
deseja aceitar passivamente. Será possível renegociar os termos dessa
transição?
Fonte:
Por Sophie Bandarkar - Tradução Pedro Silva, para Jacobin Brasil

Nenhum comentário:
Postar um comentário