Um grupo de pesquisadores da Microsoft Research apresentou um modelo de inteligência artificial (IA) que roda de maneira local em computadores normais. Desenvolvido em parceria com a Universidade da Academia Chinesa de Ciências, o modelo propõe uma baita mudança no uso e funcionamento de IAs.
Conforme descrito num artigo publicado recentemente no servidor arXiv, o BitNet b1.58 foi projetado para rodar em CPUs comuns. Assim, ele dispensa as potentes (e gastonas) Unidades de Processamento Gráfico (GPUs). No setor das IAs, a principal fornecedora de GPUs é a Nvidia.
Modelos atuais de IA têm um problema energético
Grandes modelos de linguagem (LLMs, na sigla em inglês) – por exemplo: ChatGPT (OpenAI) e Gemini (Google) – dependem de GPUs para funcionarem e serem treinados. Isso devido à imensa quantidade de dados e cálculos envolvidos.

Essa dependência gera consumo elevado de energia nos data centers que hospedam esses serviços, o que levanta preocupações ambientais e de sustentabilidade.
Uma solução possível: Arquitetura de 1 Bit
A equipe da Microsoft abordou o problema focando numa das partes mais intensivas do processo: o uso e armazenamento dos “pesos” do modelo.
Normalmente, são números complexos (ponto flutuante de 8 ou 16 bits). A nova abordagem, denominada “arquitetura de 1 bit”, simplifica radicalmente essa etapa.

Neste novo sistema:
- Valores simplificados: Os pesos são representados usando apenas três valores: -1, 0 e 1;
- Cálculos eficientes: O processamento se baseia em operações matemáticas simples de adição e subtração, que podem ser facilmente executadas por CPUs padrão.
Para otimizar a execução, os pesquisadores desenvolveram um ambiente específico chamado bitnet.cpp, projetado para tirar o máximo proveito da arquitetura de 1 bit.
Resultados promissores e possíveis impactos
Testes iniciais indicam que o BitNet b1.58 consegue ter um desempenho comparável, e em alguns casos até superior, a modelos baseados em GPU de tamanho similar.

A grande vantagem é a significativa redução no uso de memória – e, consequentemente, no consumo de energia.
Se os resultados se confirmarem, essa tecnologia pode revolucionar o uso de IAs. Como? Assim:
- Menor dependência de data centers: Usuários poderiam executar chatbots e outros modelos de IA diretamente em seus computadores pessoais ou (quem sabe um dia) celulares;
- Redução do consumo de energia: Diminuiria drasticamente a pegada energética associada à IA;
- Maior privacidade: A execução local dos modelos aumentaria a privacidade dos dados do usuário;
- Funcionamento offline: Permitiria o uso de IAs mesmo sem conexão com a internet.

Leia mais:
- Como é a rotina dos brasileiros que treinam IAs
- ChatGPT-4.5: o que é, para que serve e como usar a nova versão do chatbot da OpenAI
- 6 funções que o Perplexity tem e o ChatGPT não
Assim, o desenvolvimento do BitNet b1.58 pela Microsoft aponta para um futuro no qual a inteligência artificial pode se tornar mais acessível, eficiente e sustentável. A ver como essa ideia vai, de fato, sair do papel.
O post E agora, Nvidia? Microsoft cria IA que roda dentro de PCs normais apareceu primeiro em Olhar Digital.