Operator: o novo agente da OpenAI que promete controlar seu computador

A OpenAI pode estar próxima de lançar uma ferramenta de inteligência artificial (IA) capaz de assumir o controle do computador do usuário e executar ações de forma autônoma. A novidade, conhecida como “Operator”, tem sido alvo de rumores e especulações há meses, mas novas evidências sugerem que o lançamento pode estar mais próximo do que nunca.

O engenheiro de software Tibor Blaho, conhecido por revelar informações precisas sobre produtos de IA antes do anúncio oficial, afirmou ter encontrado evidências concretas sobre a existência do Operator. Publicações como a Bloomberg já haviam mencionado o sistema, descrito como um agente capaz de realizar tarefas como escrever códigos e reservar viagens de forma independente.

Indícios de lançamento do Operator da OpenAI em janeiro

  • De acordo com o portal The Information, a OpenAI planeja lançar o Operator ainda em janeiro.
  • Blaho descobriu, no último fim de semana, códigos na versão para macOS do cliente do ChatGPT que incluem atalhos para “Alternar Operator” e “Forçar Encerramento do Operator”.
  • Além disso, referências ao sistema já aparecem no site da OpenAI, embora ainda estejam ocultas para o público.
  • Outra descoberta relevante envolve tabelas comparativas de desempenho do Operator em relação a outros sistemas de IA. Se essas tabelas forem precisas, elas mostram que o Operator pode superar outros modelos em testes específicos, mas ainda está longe de alcançar a precisão humana em todas as tarefas.

Desempenho e limitações

Nos testes de benchmark realizados no OSWorld, que simula um ambiente real de uso de computador, o suposto modelo por trás do Operator, chamado “OpenAI Computer Use Agent (CUA)”, obteve 38,1% de acertos. Esse resultado supera o modelo da Anthropic, mas fica aquém dos 72,4% obtidos por humanos.

Logo da OpenAI em um smartphone
Modelo da OpenAI por trás do Operator se chama OpenAI Computer Use Agent (CUA) (Imagem: TY Lim/Shutterstock)

Curiosamente, o CUA teve um desempenho melhor no WebVoyager, que mede a capacidade de navegação e interação com sites, mas apresentou dificuldades no WebArena, outro benchmark web. Em tarefas mais específicas, como a criação de carteiras de Bitcoin, o modelo obteve apenas 10% de sucesso.

Concorrência e preocupações de segurança

A possível chegada do Operator ocorre em meio à disputa crescente no mercado de agentes de IA. Empresas como Anthropic e Google já investem na tecnologia, considerada por especialistas como a próxima grande tendência da inteligência artificial. Segundo a Markets and Markets, esse mercado pode atingir um valor de US$ 47,1 bilhões até 2030.

Embora promissores, os agentes de IA também levantam questões de segurança. Um gráfico vazado sugere que o Operator se saiu bem em avaliações de segurança, incluindo testes para resistir a tentativas de realizar atividades ilícitas. A OpenAI estaria investindo tempo no aprimoramento desses aspectos, o que justificaria o longo período de desenvolvimento.

Logo da Anthropic
Cofundador da OpenAI criticou a Anthropic por não incluir mitigações de segurança adequadas em seu agente de IA (Imagem: Tada Images/Shutterstock)

No entanto, a empresa enfrenta críticas sobre possíveis falhas de segurança e priorização de lançamentos comerciais em detrimento de avaliações mais rigorosas. Recentemente, Wojciech Zaremba, cofundador da OpenAI, criticou a Anthropic por lançar um agente sem mitigações de segurança adequadas, afirmando que a OpenAI seria duramente criticada se tomasse atitude semelhante.

O Tech Crunch entrou em contato com a OpenAI, mas a empresa ainda não se pronunciou oficialmente sobre os vazamentos.

O post Operator: o novo agente da OpenAI que promete controlar seu computador apareceu primeiro em Olhar Digital.

Adicionar aos favoritos o Link permanente.