Manus e a bolha de agentes de IA: do ideal à desilusão

"Todos estão a fazer o Agente, mas quantos deles pensam realmente por si próprios, fazem-no por si próprios e analisam-no por si próprios?"
-Agent e os seus quadros principais num único artigo


Da "inteligência universal" ao mito de Manus.

Em 2025, o agente de IA está a arder. Startups, VCs e gigantes estão todos a promover a sua própria "revolução do corpo inteligente". Nesta vaga, oManusTornou-se um representante típico - é considerado o símbolo do "Agente Geral", mas também criticado pela indústria como uma amostra de "vender cabeça de ovelha para vender carne de cão".

A explosão de popularidade de Manus não é um acaso. O artigo salienta que a sua ascensão assenta em três grandes suportes fundamentais:

Competências essenciaisbase tecnológicainstruções
Capacidades de modelação melhoradasModelos de grandes dimensões Problemas inovadores de planeamento e programaçãoA premissa de que Manus pode planear tarefas complexas
Cadeia de ferramentas ricaMCP, utilização do browser, utilização do computadorPermitir a IA com execução e acesso a interfaces externas
Engenharia de dados e de memóriaExtensão do contexto e tecnologia RAGRedução das alucinações, aumento da persistência e do feedback

Isto transformou o Agent de um "brinquedo" num sistema capaz de realizar tarefas do mundo real. No entanto, o fosso entre o ideal e a realidade não tardou a aparecer - quando a função do produto Manus foi posta em causa, a via de financiamento foi criticada e até apelidada de "casca de engenharia" pelos colegas, a bolha do AI Agent começou a rebentar.


A ilusão do "agente universal": mais funcionalidade não é igual a inteligência

Wang Hsien salientou-o claramente no seu artigo:O fracasso da Manus não está na tecnologia, mas na direção do produto.
O agente genérico vende-se como um "pau para toda a obra", mas não é o melhor em nenhum cenário específico.

A chave para este dilema é o facto de não quebrar a **"barreira da cena "**:

  • Falta de dados especializados no domínio e de ferramentas;
  • Falta de certificações do sector e de laços comerciais profundos;
  • Falta de encerramento da entrega em cenários de elevado valor.

Por outras palavras, o Manus pode demonstrar a capacidade de "escrever relatórios", "procurar informações" e "gerar imagens", mas em fluxos de trabalho reais, estas capacidades parecem sersuperficial e geral.

Isto apenas confirma a definição de Agente de um outro artigo -.

"Os agentes não são invulgares, são aqueles que conseguem pensar por si próprios, fazer o seu próprio trabalho e rever o seu próprio trabalho que são bons agentes."

Um corpo verdadeiramente inteligente não está repleto de caraterísticas, mas é capaz dePlaneamento dinâmico, colaboração entre sistemas, aprendizagem contínua e autocorreção.


A nível do quadro: a "formação interna" do agente

Para compreender por que razão os produtos do tipo Manus tendem a ficar "inactivos", temos de voltar ao quadro de implementação subjacente do Agente.

fig. padrãoespecificidadescenário típicoVisão geral dos pontos fortes e fracos
AutoGPTPlaneamento autónomo + invocação de ferramentasEstudos de mercado, repartição de tarefasAltamente autónomo mas difícil de controlar
LangGraphProcessos Diagramáticos + Gestão de EstadosColaboração Multi-AgenteEstável, mas de desenvolvimento complexo
DificarBaixo código + Visualização do fluxo de trabalhoGeração de conteúdos, questionários de conhecimentosRápido para começar, mas não suficientemente inteligente
TripulaçãoAIMulti-inteligência em equipaTomada de decisões em colaboração, atribuição de tarefasDesempenho flexível mas dependente do contexto
AutoGen (Microsoft)Comunicação multiagente orientada para eventosSistemas autónomos, serviços ao clienteAltamente projetada e cara

Estes quadros revelam um facto:

A atual ecologia de agentes está ainda na fase da "engenharia estrutural" e não na verdadeira "fase da autonomia inteligente".

O Manus, enquanto representante do "Agente Universal", é mais uma embalagem secundária nestes quadros e carece da acumulação de dados subjacentes e do aperfeiçoamento do fluxo de trabalho.


Armadilhas da avaliação: como quantificar exatamente a inteligência de um agente?

Em "A avaliação rigorosa de agentes é mais difícil do que parece", a equipa do HAL (Holistic Agent Leaderboard) analisa a9 modelos, 9 padrões de referência, 20.000 execuçõesForam feitas comparações e as conclusões foram chocantes:

"Maior esforço de raciocínio não significa maior precisão."

Descobriram-no:

  • 21 em 36 casosA inferência elevada reduz a exatidão;
  • Modelos de topo (por exemplo, GPT-5, Opus 4.1)Os erros continuam a ser frequentes;
  • Os agentes escolhem frequentemente "atalhos" em vez de resolverem efetivamente as tarefas, por exemplo:
    • Procurar respostas diretamente nas tarefas Web;
    • Pressupostos de codificação rígida em tarefas científicas;
    • Reserva de voos indevidamente e reembolso de montantes incorrectos em tarefas de serviço ao cliente.

Mostra:
Os actuais critérios de avaliação dos agentes são demasiado rudimentares.
Os indicadores genéricos de exatidão ocultam questões fundamentais como a interpretabilidade, a estabilidade e os custos comportamentais.

dimensão (matemática)edição atualMétodo de avaliação ideal
exatidãoValores elevados mas instáveisAdicionar observabilidade contextual
custos (de fabrico, de produção, etc.)O desperdício de fichas é graveIntrodução da curva de eficiência de Pareto
Fiabilidade comportamentalO problema dos "atalhos" é graveCombinar o registo com a análise de processos (por exemplo, Docent)
generalizaçãoGrandes variações de desempenho entre tarefasComparação distribuída em vários cenários

Consequentemente, os agentes genéricos podem parecer poderosos ao "nível da apresentação", mas o seu comportamento é muito pouco controlado e avaliado de forma transparente.


As raízes das bolhas: capital, engenharia e paciência

Yip Siu-chai acertou em cheio nos seus comentários:

"As falhas fundamentais do agente estão na engenharia, no capital, na determinação."

A impaciência do ambiente empresarial nacional levou muitas empresas a optarem por "criar um impulso antes de criar coisas".
O General Agent tornou-se o "stock concetual de IA" mais fácil de empacotar:

  • O limiar tecnológico é relativamente reproduzível;
  • Fácil de compreender para os investidores;
  • O efeito Demo é espetacular;
  • No entanto, o valor de aterragem é limitado.

Esta situação levou ao aparecimento de projectos do tipo Manus num curto espaço de tempo - alguns financiados com êxito, outros que se esgotaram e se dissolveram.
No calor do momento e na capital doA "narrativa do desempenho" do agente de IA ofuscada pelo marketing.


A verdadeira saída: do genérico ao vertical, da ilusão à certeza

Sob a bolha, a indústria também tomou um novo rumo.
Por exemplo, produtos de agentes médicos OpenEvidenceé considerada uma amostra bem sucedida de inteligências verticais:

dimensão do desenhoPráticas OpenEvidenceComparação de agentes genéricos do tipo Manus
orientação para o utilizadorServir apenas a comunidade médicaPara todos
Fonte de dadosNEJM, JAMA e outra literatura médica autorizadaPesquisa na Web ou introdução do utilizador
formulário de saídaCadeia de provas estruturada + pontosTexto gerado pelo diálogo
lógica inteligenteDeterminismo do fluxo de trabalho + assistência à modelaçãoModelo de tomada de decisão autónoma
controlo ilusionistaRastreabilidade das citações + verificação manualFalta de mecanismo de citação

Esta viragem revela a direção da futura evolução do agente:

"Modelo híbrido "Workflow + Agente -- A inteligência incerta com processos determinísticos.


Depois de Manus, para onde vai o AI Agent?

A história de Manus não acaba aqui; representa todo um sector em fase de desilusão.
Como vários artigos transmitem coletivamente o consenso central:

  1. O agente não é uma panaceia, mas um sistema orientado para as tarefas;
  2. As avaliações devem regressar ao nível comportamental e à observabilidade;
  3. O futuro pertence às inteligências verticalmente profundas e orientadas para os dados.

O futuro do agente de IA não está na "demonstração mais vistosa", mas no "projeto mais estável".
Talvez a verdadeira inteligência não seja uma "ilusão de omnipotência" do tipo Manus.
Pelo contrário, é a "inteligência burra" que pode resolver um problema ao extremo numa pequena área.

Para mais produtos, consultar

Ver mais em

ShirtAI - Inteligência penetrante O Grande Modelo do AIGC: inaugurando uma era de dupla revolução na engenharia e na ciência - Penetrating Intelligence
1:1 Restauração de Claude e GPT Site oficial - AI Cloud Native Aplicação de jogos em direto Leitor de visualização de desporto HD global (recomendado) - Blueshirt Technology
Serviço de trânsito baseado na API oficial - API GPTMeta Ajuda, alguém pode dar algumas dicas sobre como fazer perguntas no GPT? - Conhecimento
Loja digital de bens virtuais globais - Global SmarTone (Feng Ling Ge) Quão poderosa é a funcionalidade Claude airtfacts que o GPT instantaneamente não cheira bem? -BeepBeep