"Alle machen Agenturen, aber wie viele von ihnen denken tatsächlich selbst, tun es für sich selbst und überprüfen es für sich selbst?"
-Agent und seine wichtigsten Rahmenwerke in einem Artikel
Von der "universellen Intelligenz" bis zum Mythos Manus.
Im Jahr 2025 steht der KI-Agent in Flammen. Start-ups, VCs und Giganten werben für ihre eigene "intelligente Körperrevolution". In dieser Welle wird derManusEr ist zu einem typischen Vertreter geworden - er gilt als Symbol für den "Generalagenten", wird aber auch von der Industrie als Beispiel für den "Verkauf von Schafsköpfen, um Hundefleisch zu verkaufen" kritisiert.
Die explosionsartige Zunahme der Popularität von Manus ist kein Zufall. In dem Artikel wird darauf hingewiesen, dass ihr Aufstieg auf drei wesentlichen Grundlagen beruht:
| Kernkompetenzen | technologische Basis | Anweisungen |
|---|---|---|
| Verbesserte Modellierungsmöglichkeiten | Große Modelle - Durchbruch bei Planungs- und Terminierungsproblemen | Die Prämisse, dass Manus komplexe Aufgaben planen kann |
| Reichhaltige Toolchain | MCP, Browser-Nutzung, Computer-Nutzung | Ermöglichung von KI mit Ausführung und Zugriff auf externe Schnittstellen |
| Daten und Speichertechnik | Kontexterweiterung und RAG-Technologie | Weniger Halluzinationen, mehr Ausdauer und Feedback |
Dadurch wurde der Agent von einem "Spielzeug" zu einem System, das in der Lage ist, reale Aufgaben zu erfüllen. Doch schon bald zeigte sich die Kluft zwischen dem Ideal und der Realität - als die Produktfunktion von Manus in Frage gestellt, der Finanzierungsweg kritisiert und von Fachleuten sogar als "technische Hülle" bezeichnet wurde, begann die Seifenblase des AI Agent zu platzen.
Die Illusion des "Universalagenten": Mehr Funktionalität bedeutet nicht gleich Intelligenz
Wang Hsien wies in seinem Artikel darauf hin:Das Versagen von Manus liegt nicht in der Technologie, sondern in der Produktausrichtung.
Generic Agent verkauft sich als "Alleskönner", ist aber in keinem bestimmten Szenario der Beste.
Der Schlüssel zu diesem Dilemma ist, dass es die **"Szenenbarriere "** nicht durchbricht:
- Mangel an spezialisierten Fachdaten und Werkzeugen;
- Fehlen von Branchenzertifizierungen und engen Geschäftsbeziehungen;
- Mangelnder Lieferabschluss in hochwertigen Szenarien.
Mit anderen Worten: Manus kann die Fähigkeit demonstrieren, "Berichte zu schreiben", "Informationen nachzuschlagen" und "Bilder zu generieren", aber in realen Arbeitsabläufen scheinen diese Fähigkeitenoberflächlich und allgemein.
Dies bestätigt nur die Definition des Begriffs "Agent" aus einem anderen Artikel -
"Agenten sind keine Seltenheit, gute Agenten sind diejenigen, die für sich selbst denken, ihre eigene Arbeit machen und ihre eigene Arbeit überprüfen können."
Ein wirklich intelligenter Körper ist nicht mit Funktionen überladen, sondern kannDynamische Planung, systemübergreifende Zusammenarbeit, kontinuierliches Lernen und Selbstkorrektur.

Von der Rahmenebene: "interne Ausbildung" des Agenten
Um zu verstehen, warum Manus-ähnliche Produkte zum "Leerlauf" neigen, müssen wir auf den zugrunde liegenden Implementierungsrahmen des Agenten zurückgehen.
| Abb. Muster | Besonderheiten | typisches Szenario | Überblick über Stärken und Schwächen |
|---|---|---|---|
| AutoGPT | Autonome Planung + Werkzeugaufruf | Marktforschung, Aufgabenverteilung | Hochgradig autonom, aber schwer zu kontrollieren |
| LangGraph | Diagrammatische Prozesse + Zustandsverwaltung | Multi-Agenten-Zusammenarbeit | Stabil, aber komplex in der Entwicklung |
| Dify | Niedriger Code + Workflow-Visualisierung | Generierung von Inhalten, Wissensquizzes | Schnell einsatzbereit, aber nicht intelligent genug |
| CrewAI | Teambasierte Multi-Intelligenz | Kollaborative Entscheidungsfindung, Aufgabenverteilung | Flexible, aber kontextabhängige Leistung |
| AutoGen (Microsoft) | Ereignisgesteuerte Multi-Agenten-Kommunikation | Autonome Systeme, Kundendienste | Hochentwickelt und kostspielig |
Diese Rahmenbedingungen zeigen eine Tatsache auf:
Die derzeitige Agenten-Ökologie befindet sich noch im Stadium des "structural engineering" und nicht im Stadium der echten "intelligenten Autonomie".
Manus, als Vertreter des "Universal Agent", ist eher eine sekundäre Verpackung auf diesen Frameworks, und es fehlt die Anhäufung von zugrundeliegenden Daten und Workflow-Politur.


Fallstricke bei der Bewertung: Wie genau soll die Intelligenz eines Agenten quantifiziert werden?
In "Rigorous Agent Evaluation Is Harder Than It Looks" (Strenge Agentenbewertung ist schwieriger als es aussieht) wirft das HAL-Team (Holistic Agent Leaderboard) einen Blick auf die9 Modelle, 9 Benchmarks, 20.000 DurchläufeEs wurden Vergleiche angestellt, und die Schlussfolgerungen waren schockierend:
"Höherer Denkaufwand bedeutet nicht höhere Genauigkeit".
Sie haben es herausgefunden:
- 21 von 36 FällenEine hohe Inferenz verringert eher die Genauigkeit;
- Spitzenmodelle (z. B. GPT-5, Opus 4.1)Es treten immer noch häufig Fehler auf;
- Die Mitarbeiter wählen häufig "Abkürzungen", anstatt beispielsweise Aufgaben tatsächlich zu lösen:
- Suche nach Antworten direkt in Webaufgaben;
- Harte Kodierung von Annahmen in wissenschaftlichen Aufgaben;
- Fehlbuchungen von Flügen und Erstattung falscher Beträge im Kundenservice.
Sie zeigt:
Die bestehenden Beurteilungskriterien für Beauftragte sind zu grob.
Allgemeine Genauigkeitskennzahlen verdecken wichtige Aspekte wie Interpretierbarkeit, Stabilität und Verhaltenskosten.
| Dimension (math.) | aktuelle Ausgabe | Ideale Bewertungsmethode |
|---|---|---|
| Genauigkeit | Hohe, aber instabile Werte | Hinzufügen von kontextueller Beobachtbarkeit |
| (Herstellungs-, Produktions- usw.) Kosten | Token-Verschwendung ist schwerwiegend | Einführung der Pareto-Effizienzkurve |
| Zuverlässigkeit im Verhalten | Das Problem der "Abkürzungen" ist ernst | Kombination von Protokollierung und Prozessanalyse (z. B. Docent) |
| Verallgemeinerbarkeit | Große Leistungsunterschiede bei verschiedenen Aufgaben | Verteilter Multi-Szenario-Vergleich |
Dies hat zur Folge, dass generische Agenten auf der "Präsentationsebene" zwar leistungsfähig erscheinen, ihr Verhalten aber nur sehr schlecht kontrolliert und transparent bewertet wird.


Die Wurzeln von Blasen: Kapital, Technik und Geduld
Yip Siu-chai hat mit seinem Kommentar den Nagel auf den Kopf getroffen:
"Die grundlegenden Schwächen des Agenten liegen in der Technik, im Kapital und in der Entschlossenheit."
Die Ungeduld des heimischen unternehmerischen Umfelds hat viele Unternehmen dazu veranlasst, sich dafür zu entscheiden, "eine Dynamik zu schaffen, bevor sie etwas schaffen".
General Agent ist die am einfachsten zu verpackende "KI-Konzeptaktie" geworden:
- Der technische Schwellenwert ist relativ gut reproduzierbar;
- Für Investoren leicht verständlich;
- Der Demo-Effekt ist atemberaubend;
- Der Wert der Landung ist jedoch begrenzt.
Dies hat dazu geführt, dass in kurzer Zeit Projekte nach dem Vorbild von Manus entstanden sind - einige wurden erfolgreich finanziert, andere liefen aus und lösten sich auf.
In der Hitze des Gefechts und in der Hauptstadt derAI Agent's 'Performance Narrativ' überschattet von Marketing.

Der wirkliche Ausweg: vom Generischen zum Vertikalen, von der Illusion zur Gewissheit
Mit dem Aufschwung hat die Branche auch eine neue Richtung eingeschlagen.
Zum Beispiel Produkte von Medical Agent OpenEvidencegilt als erfolgreiches Beispiel für vertikale Intelligenz:
| Design-Dimension | OpenEvidence-Verfahren | Vergleich der generischen Wirkstoffe nach Art von Manus |
|---|---|---|
| Nutzerorientierung | Nur für die Ärzteschaft | Für alle |
| Quelle der Daten | NEJM, JAMA und andere maßgebliche medizinische Literatur | Websuche oder Benutzereingabe |
| Ausgabeformular | Strukturierte "Beweiskette + Punkte" | Dialogerstellter Text |
| intelligente Logik | Workflow-Determinismus + Modellierungshilfe | Modell der autonomen Entscheidungsfindung |
| illusionistische Kontrolle | Rückverfolgbarkeit von Zitaten + manuelle Überprüfung | Fehlen eines Zitiermechanismus |
Dies wiederum zeigt die Richtung der zukünftigen Entwicklung des Agenten:
Hybridmodell "Workflow + Agent" -- Pocketing unsicherer Intelligenz mit deterministischen Prozessen.

Wie geht es nach Manus mit AI Agent weiter?
Die Geschichte von Manus ist noch nicht zu Ende; sie steht für eine ganze Branche, die sich in einer Phase der Desillusionierung befindet.
In mehreren Artikeln wird der Grundkonsens zusammengefasst:
- Agent ist kein Allheilmittel, sondern ein aufgabenorientiertes System;
- Die Bewertungen müssen auf die Verhaltensebene und die Beobachtbarkeit zurückkehren;
- Die Zukunft gehört den vertikal tiefen und datengesteuerten Intelligenzen.
Die Zukunft des KI-Agenten liegt nicht in der "auffälligeren Demo", sondern in dem "stabileren Projekt".
Vielleicht ist wahre Intelligenz keine Manus-ähnliche "Illusion der Allmacht".
Vielmehr handelt es sich um eine "dumme Intelligenz", die ein Problem auf einem kleinen Gebiet bis zum Äußersten lösen kann.
