Anthropic stellt neue KI Funktion zur Computerbedienung vor
Anthropic hat seine neueste Generation von KI-Modellen vorgestellt: Claude 3.5 Sonnet und Claude 3.5 Haiku. Diese beiden Modelle bringen erhebliche Verbesserungen mit sich, insbesondere im Bereich der Softwareentwicklung und Benutzerinteraktion. Besonders interessant ist die neue Fähigkeit zur Computerbedienung, die Claude ermöglicht, Computer ähnlich wie Menschen zu nutzen – ein revolutionärer Schritt in der KI-Entwicklung.
Claude 3.5 Sonnet: Spitzenreiter in der Softwareentwicklung
Der verbesserte Claude 3.5 Sonnet bietet deutliche Fortschritte in der Softwareentwicklung, insbesondere beim agentischen Codieren und der Nutzung von Tools. Laut Anthropic übertrifft das Modell alle öffentlich zugänglichen Systeme, einschließlich spezialisierter Modelle wie OpenAI o1-preview. Im Benchmark SWE-bench Verified steigert Claude 3.5 Sonnet seine Leistung von 33,4 % auf 49,0 %. Auch in der TAU-bench, einer Herausforderung für den Einsatz von Tools, zeigt das Modell starke Verbesserungen in verschiedenen Bereichen wie Einzelhandel und Luftfahrt.
Die Nutzerfeedbacks zeigen, dass Claude 3.5 Sonnet ein großer Fortschritt in der KI-gestützten Softwareentwicklung ist. Unternehmen wie GitLab und Cognition haben deutliche Verbesserungen bei der Planung und Problemlösung festgestellt, während The Browser Company bemerkte, dass Claude 3.5 Sonnet alle zuvor getesteten Modelle übertraf.
Claude 3.5 Haiku: Leistungsstärke trifft auf Erschwinglichkeit
Claude 3.5 Haiku setzt neue Maßstäbe in Bezug auf Geschwindigkeit und Kosten. Das Modell übertrifft sogar das frühere Flaggschiff Claude 3 Opus in vielen Bereichen, darunter auch im Codieren. Mit einer Leistung von 40,6 % auf SWE-bench Verified bietet Claude 3.5 Haiku signifikante Verbesserungen, insbesondere bei der Nutzung von Tools und der personalisierten Datenverarbeitung. Dieses Modell ist besonders gut für Endnutzer-Produkte und spezialisierte Aufgaben geeignet, die niedrige Latenz und präzise Befehlsausführung erfordern.
Claude 3.5 Haiku wird später in diesem Monat für APIs und Plattformen wie Amazon Bedrock und Google Cloud’s Vertex AI verfügbar sein.
Bahnbrechende Fähigkeit zur Computerbedienung
Eine der spannendsten neuen Funktionen ist die Möglichkeit, dass Claude 3.5 Sonnet Computer wie Menschen bedienen kann. Diese Funktion befindet sich derzeit in einer öffentlichen Beta-Phase und ist noch experimentell, erlaubt aber bereits das Sehen von Bildschirmen, Bewegen von Mauszeigern, Klicken von Schaltflächen und das Schreiben von Text. Entwicklern bietet sich die Möglichkeit, Claude für Aufgaben wie Softwaretests oder automatisierte Arbeitsabläufe zu verwenden.
Diese neue Fähigkeit stellt einen bedeutenden Durchbruch dar, da Claude nun in der Lage ist, allgemeine Computerfähigkeiten zu erlernen und anzuwenden. Auf OSWorld, einer Plattform, die KI-Modelle in der Computerbedienung testet, schnitt Claude 3.5 Sonnet besser als alle anderen getesteten Systeme ab.
Sicherheit und Verantwortung bei der Computerbedienung
Obwohl die neue Computerbedienungs-Funktion viel Potenzial bietet, ist sie aktuell noch fehleranfällig. Aktionen wie Scrollen oder Zoomen, die für Menschen selbstverständlich sind, stellen derzeit noch Herausforderungen dar. Um Missbrauch wie Spam oder Betrug vorzubeugen, hat Anthropic neue Klassifikatoren entwickelt, die schädliches Verhalten erkennen sollen. Anthropic betont, dass die Technologie mit Bedacht und für risikolose Aufgaben getestet werden sollte, während sie weiter verbessert wird.
Ein Blick in die Zukunft
Die neuen Modelle und die Fähigkeit zur Computerbedienung bieten Entwicklern und Unternehmen völlig neue Möglichkeiten, KI für komplexe Aufgaben und Arbeitsabläufe einzusetzen. Anthropic erhofft sich durch das Feedback der Entwickler eine rasche Weiterentwicklung dieser Funktion, die in der Zukunft eine breitere Anwendung finden könnte.