Claude AI Vertragsprüfung: Risiken, Grenzen & Alternativen

24.6.2026

•

Min Read

David A. Bloch

Inhaltsverzeichnis

Claude Opus 4.7 erzielte 90,9 % auf dem Harvey BigLaw Bench — dem Branchenstandard für KI-Performance bei echter Rechtsarbeit. Dieser Wert gilt jedoch unter einer Bedingung, die viele Teams übersehen: Er basiert auf der zweckspezifisch konfigurierten Plattform von Harvey, nicht auf einem allgemeinen Claude-Deployment. In diesem Beitrag erklärt Legartis-CEO David A. Bloch, was Claude Legal wirklich ist, welche vier Risikokategorien beim ungefilterten Einsatz für die Unternehmens-Vertragsprüfung entstehen — und was zweckgebaute Legal-AI-Software grundlegend anders macht.

Im vergangenen Jahr hat Anthropic einen ernsthaften Vorstoß ins Rechtswesen unternommen — mit einem dedizierten Legal-Solutions-Layer für Claude, einschließlich praxisspezifischer Plugins, Konnektoren zu Tools, die Rechtsteams bereits nutzen, wie iManage, NetDocuments, DocuSign und Thomson Reuters, sowie zweckspezifischen Integrationen mit führenden Legal-Plattformen. Zuletzt veröffentlichten sie im April 2026 Claude Opus 4.7, der auf Harvey's BigLaw Bench 90,9 % erzielte — dem Benchmark, der zum Branchenstandard für die Messung von KI-Performance bei echter Rechtsarbeit geworden ist.

Und die Fragen, die sich jede Rechts- und Beschaffungsführungskraft gerade stellt, sind: Ist Claude wirklich bereit, echte Verträge zu prüfen? Und birgt der direkte Einsatz Risiken?

Nachdem ich jahrelang Vertrags-KI für Enterprise-Rechtsteams in ganz Europa aufgebaut habe, erkläre ich hier genau, was Claude AI für Rechtsteams zu bieten hat, wo es tatsächlich nützlich ist, wo es bei echten Verträgen Risiken erzeugt — und alles, was Sie wissen müssen, wenn Sie Claude für Rechtsarbeit in Betracht ziehen.

Was Claude Legal wirklich ist

Der Name Claude Legal ist etwas irreführend. Claude ist Anthropics allgemeiner KI-Assistent — ähnlich wie ChatGPT — und damit darauf ausgelegt, Fragen zu beantworten, Dokumente zusammenzufassen, Texte zu verfassen und bei Analysen zu beliebigen Themen zu helfen. Im Kern ist Claude kein Rechtsprodukt. Es ist eine allgemeine KI, die rechtliche Aufgaben übernehmen kann, wenn man sie entsprechend anleitet.

Was sich im vergangenen Jahr geändert hat: Anthropic hat auf Claude einen dedizierten Legal-Solutions-Layer aufgebaut, zugänglich über Claude Cowork — ihre agentische Desktop-Applikation. Dieser umfasst praxisspezifische Plugins für Commercial Legal, Corporate Legal, IP und Litigation sowie Konnektoren zu iManage, NetDocuments, DocuSign, Ironclad und Thomson Reuters.

Der Workflow ist sprachgesteuert: Sie können Claude bitten, die Redlines einer Gegenpartei gegen Ihr Playbook zu prüfen, Change-of-Control-Klauseln in einem M&A-Datenraum zu markieren oder ein Recherche-Memo zu regulatorischen Vorgaben zu erstellen — und es führt diese mehrstufigen Aufgaben von Anfang bis Ende aus. Anthropics eigene Dokumentation stellt klar, dass alle von Claude erstellten rechtlichen Outputs vor der Verwendung von einem zugelassenen Anwalt geprüft werden sollten.

Auf Modellebene kann Claude bis zu 200.000 Token in einer Sitzung verarbeiten — etwa 500 Seiten Text. Für die Rechtsarbeit bedeutet das, dass ein langer Fusionsvertrag oder ein vollständiges Due-Diligence-Paket im Kontext gehalten werden kann, ohne den Überblick über Querverweise zwischen Klauseln zu verlieren.

Für bestimmte Workflows ist der Einsatz von Claude sinnvoll. Eine erste Durchsicht eines Standard-NDAs, eine verständliche Zusammenfassung eines komplexen Abschnitts für Nicht-Juristen oder eine schnelle Recherchearbeit zur Orientierung — dafür ist es ein nützliches Werkzeug. Claude ist klar eine leistungsfähige Grundlage. Aber das Problem beginnt, wenn Enterprise-Rechtsteams versuchen, es ohne Sicherheitsvorkehrungen bei echten Verträgen einzusetzen.

Die Risiken des KI-Einsatzes für die Vertragsprüfung auf Enterprise-Ebene

1. Die Genauigkeits- und Konfigurationslücke

Hier werden die Zahlen wichtig. Anthropics neuestes Modell, Claude Opus 4.7, erzielte 90,9 % auf Harvey's BigLaw Bench — das klingt beeindruckend, und das ist es auch. Aber dieser Wert spiegelt Claude wider, das über Harveys zweckspezifische Legal-Plattform läuft — mit aller Konfiguration, allen Konnektoren und dem rechtsspezifischen Tuning, das dies erfordert.

Wenn Ihr Team Claude direkt einsetzt — als allgemeinen Assistenten, ohne rechtsspezifisches Playbook, ohne strukturierte Konnektoren zu Ihren Dokumentensystemen und ohne spezialisiertes Training auf Ihre Vertragsarten — erhalten Sie nicht diese 90,9 %.

Allgemeine KI-Modelle halluzinieren auch weiterhin, das heißt, sie erzeugen selbstsichere, plausibel klingende Ausgaben, die vollständig falsch sind. In einem bekannten Fall aus dem Jahr 2023 wurde der New Yorker Anwalt Steven Schwartz sanktioniert, nachdem er ein Schriftsatz mit sechs KI-generierten Fallzitaten eingereicht hatte, die sich als vollständig erfunden herausstellten — und dieses Risiko ist mit neueren Modellen nicht verschwunden. Laut Pactly erfordert der Einsatz eines allgemeinen KI-Tools für mehr als allgemeines Brainstorming eine 100-prozentige menschliche Überprüfung — was den Großteil des angestrebten Effizienzgewinns zunichte macht.

2. Keine Playbook-Durchsetzung — die KI kennt Ihre Regeln nicht

Claude hat keine eingebettete Kenntnis Ihrer Rückfallpositionen, Ihrer Verhandlungshistorie oder Ihrer internen Risikobereitschaft. Es könnte eine Änderung vorschlagen, die auf dem Papier gut aussieht, aber gegen eine zentrale Unternehmensrichtlinie verstößt — etwa die Zustimmung zu einer Schadensersatzklausel, die Ihr CFO niemals akzeptieren würde, oder eine Haftungsobergrenze, die weit unter Ihrer Standardschwelle liegt.

Und da jeder Prompt bei null beginnt, hat die KI kein Gedächtnis dafür, wie Ihr Team die letzten 500 Verträge verhandelt hat. Sie erhalten unterschiedliche Ergebnisse — je nachdem, wer das Tool verwendet, an welcher Art von Geschäft gearbeitet wird und wo der Vertrag angesiedelt ist.

3. Datensicherheit und DSGVO-Exposition

Dies ist das größte Risiko für europäische Unternehmen. Wenn ein Vertrag personenbezogene Daten enthält — Namen, Unterschriften, Adressen oder andere identifizierende Informationen — ist das Hochladen in ein allgemeines KI-Tool ohne die richtigen Sicherheitsgarantien ein direkter Verstoß gegen die DSGVO. Dasselbe gilt für den CCPA in den USA.

Die Strafe für einen DSGVO-Verstoß beträgt bis zu 4 % des weltweiten Jahresumsatzes oder 20 Millionen Euro — je nachdem, welcher Betrag höher ist. Und europäische Behörden haben OpenAI bereits wegen DSGVO-Bedenken sanktioniert. Es besteht auch eine Gefährdung des Anwalt-Mandanten-Privilegs: In dem Moment, in dem Sie ein privilegiertes Dokument in eine Consumer-Version von Claude hochladen, wird der Vertraulichkeitsschutz, den das NDA oder der Vertrag gewähren sollte, kompromittiert.

Anthropic bietet Enterprise-Pläne mit Datenverarbeitungsverträgen, Audit-Logs und Aufbewahrungskontrollen an — aber deren ordnungsgemäße Einrichtung erfordert erheblichen Aufwand von Ihren Rechts-, IT- und Compliance-Teams. Und die meisten Teams, die Claude ohne weiteres einsetzen, überspringen all das.

4. Ihre Prompts können in Rechtsstreitigkeiten verwendet werden

Das ist das Risiko, von dem die meisten Teams erst erfahren, wenn sie bereits in einem Rechtsstreit stecken. Ein Beratungsschreiben der Anwaltskanzlei Harris Beach Murtha vom September 2025 macht es explizit: Wenn Prompts Ihres Teams oder Claudes Antworten mit etwas zusammenhängen, was vor Gericht verhandelt wird, können die Anwälte der Gegenseite diese anfordern.

Ihr konkretes Beispiel ist eines, das jedes Vertragsteam kennen sollte: Wenn ein Mitarbeiter Claude verwendet hat, um einen Vertragsabschnitt zu bearbeiten, der später als irreführend bezeichnet wird, könnten der Inhalt des Prompts und die vorgeschlagenen Änderungen der KI dazu verwendet werden, zu zeigen, was der Mitarbeiter wusste oder was er versuchte zu tun.

Dies ist nicht mehr theoretisch. Im Mai 2025 erließ ein Bundesrichter im Southern District of New York eine Sicherungsanordnung im Fall New York Times gegen OpenAI, die OpenAI anwies, alle Consumer-Output-Logs aufzubewahren — das heißt, selbst manuell gelöschte Chats stehen nun unter einem Legal Hold und sind theoretisch vorladungsfähig. Jedes Mal, wenn Sie ein sensibles Rechtsdokument in die Consumer-Version von Claude hochladen, riskieren Sie den Verlust des Rechtsschutzes, der es bisher privat gehalten hat.

Was zweckgebaute Legal-AI-Software anders macht

Wenn Sie ein KI-Tool für die Vertragsprüfung suchen, das nicht mit den oben genannten Genauigkeits-, Compliance- und Privilege-Problemen behaftet ist, buchen Sie eine Demo bei Legartis — einer KI-Vertragsplattform, die speziell für Enterprise-Rechts-, Vertriebs- und Beschaffungsteams entwickelt wurde.

Genauigkeit und Playbook-Durchsetzung

Zweckspezifische Legal-AI-Plattformen werden auf bestimmte Vertragsarten trainiert und für die Klausel-Extraktion optimiert — genau dort, wo die Leistungslücke in der Praxis am deutlichsten sichtbar wird. Eine allgemeine Claude-Konfiguration ohne rechtsspezifisches Tuning liefert inkonsistente Ergebnisse bei strukturierten Aufgaben wie der Klausel-Extraktion — insbesondere über verschiedene Jurisdiktionen, Vertragssprachen und Dealtypen hinweg.

Zweckspezifische Plattformen, die für DACH-Verträge validiert wurden, können beispielsweise einen F1-Wert von über 90 % bei der Klausel-Extraktion für diese spezifischen Vertragsarten erreichen — ein bedeutender Unterschied für jedes Rechtsteam, das eine Prüfentscheidung auf Basis der KI-Ergebnisse trifft.

Auf der Playbook-Seite ermöglichen diese Plattformen, die internen Verhandlungsregeln, Rückfallpositionen und Risikotoleranzen Ihres Unternehmens in Prüflogik umzuwandeln, die die KI tatsächlich auf jeden Vertrag anwendet. Statt generischer Rechtsvorschläge prüft die KI den Vertrag anhand Ihrer eigenen Standards — was konsistente Ergebnisse im gesamten Team liefert, abgestimmt auf Entscheidungen, die Ihr Unternehmen bereits getroffen hat. Das ist es, was AI Quality messbar und nachvollziehbar macht, anstatt eine Blackbox-Zahl zu sein.

DSGVO-Compliance und Jurisdiktion — von Anfang an, nicht nachträglich ergänzt

Eine zweckgebaute europäische Legal-AI-Plattform ist von Grund auf DSGVO-konform — das bedeutet, Sie verbringen keine Monate damit, Enterprise-Verträge, Audit-Logs und Datenverarbeitungszusätze zu konfigurieren, nur um grundlegende gesetzliche Standards zu erfüllen. Daten werden in der Regel in Europa gehostet und niemals an US-Hyperscaler oder Dritte weitergegeben — womit Sie die zuvor beschriebene Privilege- und Datenresidenz-Exposition vermeiden.

Die besseren Plattformen werden zudem auf lokalen Rechtskorpora trainiert — deutschen, schweizerischen und österreichischen Verträgen unter Zivilrecht — das ist die Art von jurisdiktionsspezifischer Nuance, die eine allgemeine KI, die auf dem offenen Web trainiert wurde, jedes Mal verfehlen wird. Wenn Sie DSGVO-konforme KI-Software für die Vertragsprüfung für ein europäisches oder multinationales Team evaluieren, ist diese Unterscheidung nicht optional.

Warum Legartis

Legartis ist speziell für diesen Anwendungsfall entwickelt worden. Es erreicht einen F1-Wert von über 90 % bei der Klausel-Extraktion, läuft auf Schweizer Infrastruktur, ist von Anfang an DSGVO-konform und wurde auf Millionen von Verträgen trainiert.

Es umfasst auch den Playbook Creator — eine agentische Funktion, die Ihre internen Regeln in durchsetzbare Prüflogik für alle Ihre Verträge umwandelt — in Stunden. Einer unserer Kunden nutzte den Playbook Creator, um ein vollständiges Beschaffungsvertrags-Playbook zu erstellen, das sein Team auf zwei Monate manuelle Arbeit geschätzt hatte — und er hatte es an einem einzigen Vormittag fertig, mit vollständiger Transparenz darüber, wie die KI seine Regeln anwendete.

Meine Sichtweise: Allgemeine KI ist ein guter Ausgangspunkt. Zweckgebaute Legal-AI-Software ist das, was Sie tatsächlich einsetzen.

Sollte Ihr Team Claude für die Vertragsprüfung nutzen?

Für risikoarme, einmalige Aufgaben — eine schnelle Zusammenfassung, eine verständliche Erklärung eines Abschnitts für Nicht-Juristen, eine erste Durchsicht eines Standard-NDAs — ist Claude ein leistungsfähiges und zugängliches Werkzeug. Es gibt Anwendungsfälle, in denen das sinnvoll ist.

Aber für die Enterprise-Vertragsprüfung im großen Maßstab — wo Konsistenz zählt, wo die Verhandlungsstandards Ihres Unternehmens durchgesetzt werden müssen, wo DSGVO-Exposition und Prozessrisiken real sind — ist der Einsatz von Claude Legal für die Vertragsprüfung ohne eine zweckspezifische Schicht darunter ein erhebliches Risiko, das die meisten Teams nicht vollständig berücksichtigen, bis etwas schiefläuft.

Wenn Ihr Team monatlich ein hohes Volumen an Verträgen prüft und Sie sehen möchten, wie eine zweckgebaute Plattform Genauigkeit, Playbook-Durchsetzung und Datencompliance ohne diese Risiken handhabt, buchen Sie eine Demo bei Legartis. Wir zeigen Ihnen, wie die Plattform mit Ihren eigenen Verträgen funktioniert und was das Onboarding Ihres Teams konkret bedeuten würde.

David A. Bloch ist CEO von Legartis, einer Enterprise-KI-Plattform für Vertragsprüfung, die für europäische Rechtsteams entwickelt wurde.

Starte heutemit Legartis!

Talk to us about your business case or test Legartis right away!

DSGVO-konform

Servers in Switzerland and Europe

ISO 27001-certified