Zum Inhalt springen
AML READY Wiki
AML READY · M5

KI in der Geldwäsche-Prävention: Transaction Monitoring, Screening, Bias

Wie Künstliche Intelligenz im AML-Monitoring eingesetzt wird, der Unterschied zu regel-basierten Systemen, EU-AI-Act-Hochrisiko-Klassifikation und die zentralen Bias-Risiken.

Prof. Dr. Alexander HoltermannStand: 28. Mai 20264 Min Lesezeit

KI im AML-Monitoring ist kein Zukunfts-Thema mehr — sie ist Standard in jeder größeren Bank. Wer das Thema kennt, versteht die Stärken, die Risiken und vor allem die Compliance-Konsequenzen.

Regel-basiert versus Machine Learning

Klassische Transaction-Monitoring-Systeme arbeiten regel-basiert: Schwellenwerte, Schwellenwert-Überschreitungen, Pattern-Recognition über harte Bedingungen. Ein Beispiel: Wenn ein Konto in 30 Tagen mehr als zehn Bareinzahlungen unter 9.500 Euro registriert, löst die Regel einen Alert aus.

Regel-basierte Systeme sind transparent, BaFin-prüffähig und mathematisch nachvollziehbar. Aber sie haben eine hohe False-Positive-Rate (typisch 90 bis 95 Prozent) und sind blind gegenüber Patterns, die nicht explizit modelliert wurden.

Machine-Learning-Modelle erkennen Patterns datengetrieben. Aus historischen Verdachtsmeldungen und Negativ-Fällen lernen Modelle, welche Kombinationen aus Kunden-Profil, Transaktions-Sequenz und externen Signalen statistisch relevant sind. Bestes-Practice-Resultat: False-Positive-Reduktion um 50 bis 70 Prozent bei vergleichbarer Treffer-Rate.

Hybrid-Architekturen sind heute Standard

In der Praxis arbeitet kein modernes System rein ML-basiert. Standard ist die Hybrid-Architektur: regel-basierte Erst-Stufe für regulatorisch zwingende Indikatoren (Schwellenwerte, Sanctions-Hits) plus ML-Stufe für Risiko-Bewertung und Priorisierung. Damit bleibt die regulatorische Nachvollziehbarkeit erhalten, während die ML-Stufe die operative Last reduziert.

EU-AI-Act-Hochrisiko-Klassifikation

Der EU-AI-Act stuft KI-Systeme für AML-Monitoring nach Annex III Nr. 5b als Hochrisiko-System ein. Die Konsequenzen sind erheblich. Ab voller Geltung im August 2026 müssen Betreiber:

  • ein Risiko-Management-System nach Art. 9 etablieren
  • Trainings- und Validierungs-Daten dokumentieren und ihre Repräsentativität nachweisen (Art. 10)
  • technische Dokumentation und Logging vorhalten (Art. 11–12)
  • menschliche Aufsicht über Modell-Entscheidungen sicherstellen (Art. 14)
  • Konformitäts-Bewertung mit CE-Kennzeichnung durchlaufen (Art. 43)

Die BaFin hat in den AuA AT 4.3.2 klargestellt, dass KI-gestützte AML-Systeme den Anforderungen der MaRisk und der AuA an Modell-Risiko-Management vollständig unterliegen — unabhängig von der AI-Act-Anwendung.

Bias-Risiken — wenn KI diskriminiert

Bias ist das am häufigsten unterschätzte Risiko. ML-Modelle lernen aus historischen Daten — und historische AML-Daten reproduzieren historische Diskriminierungen. Wenn in der Vergangenheit überproportional viele Verdachtsmeldungen gegen Kunden mit bestimmten Namens-Mustern, Wohn-Adressen oder Geburts-Ländern abgegeben wurden, lernt das Modell, diese Merkmale als Risiko-Marker zu interpretieren.

Konsequenz: das Modell stuft strukturell ähnliche Neukunden automatisch hoch ein, ohne dass die individuelle Transaktion das rechtfertigt. Der Effekt ist diskriminierungs-rechtlich problematisch (AGG, EU-Grundrechte-Charta) und operativ ineffizient: False-Positive-Cluster nach demografischen Merkmalen, während echte neue Patterns übersehen werden.

Gegenmaßnahmen:

  • Adversarial Debiasing beim Training (Bias-Detektoren als Gegen-Modell)
  • Subgroup-Auditing bei der Modell-Validierung
  • Geschützte Merkmale (Nationalität, Religion, ethnische Zugehörigkeit) explizit aus Trainings- und Inferenz-Daten ausschließen
  • Modell-Erklärbarkeit über SHAP- oder LIME-Werte zur Nachvollziehbarkeit pro Entscheidung

Erklärbarkeit und Modell-Validierung

Die BaFin verlangt für Modell-Entscheidungen mit erheblicher Folge — und das ist eine AML-Risiko-Einstufung — Erklärbarkeit auf Einzelfall-Ebene. Wenn das Modell den Kunden hochstuft, muss erklärbar sein, welche Faktoren in welcher Gewichtung dazu beigetragen haben. SHAP (Shapley Additive Explanations) ist Industry-Standard für Feature-Attribution; LIME (Local Interpretable Model-agnostic Explanations) ergänzt für lokale Erklärungen.

Modell-Validierung ist ein eigener Pflicht-Prozess: vor Produktiv-Setzung muss das Modell auf einem hold-out-Datensatz getestet werden, der nicht im Training enthalten war. Performance-Metriken (Precision, Recall, F1-Score) sind zu dokumentieren. Mindestens jährliche Re-Validierung mit aktualisierten Daten ist Standard; bei deutlichen Performance-Drifts muss neu trainiert werden.

Begriffe

Transaction Monitoring: Laufende automatische Überwachung von Kunden-Transaktionen gegen Risiko-Modelle.

False Positive: Modell-Alert ohne echten Verdachts-Sachverhalt — wird in der Compliance-Triage als unbegründet eingestuft.

SHAP: Shapley Additive Explanations — Methode zur Quantifizierung des Beitrags einzelner Eingabe-Features zu einer Modell-Entscheidung.

Adversarial Debiasing: Training-Technik mit Gegen-Modell, das die Diskriminierung erkennt und durch Gradient-Reversal aus dem Hauptmodell entfernt.

Häufige Fragen

Ist KI im AML schon BaFin-anerkannt?

Die BaFin akkreditiert keine KI-Systeme als „anerkannt". Sie prüft im Rahmen der MaRisk- und AuA-Anforderungen, ob das jeweilige Modell-Risiko-Management der Bank den Vorgaben entspricht. Wenn ja, ist der Einsatz zulässig.

Wie hoch ist die False-Positive-Rate in der Praxis?

Bei regel-basierten Systemen 90 bis 95 Prozent (also: nur 5 bis 10 Prozent der Alerts werden zu echten Verdachtsmeldungen). Bei hybrid-ML-Systemen 60 bis 80 Prozent — eine deutliche Verbesserung, aber immer noch der Großteil der Triage-Last.

Müssen Compliance-Mitarbeiter die KI verstehen?

Mindestens auf der Ebene: Welche Features werden verwendet, was hat das Modell entschieden, warum. Vollständige mathematische Modell-Kenntnis ist nicht erforderlich. Aber wer Alerts triagiert, muss die Erklärbarkeits-Outputs lesen und bewerten können.

Was passiert bei einem False Negative?

Wenn das Modell einen echten Verdachts-Fall übersieht und es zu einer regulatorischen Beanstandung kommt, prüft die BaFin, ob das Modell-Risiko-Management angemessen war. Bei nachgewiesenen Mängeln drohen Bußgelder und Reputations-Schäden. Persönliche Haftung der Geschäfts-Leitung ist möglich.

Kann ein Kunde gegen eine ML-basierte Einstufung Widerspruch einlegen?

Datenschutz-rechtlich nach Art. 22 DSGVO eingeschränkt: rein automatisierte Entscheidungen mit rechtlicher Wirkung sind unzulässig. AML-Risiko-Einstufungen sind keine endgültigen Entscheidungen — sie führen zu Compliance-Maßnahmen. Eine Konto-Kündigung allein aufgrund eines Modell-Outputs wäre Art.-22-relevant; die menschliche Letzt-Entscheidung muss erhalten bleiben.

Wird KI die Compliance-Stellen ersetzen?

Nein. KI verändert die Aufgabe: weniger manuelle Triage von False Positives, mehr Bewertung der ML-Modell-Outputs, mehr Modell-Aufsicht. Die Gesamt-Zahl der Compliance-Stellen sinkt in einzelnen Banken, aber neue Rollen entstehen (Model-Risk-Manager, AI-Auditor, AML-Data-Scientist).


Stand: 28. Mai 2026. Gesetzliche Regelungen ändern sich. Für rechtsverbindliche Auskünfte konsultieren Sie eine Fachperson.

Quellen & Zitate

Primär-Quellen dieses Artikels

  • EU AI Act (Verordnung 2024/1689) — Annex III Nr. 5b
    1. August 2024
    Quelle öffnen
  • BaFin AuA AT 4.3.2 (Risikomanagement und KI)
    30. September 2024
  • FATF Guidance: Digital Identity 2024
    15. Juni 2024