Zum Inhalt springen
AML READY Wiki
AML READY · M14

KI im AML-Monitoring: ML-Modelle, Bias, Erklärbarkeit, Vendor-Landschaft

Machine-Learning im Transaction Monitoring, False-Positive-Reduktion, Hybrid-Architekturen, EU-AI-Act-Hochrisiko-Klassifikation und die Anforderungen an Modell-Validierung.

Prof. Dr. Alexander HoltermannStand: 28. Mai 20264 Min Lesezeit

KI im AML-Monitoring ist in Großbanken seit etwa 2018 Standard. Heute geht es um die regulatorische Reife: EU-AI-Act-Klassifikation, BaFin-Anforderungen an Modell-Risiko-Management und die Vendor-Landschaft.

Machine-Learning-Modelle im Transaction Monitoring

Klassische Transaction-Monitoring-Systeme arbeiten regel-basiert: Schwellen-Werte, Pattern-Recognition. ML-Modelle ergänzen das um:

  • Anomalie-Erkennung — Abweichungen vom historischen Kunden-Profil
  • Peer-Group-Analyse — Vergleich mit ähnlichen Kunden
  • Sequenz-Erkennung — Erkennung von Multi-Step-Wäsche-Patterns
  • Network-Analyse — Identifikation verknüpfter Konten-Cluster

Standard-Algorithmen: Random Forest, Gradient Boosting (XGBoost, LightGBM), Graph Neural Networks für Netzwerk-Analyse.

False-Positive-Reduktion

Der größte praktische Nutzen von ML ist die Reduktion der False-Positive-Rate. Regel-basierte Systeme erzeugen typisch 90 bis 95 Prozent False Positives. ML-Modelle können dies auf 60 bis 80 Prozent reduzieren, ohne die Treffer-Rate zu senken.

Mechanik: Das ML-Modell läuft als zweite Stufe nach den regulatorischen Regeln und priorisiert die Alerts. Niedrig-priorisierte Alerts werden zur Massen-Triage gebündelt, hoch-priorisierte einzeln bearbeitet.

Hybrid-Architekturen mit Regel-Systemen

Reine ML-Systeme sind regulatorisch problematisch — die Nachvollziehbarkeit fehlt. Standard ist die Hybrid-Architektur:

  1. Regel-Engine für regulatorisch zwingende Indikatoren (Schwellen-Werte, Sanctions-Hits)
  2. ML-Stufe für Risiko-Scoring und Priorisierung
  3. Erklärbarkeits-Schicht für jede Alert-Entscheidung
  4. Human-in-the-Loop für die finale Bewertung

Dies erhält die regulatorische Auditfähigkeit und nutzt gleichzeitig die ML-Effizienz.

EU-AI-Act-Hochrisiko-Klassifikation

Der EU-AI-Act stuft AML-Monitoring-KI nach Annex III Nr. 5b als Hochrisiko-System ein. Die Konsequenzen ab voller Geltung im August 2026:

  • Risiko-Management-System nach Art. 9 — laufende Bewertung und Mitigation
  • Daten-Governance nach Art. 10 — Repräsentativität, Bias-Erkennung
  • Technische Dokumentation nach Art. 11 — vollständige Modell-Dokumentation
  • Logging nach Art. 12 — Aufzeichnung jeder Modell-Entscheidung
  • Transparenz nach Art. 13 — Information der betroffenen Personen
  • Menschliche Aufsicht nach Art. 14 — Aufsichtspflicht über automatisierte Entscheidungen
  • Konformitäts-Bewertung nach Art. 43 — Selbst-Bewertung mit CE-Kennzeichnung
  • Post-Market-Monitoring nach Art. 72 — laufende Überwachung nach Inbetriebnahme

Diese Anforderungen sind umfangreich. Die ersten Banken haben 2024/25 begonnen, die Compliance-Architektur entsprechend anzupassen.

Bias-Erkennung und Mitigation

Bias ist das am häufigsten unterschätzte Risiko. ML-Modelle lernen aus historischen Daten, die historische Diskriminierungen reproduzieren. Ohne Gegenmaßnahmen führt das zu strukturell ungleicher Behandlung von Kunden-Gruppen.

Standard-Mitigationen:

  • Adversarial Debiasing im Training (Bias-Detektoren als Gegen-Modell)
  • Subgroup-Auditing in der Validierung — Performance pro demografischer Gruppe
  • Geschützte Merkmale explizit ausschließen (Nationalität, Religion, ethnische Zugehörigkeit)
  • Synthetic Data Augmentation zur Datengleichgewichtung

Die EU-Grundrechte-Agentur und nationale Antidiskriminierungs-Stellen haben Leitfäden für AML-Bias-Risiken veröffentlicht.

Erklärbarkeits-Techniken

SHAP (Shapley Additive Explanations)

SHAP basiert auf der Spieltheorie und quantifiziert den marginalen Beitrag jedes Eingabe-Features zur Modell-Entscheidung. Industry-Standard für Feature-Attribution.

Vorteile: mathematisch fundiert, modell-agnostisch, lokale und globale Erklärbarkeit.

Nachteile: rechenintensiv bei großen Modellen, schwer interpretierbar bei korrelierten Features.

LIME (Local Interpretable Model-agnostic Explanations)

LIME erzeugt für jede Einzel-Entscheidung ein vereinfachtes lokales Surrogat-Modell, das die Entscheidung in der Nachbarschaft des Eingabe-Punkts erklärt.

Vorteile: schnell, intuitiv interpretierbar.

Nachteile: nur lokale Erklärung, kann zwischen ähnlichen Inputs erheblich variieren.

Counterfactual Explanations

Erklärt, was sich am Input ändern müsste, damit das Modell anders entscheidet. „Wenn die monatliche Transaktions-Frequenz unter 50 läge, wäre der Kunde nicht hoch eingestuft."

Vorteile: handlungsorientiert, gut für Kunden-Kommunikation.

Nachteile: nicht eindeutig, oft mehrere Counterfactuals möglich.

Modell-Validierung

Modell-Validierung ist Pflicht nach BaFin AuA AT 4.3.2 und MaRisk. Standard-Prozess:

  1. Hold-out-Datensatz vor Training reserviert
  2. Performance-Metriken (Precision, Recall, F1, AUC) auf hold-out gemessen
  3. Stress-Tests mit synthetischen Edge-Cases
  4. Bias-Audit über demografische Subgroups
  5. Erklärbarkeits-Validierung mit SHAP/LIME-Stichproben
  6. Production-Drift-Monitoring nach Inbetriebnahme

Mindestens jährliche Re-Validierung mit aktualisierten Daten. Bei erheblichen Performance-Drifts muss neu trainiert werden.

Vendor-Landschaft

Standard-Vendoren für ML-basierte AML-Lösungen:

  • NICE Actimize — Marktführer im Banken-Bereich
  • SAS Anti-Money Laundering — etablierter Anbieter mit starker ML-Komponente
  • Featurespace — UK-Anbieter mit Adaptive-Behavioral-Analytics
  • Quantexa — Network-Analytics-Spezialist
  • Symphony AyasdiAI — explainable-by-design Ansatz

Build-vs-Buy-Entscheidung: Großbanken bauen häufig eigene Modelle auf Standard-Plattformen; mittelständische Banken kaufen Komplett-Lösungen.

Begriffe

SHAP: Shapley Additive Explanations — Methode zur Quantifizierung des Feature-Beitrags zu einer Modell-Entscheidung.

LIME: Local Interpretable Model-agnostic Explanations — Methode zur lokalen Modell-Erklärung über Surrogat-Modelle.

Adversarial Debiasing: Training-Technik mit Bias-Detektor als Gegen-Modell.

Counterfactual Explanation: Erklärt, welche Input-Änderungen zu einer anderen Modell-Entscheidung geführt hätten.

Häufige Fragen

Welche XAI-Technik ist Standard?

SHAP ist der Industry-Standard für Feature-Attribution in regulatorischen Kontexten. Es ist mathematisch fundiert und akzeptiert von BaFin und EZB.

Wird mein Modell durch den AI Act zugelassen?

Hochrisiko-Modelle erhalten kein „Zulassungs-Zertifikat". Stattdessen ist eine Konformitäts-Selbsterklärung mit CE-Kennzeichnung erforderlich. Bei nachgewiesener Nicht-Konformität drohen Bußgelder und Stilllegung.

Wer haftet bei Modell-Fehlentscheidungen?

Das Verpflichteten-Unternehmen. Persönliche Haftung der Geschäfts-Leitung bei nachgewiesenen Versäumnissen im Modell-Risiko-Management.

Reicht ein gekauftes Modell, oder muss eigene Validierung erfolgen?

Eigene Validierung ist immer Pflicht. Vendor-Modelle müssen vor Inbetriebnahme im eigenen Daten-Umfeld validiert werden — ohne eigene Validierung ist die Haftung nicht abgewälzt.

Wie oft muss ein Modell neu trainiert werden?

Mindestens jährlich, oder bei nachgewiesenem Performance-Drift. Bei sehr volatilen Daten (z. B. Krypto-Bereich) sind quartalsweise Trainings-Zyklen Standard.

Kann ein Modell selbst Bias erkennen?

Teilweise. Adversarial Debiasing nutzt ein Gegen-Modell zur Bias-Erkennung im Training. Aber externe Subgroup-Audits bleiben Pflicht — selbst-Bias-erkennende Modelle sind kein Ersatz.


Stand: 28. Mai 2026. Gesetzliche Regelungen ändern sich. Für rechtsverbindliche Auskünfte konsultieren Sie eine Fachperson.

Quellen & Zitate

Primär-Quellen dieses Artikels

  • EU AI Act (Verordnung 2024/1689) — Annex III Nr. 5b
    1. August 2024
    Quelle öffnen
  • BaFin AuA AT 4.3.2 (Risikomanagement und KI)
    30. September 2024
  • Basel Committee — Sound Practices on Implications of FinTech 2018
    19. Februar 2018