UC09: KI-gestützte Test- und QA-Automatisierung

98 %+

Testabdeckung in sicherheitskritischen Systemen

60–70 %

Zeitersparnis bei der Testfallerstellung

< 4 h

von Anforderungsdokument zu auditfähigem Testplan

Das eigentliche Problem: Testdokumentation als Ressourcenfalle

Ein Team entwickelt eine Steuerungssoftware für ein Medizingerät nach IEC 62304. Die eigentliche Implementierung — Algorithmus, Schnittstellen, Firmware-Integration — dauert vier Monate. Die Testdokumentation: noch einmal zwei Monate. Testfälle ableiten, Akzeptanzkriterien formulieren, Traceability-Matrix pflegen, Testergebnisse in prüffähige Berichte übersetzen. Alles manuell. Alles fehleranfällig. Alles vom Auditor gelesen.

Das gleiche Muster in der Avionik: DO-178C verlangt für DAL-A-Software eine lückenlose Abdeckung jeder Anforderung durch mindestens einen Testfall — mit dokumentiertem Ergebnis, verknüpft mit der Spezifikation, versioniert. Bei 800 Anforderungen bedeutet das in der Praxis Wochen manueller Arbeit vor jeder Zertifizierungsphase. ISO 26262 in der Fahrzeugelektronik ist nicht anders strukturiert.

Testdokumentation ist in regulierten Branchen keine optionale Qualitätssicherung. Sie ist Bestandteil der Zulassungsakte. Fehler oder Lücken dort blockieren den Go-Live — nicht die Bugs in der Software selbst.

Was KI konkret übernimmt

KI liest Anforderungsspezifikationen — in natürlicher Sprache, als strukturiertes Dokument oder direkt aus dem Anforderungsmanagement-Tool — und generiert daraus:

Vollständige Testfälle mit Vorbedingungen, Eingaben, erwarteten Ergebnissen
Negativtests und Grenzwertanalysen, die manuell regelmäßig übersehen werden
Äquivalenzklassen und Partitionierungsanalysen
Akzeptanzkriterien in einer für Auditoren lesbaren Form
Traceability-Links: welcher Testfall deckt welche Anforderung ab

Die KI schreibt keinen ausführbaren Testcode — das bleibt Aufgabe des Entwicklungsteams in der jeweiligen Testumgebung. Sie erzeugt die Spezifikation: präzise genug, dass ein Ingenieur die Implementierung in wenigen Minuten abschließen kann.

Wie eine Ausgabe aussieht

Zur Verdeutlichung: Eine Anforderung aus einer medizinischen Softwarespezifikation — "Der Alarmmechanismus muss innerhalb von 500 ms auf einen kritischen Messwert reagieren" — erzeugt folgende Testfall-Struktur:

# Generierter Testfall — UC09 Demo

ID:            TC-042
Anforderung:   REQ-ALM-07
Titel:         Alarmauslösung bei kritischem Messwert — Antwortzeit

Vorbedingung:
  - System aktiv, kalibriert, Normalbetrieb
  - Alarmschwelle konfiguriert auf 120 mmHg (systolisch)

Testschritte:
  1. Simuliere Messwert: 121 mmHg (über Schwelle)
  2. Starte Zeitmessung (t0)
  3. Warte auf Alarmausgabe (visuell + akustisch)
  4. Stoppe Zeitmessung (t1)

Erwartetes Ergebnis:
  - Alarm ausgelöst innerhalb (t1 - t0) <= 500 ms
  - Alarmart: CRITICAL, Code ALM-07
  - Logeintrag mit Zeitstempel und Messwert erzeugt

Negativtest (TC-042b):
  - Messwert 119 mmHg: kein Alarm erwartet
  - Messwert 120 mmHg (Grenzwert): Verhalten dokumentieren

Traceability:   REQ-ALM-07 → TC-042, TC-042b
Standard:      IEC 62304 §5.7 — Software Integration Testing

Dieser Output entsteht in Sekunden. Für ein Dokument mit 200 Anforderungen dauert der vollständige Durchlauf unter einer Stunde. Ein erfahrener Testingenieur braucht für dasselbe Ergebnis typischerweise zwei bis drei Arbeitstage.

Relevante Normen und was sie konkret fordern

IEC 62304 DO-178C ISO 26262 EN 50128

IEC 62304 — Medizinische Software

Klasse B und C verlangen vollständige Softwareverifikation: Testfälle für jede Software-Einheit, Integrationstests für alle Schnittstellen, Systemtests gegen die Anforderungsspezifikation. Die KI liest die Spezifikation und ordnet jeden Testfall automatisch der richtigen Klasse zu.

DO-178C — Avionik

DAL A bis C erfordern strukturelle Abdeckungsanalyse (Statement, Decision, MC/DC Coverage). KI generiert Testfälle, die auf diese Abdeckungsziele ausgerichtet sind — inklusive der häufig vergessenen Deactivated-Code-Nachweise.

ISO 26262 — Funktionale Fahrzeugsicherheit

ASIL-Einstufungen bestimmen den erforderlichen Testaufwand. ASIL D verlangt unabhängige Tests und vollständige MC/DC-Abdeckung. Die KI berücksichtigt die ASIL-Stufe einer Anforderung und passt Tiefe und Art der Testfälle entsprechend an.

KI-gestütztes Code-Review für sicherheitskritische Systeme

Neben der Testfallgenerierung übernimmt KI eine zweite Funktion im QA-Prozess: die strukturierte Überprüfung von Quellcode gegen definierte Codierstandards.

Für sicherheitskritische C- oder Ada-Entwicklung — etwa nach MISRA C:2012 oder JSF++ — analysiert die KI jeden Pull Request und markiert:

Verstöße gegen MISRA-Regeln mit Regelreferenz und Erklärung
Uninitialisierte Variablen, implizite Typkonvertierungen, unbegrenzte Rekursion
Fehlende Fehlerpfade bei sicherheitskritischen Funktionsaufrufen
Abweichungen vom projekteigenen Coding-Standard

Das Ergebnis ist kein Ersatz für formale statische Analyse-Tools wie Polyspace oder LDRA. Es ist eine erste Filterschicht, die offensichtliche Verstöße herausfiltert, bevor der Review durch erfahrene Ingenieure beginnt. In der Praxis reduziert das die Review-Zeit pro Merge Request um 40 bis 50 Prozent.

Auditfähige Dokumentation als direktes Ergebnis

Was KI nicht nur generiert, sondern strukturiert ausgibt, ist der entscheidende Unterschied zu einfachen Automatisierungsansätzen. Jeder Testfall enthält:

Die Referenz auf die zugrundeliegende Anforderung (ID, Version, Dokument)
Den angewandten Testtyp (Blackbox, Grenzwert, Negativtest)
Den Normenbezug (Paragraph und Anforderungsklasse)
Das erwartete Ergebnis in prüfbarer, nicht interpretierbarer Formulierung

Die Ausgabe lässt sich direkt in Anforderungsmanagement-Systeme exportieren — Polarion, DOORS, Jama, Confluence — oder als PDF-Testplan für die Zulassungsakte aufbereiten. Der Auditor sieht ein vollständiges, rückverfolgbares Dokument. Nicht ein halbfertiges Spreadsheet aus verschiedenen Quellen.

Deployment: on-premise, keine externe Datenübertragung

Anforderungsspezifikationen in regulierten Branchen sind vertraulich. Sie beschreiben Sicherheitsfunktionen, sicherheitskritische Schwellwerte, proprietäre Algorithmen. Das Material verlässt die eigene Infrastruktur nicht.

AlpiType betreibt KI-Modelle ausschließlich auf der Infrastruktur des Kunden — on-premise, air-gapped-fähig, ohne Verbindung zu US-Cloud-Diensten. Kein API-Call zu OpenAI. Kein Dokument, das den Perimeter verlässt. Für Verteidigung, Luftfahrt und Medizin ist das keine Option — es ist die Voraussetzung.

Die KI-Modelle laufen auf Ihrer Hardware, in Ihrem Rechenzentrum, unter Ihrer Kontrolle. Wir installieren, konfigurieren und übergeben — ohne Abhängigkeit von externen Diensten.

Ergebnis in der Praxis

Ein Team, das bislang drei Wochen für die Testfalldokumentation eines Release-Zyklus aufgewendet hat, schließt denselben Schritt in drei bis vier Tagen ab. Die Testabdeckung steigt — weil KI keine Anforderungen übersieht und Grenzwertfälle konsequent ausleitet. Die Qualität der Dokumentation ist konsistenter, weil kein menschliches Ermüden zu inkonsistenten Formulierungen führt.

Das ist keine Theorie. Es ist das Ergebnis aus Produktionssystemen in regulierten Branchen, die wir aufgebaut und übergeben haben. Die Ingenieure, die vorher Testfälle tippt haben, arbeiten jetzt an der Software.

KI-gestützte Test- und QA-Automation