Nicht genug Daten? Nicht schlimm. Von dieser KI-Lösung profitieren KMU

Maschinen auslesen, Prozesse optimieren, Fehler frühzeitig erkennen: all das verspricht Künstliche Intelligenz. Doch was tun, wenn es gar nicht genug Daten gibt, um solche Systeme zu trainieren? Genau hier setzt das it’s OWL Projekt AI4ScaDa an. Das Wissen des Projekts gibt’s jetzt auf 30 Seiten zum Nachlesen. Der Abschlussbericht zeigt, wie Unternehmen auch mit kleinen Datenmengen erfolgreich KI nutzen können.

„Die meisten kleinen und mittleren Unternehmen haben keinen zentralen Datenspeicher, aber trotzdem jede Menge Wissen in Form von Versuchsergebnissen, Maschinendaten oder Erfahrungen“, sagt Marvin Schöne von der Hochschule Bielefeld, der das Projekt koordinierte und zusammen mit der TH OWL eine KI-Lösung für kleine Datenmengen entwickelte.

Wenn viele Daten keine Selbstverständlichkeit sind

Während Großunternehmen riesige Datenpools verwalten, arbeiten KMU oft mit wenigen, verstreuten Informationen. Klassische KI-Modelle sind dafür nicht gemacht, sie brauchen Masse. Doch genau in den knappen Daten steckt oft besonders wertvolles Wissen.

AI4ScaDa hat gezeigt, wie sich aus diesen kleinen, oft unvollständigen Datenquellen trotzdem verlässliche Vorhersagen erzeugen lassen. Ziel war es, KI-Methoden zu entwickeln, die in der Praxis auch unter schwierigen Bedingungen funktionieren.

Ein Werkzeugkasten, der auch ohne Vorkenntnisse funktioniert

Im Zentrum des Projekts stand die Entwicklung eines modularen KI-Workflows, der speziell auf die Herausforderungen datenarmer Anwendungsszenarien zugeschnitten ist. Der Workflow ermöglicht es Unternehmen, auch mit begrenzten und heterogenen Datensätzen zuverlässige und interpretierbare KI-Modelle zu erstellen.

Dazu wurden verschiedene Bausteine zu einem durchgängigen System kombiniert: von der gezielten Versuchsplanung über die Datenannotation durch Expert:innen bis hin zur Modellbildung und iterativen Verbesserung mittels Active Learning.

„Wir wollten keine akademische Spielerei, sondern ein Werkzeug, das sich direkt im Unternehmen nutzen lässt – ohne ein Team aus Data Scientists zu brauchen“, sagt Julian Bültemeier von der TH OWL.

Ein zentrales Merkmal des Workflows ist die Verwendbarkeit ohne tiefgreifende KI-Vorkenntnisse. Die Komponenten sind plattformunabhängig einsetzbar, Open-Source-basiert und über eine intuitive Benutzeroberfläche bedienbar.

Die zugrunde liegenden Modelle – insbesondere interpretierbare Entscheidungsbäume – ermöglichen es Fachexpert:innen, die getroffenen Vorhersagen nachzuvollziehen und plausibel einzuordnen. Ergänzt wird der Workflow durch eine eigens entwickelte Pipeline zur Transformation von Zeitreihendaten sowie durch Methoden der Informationsfusion, die Unsicherheiten in Expertenlabels berücksichtigen und auswertbar machen.

Darüber hinaus wurden neue Active-Learning-Strategien entwickelt, mit denen der Datenraum gezielt und effizient exploriert werden kann – ein zentraler Vorteil in kostensensitiven oder experimentell aufwändigen Umgebungen. So schafft der Workflow die Grundlage für skalierbare, nachvollziehbare und wirtschaftlich sinnvolle KI-Anwendungen im industriellen Kontext – auch ohne Big Data.

Drei Praxisbeispiele zeigen, wie es geht

Wie das konkret aussieht, zeigen drei Anwendungsfälle aus dem Projekt:

  • SU Biotec nutzte den Ansatz, um Abläufe in der Pflanzenanzucht zu verbessern, mit dem Ziel, Produktionsprozesse durch datengestützte Erkenntnisse effizienter und reproduzierbarer zu gestalten.
  • GEA entwickelte gemeinsam mit dem Projektteam ein digitales Assistenzsystem, das mithilfe interpretierbarer Entscheidungsbäume die Auswahl geeigneter Zentrifugen basierend auf Laborversuchen unterstützt – und dabei wertvolles Expertenwissen systematisch erfasst und bewahrt.
  • Miele setzte auf Langzeitdaten aus Produktversuchen, um frühzeitig zu erkennen, wann etwa Flusensiebe in Trocknern verstopfen, mit dem Ziel, Ferndiagnosen zu ermöglichen und Serviceeinsätze zu reduzieren.

„Alle drei Beispiele zeigen eindrucksvoll, wie durch die Kombination aus domänenspezifischem Wissen und KI-Technologie echter Mehrwert aus kleinen Datenmengen gewonnen werden kann“, sagt Marvin Schöne.

Ein Einstieg für Unternehmen, die klein anfangen wollen

Der veröffentlichte Abschlussbericht richtet sich an Unternehmen, die den Einstieg in KI suchen, aber bislang dachten: „Wir haben doch gar nicht genug Daten.“

AI4ScaDa beweist das Gegenteil: Mit den richtigen Methoden lassen sich auch kleine Datenmengen produktiv nutzen. Die im Projekt entwickelten Werkzeuge stehen jetzt zur Verfügung – und können auf viele weitere Szenarien übertragen werden.

Zum Abschlussbericht

Mehr zum Thema „Aus unseren Projekten“