KI in der Pflanzenzucht: Mit wenig Daten zum Erfolg

Wie kann Künstliche Intelligenz (KI) die Pflanzenzucht optimieren und wie gelingt dies mit wenig Daten (Scarce Data)? Mit diesen Fragen beschäftigt sich das it’s OWL Projekt AI4ScaDa zusammen mit der Saaten-Union Biotec GmbH (SU BIOTEC).

Um KI-Methoden gezielt auf die Anforderungen der Pflanzenzucht zuschneiden zu können, trafen sich die Forschenden aus dem Projekt AI4ScaDa mit den Projektverantwortlichen der SU BIOTEC vor Ort in Leopoldshöhe.

Was macht die SU BIOTEC?

Die Saaten-Union Biotec GmbH ist ein mittelständisches Unternehmen (KMU), das biotechnologische Methoden für die Pflanzenzüchtung erforscht, optimiert und anwendet. Dabei werden unter anderem aus explantierten Geweben oder Zellen unter sterilen Bedingungen ganze Pflanzen regeneriert. Mit diesen Methoden unterstützt SU BIOTEC ihre Kunden bei einer beschleunigten und erfolgreichen Sortenentwicklung.

 

Abbildung 2: Kultivierung sich entwickelnder Pflanzen (Regenerate) unter kontrollierten Temperatur- und Licht-Bedingungen.

Was soll mit KI in der Pflanzenzucht erreicht werden?

Für die Pflanzenzucht sind viele miteinander verkettete Prozessschritte notwendig, die wiederum einzeln durch eine große Zahl an Parametern steuerbar sind. Der Prozess umfasst die Kultivierung geeigneter Spenderpflanzen, über die  Antherenentnahme und Kallusbildung bis hin zur vollständigen Entwicklung kleiner Pflanzen (Regenerate). Die richtigen Kombinationen prozesssteuernder Maßnahmen, wie z.B. der Dauer und Auswahl des Lichtspektrums sowie des Temperaturregimes und der Pflegemaßnahmen der Pflanzen in den verschiedenen Entwicklungsstadien, haben einen entscheidenden Einfluss auf den Produktionserfolg und dessen Wirtschaftlichkeit.

KI-Methoden können hier unterstützen, indem sie den Produktionserfolg in Abhängigkeit der Parameter dieser prozesssteuernden Maßnahmen approximieren und prognostizieren. Das Wissen darüber, welche Parameter welchen Einflussgrad aufweisen, wird für SU BIOTEC eine wesentliche Unterstützung bei der Prozessoptimierung liefern. Die Spenderpflanzenanzucht und der Ährenschnitt sind besonders qualitätsrelevante Prozessschritte für die Produktion neuer Regenerate. Die Ähren werden sehr jung geschnitten. Die unreifen Pollen in den darin enthaltenen Staubbeutel (Antheren) entwickeln sich dann je nach Qualität in dem weiteren Prozess zu Regeneraten oder sterben ab.

KI soll Prozessmodell trainieren und Regenerate prognostizieren

Um diesen ersten Prozessschritt hinsichtlich der Antherenqualität und Kultivierungszeit zu optimieren und gezielt neues Wissen bei der Anzucht von Spenderpflanzen zu generieren, soll die KI in AI4ScaDa für das Training eines Prozessmodells der Spenderpflanzenanzucht verwendet werden, was in der Abbildung 3 dargestellt ist.

 

Abbildung 3: Zielbild für die KI-getriebene Prozessoptimierung bei der Saaten-Union Biotec GmbH.

 

 

Des Weiteren soll die KI für eine Prognose der Anzahl der erzeugten Regenerate genutzt werden (siehe Abbildung 4). Die Prognose soll auf Basis der Gewächshaus- und Labordaten durchgeführt werden, um eine frühzeitige Prozesssteuerung in Form einer zusätzlichen bedarfsgerechten Entnahme von Ähren zu ermöglichen, bevor die Spenderpflanzen vernichtet werden. Die Prozessteuerung ist wichtig, da bei einem suboptimalen oder zu geringen Ährenschnitt nicht die vom Kunden geforderte Anzahl an Regeneraten erzielt werden.

 

Abbildung 4: Zielbild einer KI-getriebenen Prozesssteuerung bei der Saaten-Union Biotec GmbH.

 

Des Weiteren soll die KI für eine Prognose der Anzahl der erzeugten Regenerate genutzt werden (siehe Abbildung 4). Die Prognose soll auf Basis der Gewächshaus- und Labordaten durchgeführt werden, um eine frühzeitige Prozesssteuerung in Form einer zusätzlichen bedarfsgerechten Entnahme von Ähren zu ermöglichen, bevor die Spenderpflanzen vernichtet werden. Die Prozessteuerung ist wichtig, da bei einem suboptimalen oder zu geringen Ährenschnitt nicht die vom Kunden geforderte Anzahl an Regeneraten erzielt wird werden.

Was sind die Herausforderungen im Projekt AI4ScaDa?

Die größte Herausforderung ist, dass das Ausgangsmaterial bei jedem Auftrag aufgrund der jeweiligen speziellen Entwicklung beim Kunden einzigartig ist. Wiederholt werden routinemäßig nur einige wenige Standards, aber von diesen werden keine Regenerate an die Züchter abgegeben. Die Produktionsdaten sind nicht immer systematisch und einheitlich erhoben worden. Einzelne Aufträge variieren stark in der Größenordnung und bisherige Optimierungen fanden zum Teil an unterschiedlichem Ausgangsmaterial statt. So ist eine unmittelbare Vergleichbarkeit nur sehr schwer gegeben. Der für die Bewertung des Produktionserfolges abschließende Wert ist erst Monate nach der Abgabe der Regenrate an die Züchter erfassbar, wenn die Regenerate im Feld der Züchter erste Prüfungen bestanden haben und diese Daten an SU BIOTEC übermittelt werden. In der Zwischenzeit haben aber bereits neue Produktionszyklen begonnen.

Infolgedessen kann das Projektteam nicht auf Big Data zurückgreifen, sondern muss den Herausforderungen von Scarce Data begegnen.

Was ist AI4ScaDa?

Im it’s OWL Innovationsprojekt AI4ScaDa werden spezielle KI-Methoden erforscht, die im Kontext von Scarce Data gewinnbringend eingesetzt werden können. Im Gegensatz zu Big Data steht Scarce Data für wenige oder lückenhafte, aber häufig präzise Daten.

Herausforderungen bestehen gerade darin, dass KI-Systeme sowohl stark von der Qualität als auch von der Quantität der Daten abhängen. Wo nur sehr spärliche Daten vorhanden sind, kann eine Großzahl der KI-Verfahren nur schwer mit menschlicher Expertise mithalten.

 

Aktuelle Erkenntnisse bezüglich KI und Scarce Data werden im Projekt auf drei Use-Cases der Unternehmen Saaten-Union Biotec GmbH, GEA Westfalia Separator Group GmbH und Miele & Cie. KG weiterentwickelt, transferiert und operationalisiert. Forschungsseitig arbeiten das Center for Applied Data Sciences (CfADS) der HSBI und das Institut für industrielle Informationstechnik (inIT) der TH OWL im Projekt.

Mehr zum Thema „Aus unseren Projekten“