Die Bedeutung der Skalierung von Rührreaktoren hinsichtlich Entwicklungs- und Herstellungskosten

The scale-up of a pharmaceutical process is a crucial step in the development of any drug product. Many of the active ingredients (API) in a drug product are manufactured in stirred reactors. Manufacturing scale volumes can range from several hundred to several thousand Liter depending on the type of process and potency of the API.  Before running the process in a stirred reactor at manufacturing scale, it needs to be developed in a laboratory, typically in the range of Millilitres to Liters. From there it undergoes a stepwise scale-up to kilo scale, pilot scale and manufacturing scale.

Der Skalierung kommt an dieser Stelle eine besondere Bedeutung zu. Wird ein Prozess gleich auf Anhieb korrekt skaliert kann dies Kosten in der Grössenordnung von mehreren Zehntausend bis zu einer Million pro einzelnem Prozesslauf einsparen. Um dies zu erreichen, zielt die Skalierungsstrategie darauf ab, die gleichen Prozessbedingungen und die damit verbundene Fluiddynamik zwischen den Reaktoren im kleinen und im grossen Massstab, soweit physikalisch möglich, beizubehalten. Dies gewährleistet eine gleichbleibende Produktqualität und Ausbeute in allen Massstäben und ist daher für eine kosteneffiziente Prozessentwicklung und -herstellung unerlässlich.

Einsatz von numerischer Strömungsmechanik (CFD) zur Simulation und Analyse von Rührreaktoren

Die numerische Strömungsmechanik (Computational Fluid Dynamics, CFD) ist ein leistungsfähiges Werkzeug zur Simulation und Analyse der Fluiddynamik und Wärmeübertragung in Rührreaktoren (Abbildung 1). Durch die Erstellung eines virtuellen Modells des Reaktors ermöglicht CFD die Vorhersage des Prozessverhaltens und die Optimierung der Betriebsbedingungen. CFD kann Einblicke in Strömungsbedingungen, Mischeffizienz und Temperaturverteilung geben, was die Identifizierung potenzieller Probleme und die Verbesserung der Reaktorleistung ermöglichen kann.

figure
Abbildung 1: CFD-Simulation eines Reaktors. Links und rechts: Schnitt durch den Reaktor mit Geschwindigkeitsvektoren und axialer Geschwindigkeitsrichtung (rot: positiv, blau: negativ). Mitte: Draufsicht auf die Trombe mit Darstellung der Mesomischzeit.

CFD ist daher besonders geeignet, um bei der korrekten Skalierung von pharmazeutischen Prozessen in einem Rührreaktor helfen. Da das Ziel jeder Massstabsvergrösserung darin besteht, die gleichen Prozessbedingungen und die gleiche Fluiddynamik zwischen den beiden Reaktoren aufrechtzuerhalten, kann CFD die notwendigen Erkenntnisse liefern, um dies zu erreichen.

Die Erstellung eines CFD-Modells und die Analyse der Ergebnisse zur Ableitung von Handlungsempfehlungen kann jedoch sehr zeitaufwändig sein. Dies gilt insbesondere dann, wenn die Reaktorkonfigurationen und Betriebsbedingungen mehrmals geändert werden müssen, um die bestmögliche fluiddynamische Ähnlichkeit beider Reaktoren zu erreichen. Um die Iterationen zu reduzieren, bis die bestmögliche Ähnlichkeit erreicht ist, können Methoden des maschinellen Lernens eingesetzt werden, um so die vielversprechendste Konfiguration zu ermitteln, bevor mit dem zeitaufwändigen CFD-Prozess begonnen wird.

Verknüpfung von CFD und maschinellem Lernen für schnellere Vorhersagen und höhere Effizienz

Durch die Verknüpfung von CFD und maschinellem Lernen ist es möglich, die Effizienz des Skalierungsprozesses von Rührreaktoren zu verbessern. Durch die Definition eines Auslegungsraums, der aus einer Reihe von Rührreaktorkonfigurationen, Betriebsbedingungen und Volumina besteht, kann CFD die erforderlichen Daten für Algorithmen des maschinellen Lernens bereitstellen, die das Training genauer Vorhersagemodelle ermöglichen. Diese Kombination aus CFD und maschinellem Lernen ermöglicht nicht nur eine Optimierung in Echtzeit, die zu einer verbesserten Prozessleistung und einer schnelleren Skalierung führt. Sie ermöglicht Projektteams auch eine neue Art der Kollaboration mit Ad-hoc-Entscheidungsfindung bei kritischen Aufgaben wie der Auswahl der am besten geeigneten Reaktorkonfiguration und der damit verbundenen langfristigen Verfügbarkeitsplanung.

Erstellen eines Datensatzes für maschinelles Lernen

Methodologie

Die Verknüpfung von CFD und maschinellem Lernen erfordert Fachwissen aus dem Bereich der numerischen Simulation und der KI. Unser SimLab und AiLab haben einen Beispiel-Trainingsdatensatz mit CliqScale.R-Ergebnissen von Rührreaktoren erstellt (Abbildung 2).

ML Reatorsetup
Abbildung 2: Aufbau des Basisreaktors für den ML-Trainingsdatensatz

Verschiedene Parameter der Reaktorkonfiguration wurden variiert, wie Reaktordurchmesser, Füllstandshöhe, Anzahl der eingesetzten Rührer, Anzahl der Schaufeln, Anstellwinkel und Rührgeschwindigkeit. Der Datensatz besteht aus 768 Samples und weist folgende Merkmale auf. 768 samples made of the following features.

Konfiguration des Datensatzes:

  • Volumenbereich: 1L - 7000L
  • 3 Volumen pro Reaktor
  • 4 Umdrehungen pro Volumen
  • 3 Schaufelanzahlen [2,3,4]
  • 2 Anstellwinkel [45°, 60°]
  • 1 Leitblechkonfiguration [4 Leitbleche]
  • Fluid: Wasser @ ~ 20°C

Mit unserer automatisierten CFD-Nachbearbeitungsroutine wurden kumulative Verteilungen extrahiert und das 50. Perzentil (Medianwerte) herausgelesen. Dies wird in Abbildung 3 anhand der gestrichelten schwarzen Linien graphisch dargestellt.

th percentile
Abbildung 3: Kumulative Verteilungen und Extraktion des 50. Perzentils (Median), dargestellt anhand der gestrichelten schwarzen Linie.

Die Antwortvariablen sind die Medianwerte der turbulenten kinetischen Energie (k), der turbulenten Dissipationsrate (Epsilon), der Scherrate (strainRate) und des Geschwindigkeitsbetrags (Umag). Kombiniert man die Reaktormerkmale eines Samples (Variablenliste oben) mit den Antwortvariablen dieses Samples, erhält man einen Merkmalsvektor. Durch Speichern aller Merkmalsvektoren in einer Datei erhält man den endgültigen Datensatz fürs maschinelle Lernen. Ein Algorithmus kann nun lernen, wie sich die Reaktormerkmale und die Antwortvariablen zueinander verhalten. Einmal gelernt, kann dem Machine-Learning-Modell (ML-Modell) ein völlig neuer Satz von Reaktormerkmalen vorgelegt werden, der die entsprechenden Antwortvariablen innerhalb von Sekunden vorhersagt. Dies ermöglicht ein schnelles Screening verschiedener Reaktorkonfigurationen, sowie die am besten geeigneten Betriebsbedingungen zu finden, bevor eine vollständige CFD-Simulation durchgeführt wird.

Das nachfolgende Beispiel zeigt die Effizienzsteigerung auf

Das Screening von zehn Reaktorkonfigurationen mittels einem ML-Modell dauert mit der Vorbereitung eines Excel-Files, das alle Konfigurationen enthält, etwa eine halbe Stunde.

Zehn Reaktorkonfigurationen mit CFD können aufgrund des grossen Zusatzaufwands, der für CFD-Simulationen typisch ist, Wochen dauern. Hinzu kommt die für CFD typische Wartezeit von Stunden, die eine Echtzeitanalyse während Teamsitzungen unmöglich macht. Des Weiteren kann der CFD-Prozess nur von einem CFD-Experten durchgeführt werden, während das ML-Modell von jedermann verwendet werden kann, wenn das Modell entsprechend operationalisiert wird. Die Bereitstellung eines ML-Modells lohnt sich also in vielerlei Hinsicht.

Trainieren und Testen verschiedener Algorithmen für maschinelles Lernen

Das Ausprobieren und Testen verschiedener Algorithmen für maschinelles Lernen ist eine gängige Praxis, um den besten Algorithmus und die entsprechenden Hyperparameter zu finden. Je nach Eigenschaften der Daten eignen sich manche Algorithmen besser als andere, und es ist nicht immer von vornherein klar, welche Algorithmen die Anforderungen am besten erfüllen werden. Im aktuellen Anwendungsfall liegt der Schwerpunkt auf der Erstellung eines Datensatzes und dem Training einiger vorläufiger Modelle. Es soll aufgezeigt werden, wie dies dabei helfen kann, ein Screening verschiedener Reaktorkonfigurationen durchzuführen und auf Anhieb die richtigen Betriebsbedingungen für die darauffolgende CFD-Simulation zu finden.

Abbildung 4 zeigt die Ergebnisse eines kreuzvalidierten Datensatzes unter Verwendung eines Random-Forest-Regressors. Mit nur wenigen Optimierungen konnte ein erklärter Varianzscore (EVS) von 0,8 bis 0,98 erreicht werden.

ml dataset true predicted

ml dataset true predicted
Abbildung 4: Vorhergesagte vs. tatsächliche Werte für den Median der turbulenten Dissipationsrate (oben links) mit einem erklärten Varianzscore (EVS) von 0,8, die turbulente kinetische Energie (oben rechts) mit einem EVS von 0,96, die Geschwindigkeit (unten links) mit einem EVS von 0,98 und für den Median der Scherrate (unten rechts) mit einem EVS von 0,97.

Zwischenfazit

Im obigen Abschnitt wurde die Bedeutung des Skalierungsprozesses erläutert, einschliesslich der Auswirkungen auf die Entwicklungs- und Herstellungskosten. Es wurde gezeigt wie CFD dazu beitragen kann, die korrekte Skalierung von Rührreaktoren auf Anhieb zu gewährleisten, und wie maschinelles Lernen dabei helfen kann, den Prozess der Skalierung mit CFD zu beschleunigen.

Ein maschinelles Lernmodell wurde auf einem CFD-Datensatz trainiert, der mit CliqScale.R erstellt wurde und aus 768 Samples besteht. Das daraus resultierende ML-Modell kann die Mediane von Epsilon, k, Scherrate und Geschwindigkeit aus den Reaktormerkmalen Flüssigkeitsvolumen, Anzahl der Schaufeln, Anstellwinkel der Schaufeln, Anzahl der eingetauchten Laufräder, axiale Position der Laufräder und Drehzahl vorhersagen.

Im nächsten Abschnitt kommt das ML-Modell zum Einsatz. Es wird aufgezeigt, wie die Betriebsbedingungen für zwei gegebene Reaktoren mit Hilfe des ML-Modells gefunden werden können. Dies stellt den Schritt des Screenings verschiedener Reaktorkonfigurationen dar, wobei ein Labor- und ein Pilotreaktor gefunden wurden. In einem zweiten Schritt werden diese Betriebsbedingungen für die CFD-Simulation verwendet, um die Gültigkeit der mit dem ML-Modell vorhergesagten Betriebsbedingungen nachzuweisen.

Anwendung des ML-Modells für die anfängliche Schätzung der Betriebsbedingungen im Reaktor.

Es gibt verschiedene Möglichkeiten, die anfängliche Rührgeschwindigkeit zu schätzen, z. B. konstante Tippgeschwindigkeit oder Leistung pro Volumen. Dabei handelt es sich jedoch um sehr grobe Schätzungen, die den geometrischen Besonderheiten der Reaktoren nicht Rechnung tragen. Die Verwendung eines maschinellen Lernmodells führt zu wesentlich besseren Schätzungen, wie das folgende Beispiel zeigt.

Skalierungskonfiguration: Labor zu Pilot

Abbildung 5 zeigt die Skalierungskonfiguration mit einem 3 Liter Reaktor, der auf 280 Liter skaliert werden soll.

reactors ML test
Abbildung 5: Skalierung von 3 L auf 280 L

Erste Schätzung der Rührgeschwindigkeit auf der Grundlage von Leistung pro Volumen

Die anfängliche Schätzung auf der Grundlage der Leistung pro Volumen (P/V) führt zu einer anfänglichen Rührgeschwindigkeit von 132 U/min. Der P/V-Ansatz steht mit der turbulenten Dissipationsrate in Verbindung, liefert aber im Vergleich zu einem ML-Modell keine A-priori-Informationen über die Turbulenzgrade, Geschwindigkeiten und Scherraten.

initail estimate
Abbildung 6: Erste Schätzung der Rührgeschwindigkeit auf der Grundlage von Leistung pro Volumen

Verwendung des Modells des maschinellen Lernens

Die Werte im gelben Rechteck in Abbildung 7 sind die vom ML-Modell vorhergesagten Mediane des Ausgangsreaktors mit einem Volumen von 3 L. Die unteren Werte stellen die Mediane bei verschiedenen Rührgeschwindigkeiten des Zielreaktors mit einem Volumen von 280 L dar. Ziel ist es, eine anfängliche Schätzung der Rührgeschwindigkeit zu finden, die annähernd mit Epsilon, k und der Geschwindigkeit des 3 Liter Reaktors übereinstimmt.

Für die beste Übereinstimmung von Turbulenz und Geschwindigkeit wurden die Rührgeschwindigkeiten 110 U/min und 60 U/min ermittelt. Es ist zu beachten, dass eine perfekte Übereinstimmung aus verschiedenen Gründen nicht zu erwarten ist. Erstens ist der Algorithmus ein Entscheidungsbaum, der für eine Regression verwendet wird. Zweitens kann es Lücken in den Daten geben, die die geforderte Konfiguration nicht vollständig repräsentieren, und drittens ist das Modell noch nicht feinabgestimmt.

ML results
Abbildung 7: Mit dem ML-Modell vorhergesagte Mediane für den 3L Reaktor (gelbes Rechteck) und den 280L Reaktor darunter. Die Werte in den roten Rechtecken sind die relevanten Werte für die Skalierung und weisen die beste Übereinstimmung mit den Werten aus dem 3L Reaktor auf.

Die CFD-Ergebnisse

Der Zweck des vorliegenden Anwendungsfalls besteht darin, die Beschleunigung einer Skalierung durch ein schnelles Vorscreening der Betriebsbedingungen mittels maschinellen Lernens (ML) aufzuzeigen. Für die mit ML vorhergesagten Betriebsbedingungen werden nachgängig vollständige CFD-Simulationen durchgeführt, um die Gültigkeit der Betriebsbedingungen zu überprüfen. Wie in Abbildung 7 dargestellt, wurde die Rührgeschwindigkeit für die Übereinstimmung von Epsilon auf 110 U/min eingestellt und auf 60 U/min für die Übereinstimmung von k und die Umag. Infolgedessen wird erwartet, dass die kumulativen Verteilungen dieser Grössen für den Ausgangsreaktor (3L) und den Zielreaktor (280L) übereinstimmen.

group epsilon cum log colored
Abbildung 8: ML-Vorhersage der turbulenten Dissipationsrate bei einer Ziel-Rührgeschwindigkeit von 110 U/min (grüne Linie) in sehr guter Übereinstimmung mit der Ausgangsreaktordrehzahl von 400 U/min (schwarze gestrichelte Linie)
group k cum log colored
Abbildung 9: ML-Vorhersage der turbulenten kinetischen Energie bei einer Ziel-Rührgeschwindigkeit von 60 U/min (blaue Linie) in guter Übereinstimmung mit der Ausgangsreaktordrehzahl von 400 U/min (schwarze gestrichelte Linie)
group Umag cum log colored
Abbildung 10: ML-Vorhersage der Geschwindigkeit bei einer Ziel-Rührgeschwindigkeit von 60 U/min (blaue Linie) in exzellenter Übereinstimmung mit der Ausgangsreaktordrehzahl von 400 U/min (schwarze gestrichelte Linie)

 

Zusammenfassung

Der vorliegende Anwendungsfall zeigt, wie maschinelles Lernen für ein vereinfachtes und beschleunigtes Screening verschiedener Reaktorkonfigurationen verwendet werden kann, um die am besten geeignete Reaktorkonfiguration für das Scale-up auf der Grundlage verschiedener fluiddynamischer Grössen zu finden. Die resultierende Konfiguration wurde durch CFD-Simulationen als korrekt nachgewiesen.

Beziehen Sie ein Machine Learning Modell Ihrer eigenen Reaktoren

Wird ein solches ML-Modell für bestimmte Reaktoren in einem Unternehmen trainiert, operationalisiert und intern über eine Webanwendung zur Verfügung gestellt, kann dies einen wesentlichen Beitrag zur Minimierung des Risikos von Chargenausfällen leisten, da es die Auswahl eines geeigneten Reaktors frühzeitig unterstützt. Dies kann zu erheblichen Kosteneinsparungen führen, sowohl durch die eingesparten Rohstoffe als auch durch den eingesparten Zusatzaufwand, der typischerweise mit jedem neuen Prozesslauf verbunden ist.

Wie im vorliegenden Anwendungsfall gezeigt, können wir einzelne Reaktoren mit unserem automatisierten Verfahren simulieren und ein ML-Modell trainieren, das diese Reaktoren repräsentiert.

Sind Sie an einem ML-Modell interessiert, das Ihre Reaktoren repräsentiert? Wir helfen gerne - kontaktieren Sie uns für eine kostenlose Beratung.