Sprachmodelle helfen inzwischen auch in der Chemie, neue Wirkstoffe zu identifizieren. Doch wirkliches biochemisches Verständnis entwickeln sie dabei nicht, wie Forschende der Universität Bonn zeigen.
Prof. Dr. Jürgen Bajorath und Doktorand Jannik P. Roth von der Life Science Informatics an der Universität Bonn.
(Bild: Gregor Hübl/ Uni Bonn)
Große Sprachmodelle sind oft verblüffend gut in dem, was sie tun – ob sie nun mathematische Beweise führen, Musik komponieren oder einen Werbeslogan entwerfen. Doch wie kommen sie zu ihren Ergebnissen? Verstehen sie tatsächlich, was eine Symphonie ausmacht oder einen guten Witz? Es ist gar nicht so einfach, darauf eine Antwort zu geben. „Alle Sprachmodelle sind eine Black Box“, betont Prof. Dr. Jürgen Bajorath. „Es ist schwer, ihnen – metaphorisch gesprochen – in den Kopf zu schauen.“
Dennoch hat der Chemieinformatiker am Lamarr-Institut für maschinelles Lernen und künstliche Intelligenz der Universität Bonn genau das versucht. Und zwar für eine besondere Form von KI-Algorithmen – die chemischen Transformer-Modelle. Sie funktionieren im Prinzip ganz ähnlich wie ChatGPT, Google Gemini oder Elon Musks „Grok“. Diese wurden mit riesigen Mengen von Texten trainiert und haben so gelernt, selbst Sätze zu formulieren. Chemische Sprachmodelle basieren dagegen in der Regel auf deutlich weniger Daten. Sie eignen sich ihr Wissen anhand molekularer Repräsentationen und Beziehungen an, zum Beispiel den sogenannten Smiles-Strings. Das sind Zeichenfolgen, die Moleküle und deren Struktur als eine Sequenz von Buchstaben und Symbolen darstellen.
Bildergalerie
Trainingsdaten gezielt manipuliert
In der Pharmazie sucht man oft nach Substanzen, die bestimmte Enzyme hemmen oder Rezeptoren blockieren. Mit chemischen Sprachmodellen kann man zum Beispiel versuchen, aktive Moleküle auf der Basis der Aminosäure-Sequenzen von Zielproteinen vorherzusagen. „Wir haben dieses sogenannte sequenzbasierte Moleküldesign als ein Testsystem benutzt, um besser zu verstehen, wie die Transformer zu ihren Vorhersagen kommen“, erklärt Bajoraths Doktorand Jannik Roth, der die Studie mit ihm durchgeführt hat. „Wenn man ein solches Modell nach einer Anlernphase etwa mit einem neuen Enzym füttert, spuckt es mit etwas Glück eine Verbindung aus, mit der sich dieses Enzym hemmen lässt. Doch heißt das, dass die KI gelernt hat, nach welchen biochemischen Prinzipien so eine Hemmung erfolgt?“
In der Anlernphase werden chemische Sprachmodelle mit Paaren aus Aminosäure-Sequenzen und den dazugehörigen Wirkstoff-Molekülen trainiert. Um ihrer Frage nachzugehen, haben die Wissenschaftler diese Trainingsdaten gezielt manipuliert. „Wir haben das Modell beispielsweise zunächst nur mit einer bestimmten Gruppe von Enzymen und deren Hemmstoffen gefüttert“, erklärt Bajorath. „Wenn wir nun für Testzwecke ein neues Enzym aus derselben Familie genutzt haben, schlug uns der Algorithmus tatsächlich einen plausiblen Hemmstoff vor.“ Anders sah es dagegen aus, wenn die Forscher im Test ein Enzym aus einer anderen Familie verwandten – also eines, das im Körper ganz andere Aufgaben übernimmt. Dann lieferte das chemische Sprachmodell nur unbrauchbare Ergebnisse.
Statistische Daumenregel
„Das spricht dagegen, dass das Modell allgemein gültige chemische Prinzipien erlernt hat – dass es also weiß, wie die Hemmung eines Enzyms chemisch in aller Regel abläuft“, sagt der Wissenschaftler. Stattdessen basieren die Vorschläge allein auf statistischen Zusammenhängen, also auf Mustern in den Daten. Etwa: Wenn das neue Enzym einem der Enzyme ähnelt, die ich in der Trainingsphase gelernt habe, dann wird bei ihm wohl auch ein ähnlicher Hemmstoff funktionieren. „Eine solche Daumenregel muss nicht unbedingt schlecht sein“, betont Bajorath, der am Lamarr-Institut den Bereich KI in den Lebenswissenschaften und der Medizin verantwortet. „Schließlich kann sie beispielsweise dabei helfen, neue Einsatzgebiete für bekannte Wirkstoffe zu finden.“
Allerdings ließen die Modelle in der Studie auch bei der Abschätzung von Ähnlichkeiten jede biochemische Kenntnis vermissen. So hielten sie Enzyme (oder auch Rezeptoren und andere Proteine) stets dann für ähnlich (und schlugen dementsprechend auch ähnliche Hemmstoffe vor), wenn diese in 50 bis 60 % ihrer Aminosäure-Sequenz übereinstimmten. Den Rest der Sequenzen konnten die Forscher beliebig durcheinander würfeln. Allerdings sind oft nur ganz bestimmte Teile eines Enzyms nötig, damit es seine Aufgabe erledigen kann. Eine einzige geänderte Aminosäure an dieser Stelle kann es funktionsunfähig machen. Andere Bereiche sind dagegen für die Funktion weniger relevant. „Die Modelle lernten während ihres Trainings nicht, wichtige von unwichtigen Sequenzanteilen zu unterscheiden“, betont Bajorath.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Modelle plappern zuvor Gehörtes nach
Die Ergebnisse der Studie zeigen daher eindrucksvoll, dass den Modellen zumindest für dieses Testsystem jegliches tiefere chemische Verständnis abgeht. Bildlich ausgedrückt, plappern sie nur mit leichten Variationen nach, was sie irgendwann in einem ähnlichen Kontext aufgeschnappt haben. „Das bedeutet nicht, dass sie für die Wirkstoff-Forschung ungeeignet sind“, betont Bajorath, der auch Mitglied im Transdisziplinären Forschungsbereich (TRA) „Modelling“ der Universität Bonn ist. „Es ist gut möglich, dass sie Wirkstoffe vorschlagen, die tatsächlich bestimmte Rezeptoren blockieren oder Enzyme hemmen. Das tun sie aber mit Sicherheit nicht, weil sie die Chemie so gut verstehen, sondern weil sie Ähnlichkeiten in textbasierten molekularen Repräsentationen und statistischen Korrelationen erkennen, die uns verborgen bleiben. Das diskreditiert ihre Ergebnisse nicht. Man darf sie aber auch nicht überinterpretieren.“
Originalpublikation: Jannik P. Roth, Jürgen Bajorath: Unraveling learning characteristics of transformer models for molecular design, Patterns, https://doi.org/10.1016/j.patter.2025.101392, URL: https://www.cell.com/patterns/fulltext/S2666-3899(25)00240-5