Der Computer als Vielleser und Schnellschreiber
Künstliche Intelligenz hilft nicht nur Nachrichtenmeldungen zu schreiben. Auch in der wissenschaftlichen Publizistik dienen Computerprogramme vermehrt als Lese- und Schreibassistenz. So lassen sich Textmengen durchforsten und kompilieren, die ein Forscher in seinem Leben nie bewältigen könnte.
Die Fortschritte, welche die Künstliche Intelligenz in den vergangenen Jahren gemacht hat, sind erstaunlich. Computer spielen mittlerweile nicht nur besser Schach, Go und Poker als der Mensch, sondern komponieren auch Lieder, malen Bilder und schreiben Artikel. In Redaktionen und Nachrichtenagenturen kommen Textprogramme («Roboterjournalisten») zum Einsatz, die automatisiert standardisierte Finanz- und Sportberichte generieren. Bei Gmail gibt es seit geraumer Zeit die Funktion «Intelligentes Schreiben» (Smart Reply), bei der ein Algorithmus E-Mails analysiert und passende Antwortbausteine vorschlägt. Und bei Universitäten oder Banken werden mittlerweile automatisierte Dialogsysteme, sogenannte Chatbots, eingesetzt, die automatisch Anfragen von Kunden beantworten.
Beta Writer soll Forschern dabei helfen, Fachliteratur schneller zu erschliessen.
Im April ist im Wissenschaftsverlag Springer Nature das «erste maschinengenerierte Buch» erschienen: ein Werk über Lithium-Ionen-Batterien. Ein Algorithmus hat über 50’000 Fachaufsätze zum Thema durchforstet und sie in einer logisch kohärenten Form zusammengetragen. Auf Grundlage eines sogenannten Clustering-Verfahrens wurde eine Dokumentenstruktur generiert, in die die kondensierten Texte eingesetzt wurden. Beta Writer, wie der «Buchautor» heisst, ist eine Koproduktion von Springer Nature und von Wissenschaftlern der Goethe Universität Frankfurt. Er soll Forschern dabei helfen, Fachliteratur schneller zu erschliessen.
Jedes Jahr werden weltweit rund 2,5 Millionen wissenschaftliche Fachaufsätze publiziert. Selbst in hochspezialisierten Disziplinen ist es schwierig, die relevanten Publikationen im Blick zu behalten. Der Computer soll nun seine gigantische Rechenpower ausspielen und als eine Art Hilfswissenschaftler Textmengen durchpflügen, die ein Forscher niemals selbst lesen könnte.
Lesen am Ende nur noch Computer Bücher, die Computer geschrieben haben?
Die Meldung über das computergenerierte Buch sorgte nicht nur in der Verlagswelt für Aufsehen. Schreiben Algorithmen jetzt bald auch noch Bücher? Wem gebühren die Urheberrechte? Den Programmierern? Den Studienautoren? Dem Computer? Dem Verlag? Oder einem Autorenkollektiv aus Mensch und Maschine? Und wird der ohnehin schon übersättigte Buchmarkt mit noch mehr Publikationen geflutet, dass man immer mehr Algorithmen braucht, um die Vielzahl der Neuerscheinungen überblicken zu können? Lesen am Ende nur noch Computer Bücher, die Computer geschrieben haben?
Um den Befürchtungen sogleich entgegenzutreten: Der Algorithmus hat keine eigene Forschung betrieben und auch nicht geschrieben, sondern lediglich die Erkenntnisse von Wissenschaftlern aggregiert – und zwar nach Vorgaben, die ihm menschliche Entwickler einprogrammiert haben. Auch Schreibautomaten, die Drehbücher oder Romane schreiben, sind nicht kreativ, sondern sampeln lediglich altes Material und fügen es zu neuartigen Plots zusammen. Eine Bedrohung für die menschliche Kreativität ist Beta Writer also nicht, im Gegenteil: In der automatisierten Erkenntnisproduktion liegt eine grosse Chance für die Wissenschaft.
KI-Systeme könnten nicht nur in Bildmaterial, sondern auch in Texten Muster erkennen und der Forschung an der entscheidenden Stelle zum Durchbruch verhelfen.
So hat ein neuronales Netzwerk jüngst Zusammenhänge in alten Fachaufsätzen zu Thermoelektrik entdeckt, die menschlichen Forschern jahrelang verborgen geblieben waren. Wissenschaftler des Lawrence Berkeley National Laboratory haben den maschinell lernenden Algorithmus mit 3,3 Millionen Abstracts (Zusammenfassungen von Fachaufsätzen) gefüttert. Dieser besass am Ende des Trainings einen Wortschatz von 500’000 Wörtern. Obwohl der Algorithmus keine Definition von Thermoelektrik und auch sonst keine Ahnung von dem Thema hatte, gelang es ihm allein durch Wortkombinationen, Zusammenhänge zwischen den Aufsätzen herzustellen und Vorhersagen über thermoelektrische Materialien zu treffen. KI-Systeme könnten nicht nur in Bildmaterial, sondern auch in Texten Muster erkennen und der Forschung an der entscheidenden Stelle zum Durchbruch verhelfen. Die Potenziale sind riesig.
Im April haben Wissenschaftler des MIT das Konzept eines neuronalen Netzwerks vorgestellt, das Fachaufsätze scannt und selbständig Zusammenfassungen erstellt – und so die Forscher entlastet. Solche KI-Systeme könnten theoretisch auch forschungsbegleitend Ergebnisse protokollieren und zu einem Paper zusammenfassen. Schreiben gilt ja gerade in der Naturwissenschaft als eher lästige Aufgabe. 50 bis 100 Stunden dauert es im Durchschnitt, bis ein wissenschaftliches Paper abgefasst ist. Wertvolle Zeit, die man in Forschung investieren könnte, gerade weil Lehre und Verwaltungsaufgaben im knappen Zeitbudget der Wissenschaftler immer mehr Raum einnehmen. Mit dem Manuscript Writer gibt es bereits ein Programm, das Forschungsdaten zusammenführt und auf dieser Grundlage automatisch Entwürfe generiert.
Die Gefahr für das Wissenschaftssystem besteht nicht darin, dass Roboter Fachaufsätze oder ganze Bücher schreiben, sondern dass Forscher sich roboterhaft verhalten.
Die Frage ist, was letztlich Eingang in die Publikationen findet und wie verlässlich die Peer-Review-Verfahren sind, die schon seit einiger Zeit in der Kritik stehen, weil sie methodische Mängel nicht erkennen. Im Jahr 2005 erstellten drei MIT-Studenten mit einem von ihnen entwickelten Textgenerator einen Nonsense-Aufsatz mit weitgehend erfundenen Zitaten und Grafiken und reichten ihn bei der World Multiconference on Systemics, Cybernetics and Informatics ein, einer Konferenz, die für ihre laxen Prüfverfahren bekannt war. Die Publikation wurde akzeptiert – die Veranstalter waren blossgestellt.
Der neuseeländische Robotikforscher Christoph Bartneck hat 2016 mit der Autocomplete-Funktion von iOS ein ganzes Paper über Atomenergie geschrieben – obwohl das gar nicht sein Fachgebiet war. Den mit Formeln gespickten Aufsatz hübschte er mit einer Wikipedia-Grafik von Kernteilchen auf und reichte es unter falschem Namen – als fiktive Atomphysikerin Iris Pear von der Umbria Polytech University, die es ebenfalls nicht gibt – bei der International Conference on Atomic and Nuclear Physics ein. Drei Stunden später wurde das Paper akzeptiert. Das warf freilich kein gutes Licht auf die Gutachter.
Die Gefahr für das Wissenschaftssystem besteht nicht darin, dass Roboter Fachaufsätze oder ganze Bücher schreiben, sondern dass Forscher sich roboterhaft verhalten. Man braucht sich also keine Sorgen machen, dass Roboter nach dem Lehrstuhl greifen. Wie sagte der Künstler Ross Goodwin so schön: «Wenn wir Computer das Schreiben lehren, ersetzen uns Computer genauso wenig wie das Klavier den Pianisten – sie werden auf gewisse Weise zu unseren Stiften, und wir werden mehr als Schreiber. Wir werden die Schreiber der Schreiber.»
Dieser Artikel wurde zuerst bei spektrum.de veröffentlicht.