Worum geht es?
Die Veröffentlichung einer Testversion des Chatbots ChatGPT im November 2022 hat zu einem Hype in sozialen Medien und Massenmedien geführt. Diese Website (
gmls.phsz.ch) liefert Einordnungen der Professur "Digitalisierung und Bildung" der pädagogischen Hochschule Schwyz zur Frage, welche Auswirkungen generative Machine-Learning-Systeme wie ChatGPT auf die Schule haben.
Unsere Überlegungen sind auch in Form von
Vorträgen und
Publikationen verfügbar. Bemerkungen und Hinweise sind willkommen:
beat.doebeli@phsz.ch
Bei dieser Seite handelt es sich um einen zusammenfassenden Überblick unserer Einschätzungen. Unter gmls.phsz.ch finden Sie die Startseite der ausführlichen Version.
Allgemeine Einordnung
Die Veröffentlichung von ChatGPT im November 2022 machte eine längere und grössere Entwicklung im Bereich des maschinellen Lernens allgemein sichtbar. Vergleichbar mit der Markteinführung des iPhones im Jahr 2007 ist ChatGPT nicht aus dem Nichts entstanden und hat keine komplett neuen und unerwarteten Eigenschaften. iPhone wie ChatGPT gelang es aber, bestehende bzw. sich entwickelnde Technologien so zu vereinen und einfach nutzbar zur Verfügung zu stellen, dass sie in grösserem Umfang wahrnehmbar wurden und als Beginn einer jeweils neuen Ära gelten.
Bei der Einschätzung des Phänomens gilt es verschiedene Abstraktions- und damit verbundenen Zeiträume zu unterscheiden. Gewisse, versionsspezifische Eigenschaften haben eine Gültigkeit von wenigen Wochen, während andere grundlegende Aspekte nicht spezifisch für ChatGPT sind, dafür aber Jahre oder gar Jahrzehnte Gültigkeit haben werden.
Mehr...
Technische Perspektive
Die folgenden technischen Einschätzungen erfordern kein technisches Vorwissen, sind allgemeinverständlich formuliert und gehen nicht detailliert auf die Funktionsweise generativer Machine-Learning-Systeme ein (dazu findet sich mehr unter
Funktionsweise).
- ChatGPT ist nur ein Schritt in einer längeren Entwicklung
ChatGPT ist bei weitem nicht das erste Computerprogramm, welches einen umgangssprachlichen Dialog mit einem Computer ermöglicht. Bereits 1964 hat der deutsch-amerikanische Informatiker Joseph Weizenbaum mit Eliza einen Chatroboter entwickelt, der einige Bekanntheit erreicht hat. Weizenbaum hat auf einfachste Weise einen empathischen Psychiater zu simulieren versucht, der auf Antworten mit entsprechenden Nachfragen reagiert und war danach erschrocken darüber, wie ernst seine Umgebung den Chatroboter genommen hat. Während Eliza noch explizit programmiert worden war, ist ChatGPT ein sogenanntes Large Language Model, das auf neuronalen Netzwerken beruht. nutzt ChatGPT derzeit die Versionen 3.5 und 4.0 von GPT (Generative Pretrained Transformer) - die Version 1 von GPT wurde 2018 entwickelt.
Es gibt mindestens drei Gründe, warum die aktuellen Fähigkeiten von ChatGPT nur eine Momentaufnahme darstellen:
- Zunehmende Rechenleistung: Das Moore'sche Gesetz sowie effizientere Hardware und Algorithmen sorgen dafür, dass Sprachgeneratoren künftig noch leistungsfähiger werden.
- Konkurrenzprodukte: OpenAI ist nicht das einzige Unternehmen, das generative Machine-Learning-Systeme entwickelt.
- Macht der Schnittstellen: Die Mächtigkeit des Digitalen beruht unter anderem darauf, dass sich IT-Systeme mit Hilfe von Schnittstellen kombinieren lassen und sich daraus neue, mächtigere Gesamtsysteme ergeben. Auch bei generativen Machine-Learning-Systemen ist in naher Zukunft eine Explosion von kombinierten Systemen zu erwarten, bei denen die Potenziale von generativen Machine-Learning-Systemen mit anderen Systemen gekoppelt neue Möglichkeiten bieten werden. Dass OpenAI die entsprechende Schnittstelle (API) zu GPT zur Verfügung gestellt hat, war der erste pragmatische Schritt dazu.
- Es geht nicht nur um Text, sondern um alles, was sich digital repräsentieren lässt
Mittels generativer Machine-Learning-Systeme lassen sich alle digital repräsentierbaren Objekte (Texte, Bilder, Töne, Videos, 3D-Modelle, Proteine etc.) generieren bzw. von einer Datenform in eine andere Überführen (bspw. aus Bildern Bildbeschreibungen oder Musik erstellen.)
- Die Grenze des Möglichen ist nicht einfach zu benennen
Obwohl ChatGPT den aktuellen Stand einer längeren technologischen Entwicklung darstellt, sind sich Expertinnen und Experten nicht einig, wo die Grenze des technisch Möglichen liegt. Bei ChatGPT zeigten sich gewisse Expert:innen überrascht, welche Qualitätsverbesserung im Vergleich zu früheren GPT-Versionen in so kurzer Zeit möglich wurde - u.a. durch mehr Daten und mehr Rechenleistung.
- ChatGPT ist ein sehr allgemeines Werkzeug, das mehr auf Breite als auf Tiefe setzt
ChatGPT ist ein generisches Werkzeug, das auf breite Anwendung ausgelegt ist. Es ist deshalb zu erwarten, dass künftige, auf spezielle Teilgebiete zugeschnittene Lösungen deutlich leistungsfähiger sein werden.
- ChatGPT & Co. haben gewisse Ähnlichkeiten mit Suchmaschinen
Sowohl generative Machine-Learning-Systeme als auch Suchmaschinen beruhen auf einem grossen Text- bzw. Datenkorpus. Während bei generativen Machine-Learning-Systemen mit grossem Rechenaufwand ein neuronales Netzwerk trainiert wird, findet bei Suchmaschinen ein Indexing- und Rankingprozess statt.
- ChatGPT beruht auf einem statistischen Modell und ist keine Logik-Maschine
GPT3 und Co. bauen ihre Antworten primär aufgrund von statistisch zu erwartenden Wörtern und Sätzen zusammen, deren Wahrscheinlichkeiten sie in ihrem Textkorpus gefunden haben. Es kommt deshalb mitunter vor, dass sie sachliche und/oder logische Fehler generieren.
- generative Machine-Learning-Systeme beruhen auf statistischen Modellen und ihre Antworten kommen meist auch unter Zuhilfenahme von Zufall zustande
Sprachgeneratoren wie ChatGPT rechnen vereinfacht formuliert die wahrscheinlichste Antwort auf eine Eingabe/Anfrage aus. Dabei wird aber eine Prise Zufall beigemischt (Fachbegriff: Temperatur), was unter anderem zur Folge hat, dass auf die gleiche Eingabe/Anfrage nicht jedes Mal die gleiche Antwort errechnet wird.
- Bei der Diskussion gilt es kurzlebige Versionseigenschaften von mittelfristigen Produkteigenschaften und insbesondere von langfristigen Technologieeigenschaften zu unterscheiden
- Versionsspezifisch: Bei der seit November 2022 verfügbaren Version von ChatGPT handelt es sich um eine Testversion zur Verbesserung des Produkts. Die Interaktionen von Testnutzenden fliessen automatisiert und/oder manuell in den Dienst ein, so dass ChatGPT bereits nach einer Woche ganz anders auf gewisse Anfragen reagiert. Somit sind derzeit sogar Aussagen zum konkreten Produkt ChatGPT manchmal nur von zeitlich sehr begrenzter Gültigkeit.
- Produktspezifisch und darum langfristig nicht relevant für die Diskussion sind u.a. folgende Punkte:
- ChatGPT beruht auf einem Textkorpus von 2021 und bezieht bei Antworten das aktuelle Internet nicht mit ein
Dies ist eine produktspezifische Begrenzung von ChatGPT und kein grundsätzliches Hindernis. Bereits im Februar 2023 bestehen verschiedene Alternativprodukte, die aktuelle Daten aus dem Internet bei ihren Antworten berücksichtigen.
- ChatGPT zitiert derzeit nicht korrekt (Zitierstil) und erfindet mitunter Quellen.
Dies sind beides Eigenschaften, die sich leicht korrigieren lassen in anderen Produkten, da sich sowohl die korrekte Zitierweise automatisieren und automatisiert prüfen lässt als auch eine automatische Prüfung auf die Existenz von Quellen leicht machbar ist. Auch hier existieren im Februar 2023 bereits Alternativprodukte, auf welche diese Kritik nicht oder nur noch teilweise zutrifft.
- GMLS-Erkennungssoftware wird ein Wettrüsten auslösen, aber keine sichere Erkennung bringen
Die Entwicklung von Programmen zur Erkennung von computergenerierten Texten wird ein Wettrüsten zwischen ML-Textgenerierung und ML-Texterkennung auslösen, da Textgenerierungsprogramme die verfügbaren Erkennungsprogramme als zusätzlichen Filter / Trainingsmöglichkeit nutzen werden (GAN-Netzwerk mit Erkennungsalgorithmus als Diskriminator). Es wird somit vermutlich langfristig nicht möglich sein, computergenerierte Texte zuverlässig automatisiert erkennen zu können.
mehr...
- Sprachgeneratoren sind sehr energieintensiv
Insbesondere das erstmalige Training von Sprachgeneratoren ist sehr rechen- und damit energieintensiv. Derzeit werden aber sparsamere Trainingsverfahren entwickelt, so dass dieser Aspekt mittelfristig an Bedeutung verlieren könnte.
mehr...
Gesellschaftliche Perspektive
Im Folgenden werden nur gesellschaftliche Aspekte aufgeführt, die einerseits spezifisch sind für generative Machine-Learning-Systeme und andererseits Konsequenzen haben für die Schule, die über "Das sollte man in der Schule thematisieren" hinausgehen:
- ChatGPT & Co. sind Werkzeuge, die ab jetzt allgemein – teilweise integriert in andere Produkte – zur Verfügung stehen und nicht mehr verschwinden werden.
Die Funktionalitäten, die ChatGPT & Co. derzeit als eigenständige Dienste (auf eigenen Websites oder Apps) anbieten, werden bald auch in andere Produkte integriert werden und damit allgemein und allgegenwärtig verfügbar sein. Es ist davon auszugehen, dass Textverständnis und Textgeneration wie sie ChatGPT & Co. heute zeigen, auf praktisch jedem digitalen Gerät und in praktisch jeder Software (Textverarbeitung, Tabellenkalkulation etc.) verfügbar sein wird.
mehr...
- ChatGPT & Co. konkurrenzieren traditionelle Suchmaschinen als Rechercheinstrumente
Viele Beta-User von ChatGPT berichten, dass sie ChatGPT teilweise als Ersatz für eine Suchmaschine verwenden. Es ist somit denkbar, dass ChatGPT & Co. Suchmaschinen bis zu einem gewissen Grad als Werkzeuge ablösen werden.
- ChatGPT & Co. eröffnen den Kampf um die Vormachtstellung im Bereich Suchmaschinen und bedrohen insbesondere Google
Wenn generative Machine-Learning-Systeme teilweise die Aufgaben von traditionellen Suchmaschinen übernehmen, so gerät deren Vormachtstellung und evtl. auch deren werbebasiertes Geschäftsmodell in Gefahr. Insbesondere löst aber der technische Fortschritt im Bereich der generativen Machine-Learning-Systeme ein erneutes Wettrennen um die Vormachtstellung der grossen IT-Firmen (Google, Amazon, Facebook, Apple, Microsoft) aus. (Biblionetz:a01506)
- Es ist ein grosser Unterschied, ob das Ergebnis einer Recherche eine Dokumentenauswahl oder eine einzige Antwort ist.
Traditionelle Suchmaschinen können sich bis zu einem gewissen Grad aus der Verantwortung für die Inhalte ziehen, da sie ja "nur" eine Auswahl an möglicherweise relevanten Quellen für eine Suchanfrage liefern. Textgeneratoren hingegen, die eine einzige Antwort liefern, haben eine stärkere Verantwortung für diese Antwort, selbst wenn sie dafür Belege in Form von Quellen angeben.
Der Unterschied zwischen der Angabe einer Dokumentenauswahl und einer Antwort mit Quellenangabe ist auch relevant für die Betreiber:innen von Websites: Während bei ersterem ein Besuch der angegebenen Webseite noch notwendig ist für eine Antwort, entfällt dies bei Antworten von Textgeneratoren. Es ist somit zu erwarten, dass Webseiten weniger besucht würden, was auch ökonomische Konsequenzen hätte.
- ChatGPT & Co. vereinfachen und vergünstigen das Erstellen von Text massiv.
Das wird vermutlich mindestens folgende Konsequenzen haben (die für die Allgemeinbildung relevant sind):
- Die Informationsflut wird noch einmal um eine Grössenordnung ansteigen
(Quellen, Belege und Kritik siehe Biblionetz:a01490)
- Die Flut an Fake-News dürfte weiter zunehmen
(Quellen siehe Biblionetz:a01493)
- Das Erkennen von Fake-News aufgrund von sprachlichen Fehlern dürfte schwieriger werden
- Phishing-Angriffe dürften künftig sprachlich fehlerfrei und evtl. extrem personalisiert sein
Bisher konnte man davon ausgehen, dass die meisten Phishing-Versuche sprachlich eher holprig und fehlerhaft formuliert und inhaltlich eher allgemein gehalten waren. Generative Machine-Learning-Systeme ermöglichen künftig sprachlich perfekte und inhaltlich angepasste Anfragen. (17.01.23 Bericht von heise.de)
Folgende Aspekte erachten wir als entweder nicht schulspezifisch oder nicht GMLS-spezifisch:
- Es ist unklar, ob generative Machine-Learning-Systeme das Recht am geistigen Eigentum verletzen
Generative Machine-Learning-Systeme werden derzeit oft mit Daten trainiert, die urheberrechtlich geschützt sind. Auch wenn die danach erzeugten Produkte Textpassagen oder Bildteile direkt enthalten, gibt es Stimmen, die in dieser ungefragten Verwendung dieser Werke eine Verletzung des geistigen Eigentums sehen.
Unabhängig von der juristischen Einschätzung erachten wir dies nicht als schulspezifisch zu klärende Frage. Generative Machine-Learning-Systeme mit der Begründung einer ungeklärten Rechtslage in der Schule nicht zu thematisieren oder verwenden, scheint uns keine zielführende Strategie zu sein. Detaillierter...
- Die Verwendung aktueller generativer Maschine-Learning-Systeme sind meist nicht datenschutzkonform möglich
Die aktuellen, leistungsfähigen generativen Maschine-Learning-Systeme sind nur cloudbasiert verfügbar und lassen sich derzeit nicht lokal oder auf eigenen Servern installieren. Die Anbieter stellen die generativen Maschine-Learning-Systeme derzeit oft in einer Basisversion kostenlos zur Verfügung um statistische Nutzungsdaten zu erheben. Es ist deshalb davon auszugehen, dass Nutzungsdaten erhoben werden, die nicht mit den jeweils lokal geltenden Datenschutzverordnungen konform sind.
Das Phänomen, dass attraktive digitale Dienste nicht datenschutzkonform sind, ist in der bisherigen Entwicklung der digitalen Transformation häufig und nicht auf Sprachgeneratoren beschränkt. mehr...
Bedeutung für die Schule
Generative ML-Systeme wie ChatGPT & Co. sind in verschiedener Hinsicht relevant für die Schule:. Grundsätzlich lassen sich bei generativen ML-Systemen wie üblich bei Teilaspekten des Digitalen in der Schule drei Themenfelder unterscheiden:
- Generative ML-Systeme als Thema im Unterricht
- Generative ML-Systeme als Werkzeuge/Medien im Unterricht
- Veränderungen von Schule durch generative ML-Systeme
Bei den ersten beiden Aspekten stellen sich Fragen, die bald nach Antworten verlangen, aber auch einfacher zu beantworten sind. Deutlich schwieriger sind die Fragen beim dritten Aspekt zu beantworten.
Generative ML-Systeme als Thema im Unterricht |
Medienkompetenz |
Die Bedeutung von Medienkompetenz nimmt nochmals zu
Wenn durch generative ML-Systeme die allgemeine Informationsflut und insbesondere
auch der Umfang und Perfektionsgrad von Fakenews nochmals um eine Grössenordnung zunimmt,
so nimmt auch die Bedeutung von Medienkompetenz zu, die unter anderem künftig auch das
Erkennen und den Umgang mit computergenerierten Texten umfassen muss.
mehr...
|
Information literacy |
Umgang mit generativen ML-Systemen als Teil von information literacy
Wenn generative ML-Systeme ein wichtiges Instrument der Recherche werden und bis zu einem gewissen Grad
"traditionelle" Suchmaschinen ersetzen oder mindestens ergänzen werden, so muss der Umgang mit
generativen ML-Systemen Teil der Allgemeinbildung werden.
|
Unterrichtsthema |
Generative ML-Systeme als mehrperspektivisches Thema in der Schule
Das Verständnis und die kompetente Nutzung von generativen ML-Systemen gehört künftig zur Allgemeinbildung.
Dabei reicht - wie auch bei bisherigen (digitalen) Werkzeugen und Medien - eine reine Anwendungskompetenz nicht.
Schülerinnen und Schüler sollten das Thema aus den drei Dagstuhl-Perspektiven betrachtet haben.
mehr...
|
Generative ML-Systeme als Werkzeug / Medium für die Schule |
Lehr- / Lernunterstützung |
Potenziale für Materialerstellung und Rückmeldungen an Schülerinnen und Schüler
Grundsätzlich bieten generative ML-Systeme das Potenzial, personalisiertes Unterrichtsmaterial
und (individuelle) Rückmeldungen an Schülerinnen und Schüler generieren zu lassen. Es ist aber noch nicht geklärt,
wie didaktisch passend sich solche Texte generieren lassen und welche evtl. unerwünschten Nebenwirkungen sich ergeben können,
wenn Computersysteme gewisse Aufgaben übernehmen, die bisher von Lehrpersonen geleistet worden sind.
(Entsprechende Forschungen und Projekte sind oft unter den Stichworten Intelligent tutoring system (ITS), learning analytics oder Adaptivität zu finden.)
mehr...
|
Datenschutz |
Aktuelle generative ML-Systeme sind derzeit aus Kapazitätsründen meist auf externen Servern verfügbar. Damit stellen sich die üblichen Datenschutzprobleme für Schulen: Ist es zulässig, dass schützenswerte Daten von Lehrkräften und meist minderjährigen Schüler:innen auf Servern von kommerziellen Anbietern im Ausland verarbeitet werden? mehr...
|
Integration / Verbot |
Detailfragen der Integration versus des Verbots von generativen ML-Systemen in spezifischen Unterrichtssituationen
Ähnlich wie beim Taschenrechner wird sich künftig auch bei generativen ML-Systemen die Frage stellen, in
welchen Unterrichtssituationen aus welchen didaktischen Gründen die Verwendung von generativen ML-Systemen erlaubt bzw. verboten sein wird. mehr...
|
Betrug |
Gewisse Prüfungsformate sind künftig anfällig für Betrug
Schriftliche Hausaufgaben und Prüfungen am Computer ohne entsprechende Aufsicht und/oder Gegenmassnahmen können künftig
vermehrt mit Hilfe von generativen ML-Systemen gelöst werden. Entsprechender Betrug ist immer schwieriger zu erkennen und noch schwieriger
juristisch zweifelsfrei belegbar. Gegenmassnahmen erfordern entweder mehr Ressourcen
(mündliche Prüfungen, engere Betreuung von Hausarbeiten, Prozessportfolios) oder aber die
Rückkehr zu papierbasierten Präsenzprüfungen. mehr...
|
Veränderungen von Schule durch generative ML-Systeme |
Steigendes Anspruchsniveau |
Weitere Zunahme des kognitiven Anspruchsniveaus
Mit der Verfügbarkeit von generativen ML-Systemen steigt das kognitive Anspruchsniveau für das berufliche
und gesellschaftliche Leben weiter. Wenn auch geistige Routinetätigkeiten zunehmend automatisiert
werden können, sind Menschen einerseits mit den Produkten dieser automatisierten Prozesse
konfrontiert und müssen sich andererseits mit den sich ergebenden noch komplexeren Herausforderungen
beschäftigen. Für gewisse Schülerinnen und Schüler und damit für das Bildungssystem könnte dies problematisch werden.
|
Kompetenzschere |
Sich weiter öffnende Kompetenzschere?
Im Zuge der bisherigen Digitalisierung hat sich gezeigt, dass gute Schülerinnen und Schüler
neue (digitale) Werkzeuge und Medien besser zu ihrem eigenen Nutzen einsetzen können als schlechtere
Schüler:innen. Dies hat bereits in der Vergangenheit zu einer Vergrösserung des Leistungsspektrums
geführt. Dies dürfte bei generativen ML-Systemen nicht anders sein und damit die Leistungsheterogenität weiter erhöhen.
mehr...
|
Motivationsprobleme |
Motivationsprobleme aufgrund verfügbarer Automatisierung?
Bisher nicht geklärt ist die Frage, ob sich aufgrund der Verfügbarkeit von automatisierter Texterstellung und Textübersetzung
Motivationsprobleme bei Schülerinnen und Schülern ergeben, weil diese keinen Sinn darin sehen, eine Kompetenz zu erlernen,
die bereits automatisiert verfügbar ist. (Es handelt sich in einem gewissen Sinn um eine ähnliche Diskussion, wie sie
bereits mit dem Kopfrechnen seit der Verfügbarkeit von Taschenrechnern stattgefunden hat.) (Mehr dazu unter Warum soll ich lernen, was die Maschine (besser) kann?.)
|
Statt hier grosse Literaturlisten zu erstellen, wird auf Literatur- und Zitatlisten zum Themenfeld "generative Machine-Learning-Systeme" im Biblionetz von Beat Döbeli Honegger verwiesen:
- Begriffe:
- Aussagen / Thesen:
- Biblionetz:a1483 Nutzung von generativen Machine-Learning-Systemen wird bald wird bald so selbstverständlich wie die Nutzung eines Taschenrechners
- Biblionetz:a1490 Computergenerierte Texte erhöhen die Informationsflut
- Biblionetz:a1493 Generative Machine-Learning-Systeme erleichtern das Generieren von Fake-News massiv
- Biblionetz:a1494 Generative Machine-Learning-Systeme erleichtern das Generieren von Bullshit
- Biblionetz:a1495 Generative Machine-Learning-Systemeerhöhen die Gültigkeit von Brandolinis Gesetz massiv
- Biblionetz:a1508 Generative Machine-Learning-Systeme benötigen viel Energie
- Biblionetz:a1476 Computergenerierte Texte erleichtern Plagiarismus bzw. entsprechenden Textbetrug
Publikationen anderer Hochschulen
Publikationen von Bildungsbehörden
Publikationen von weiteren Organisationen
Publikationen und Vorträge
Unsere Überlegungen sind auch in Form von
Vorträgen und
Publikationen verfügbar.