Lernen managen
16 KI Sprache: Datenbasierte Systeme — Teil 1
Entscheidungen im Klassenzimmer
Als Lehrkraft haben Sie Zugang zu vielen Arten von Daten. Entweder greifbare Daten wie Anwesenheits- und Leistungsnachweise oder nicht greifbare wie die Körpersprache der Schülerinnen und Schüler. Denken Sie an einige der Entscheidungen, die Sie in Ihrem Berufsleben treffen: Welche Daten helfen Ihnen, diese Entscheidungen zu treffen?
Es gibt technologische Anwendungen, die Ihnen helfen können, Daten zu visualisieren oder zu verarbeiten. Systeme mit künstlicher Intelligenz nutzen Daten, um das Lernen zu personalisieren, Vorhersagen zu treffen und Entscheidungen zu treffen, die Ihnen beim Unterrichten und bei der Verwaltung des Klassenzimmers helfen könnten: Haben Sie Bedürfnisse, die die Technologie erfüllen kann? Wenn ja, welche Daten würde ein solches System benötigen, um diese Aufgabe zu erfüllen?
Bildungssysteme haben schon immer Daten generiert — persönliche Daten der Schülerinnen und Schülerinnen und Schüler, akademische Aufzeichnungen, Anwesenheitsdaten und mehr. Mit der Digitalisierung und der steigenden Anzahl an KI-Anwendungen werden immer mehr Daten aufgezeichnet und gespeichert: Mausklicks, geöffnete Seiten, Zeitstempel und Tastaturanschläge1. Da datenzentriertes Denken in der Gesellschaft zur Norm geworden ist, stellt sich natürlich die Frage, wie man all diese Daten verarbeiten kann, um etwas Sinnvolles zu tun: Könnten wir Lernenden ein individuelleres Feedback geben? Könnten wir bessere Visualisierungs- und Benachrichtigungstools für Lehrkräfte entwickeln?2
Welche Technologie auch immer eingesetzt wird, sie muss einem echten Bedarf im Klassenzimmer entsprechen. Nachdem der Bedarf ermittelt wurde, können wir uns die verfügbaren Daten ansehen und fragen, was für ein gewünschtes Ergebnis relevant ist. Dabei geht es darum, Faktoren aufzudecken, die es pädagogischen Fachkräften ermöglichen, nuancierte Entscheidungen zu treffen. Können diese Faktoren mit den verfügbaren Daten erfasst werden? Sind Daten und datenbasierte Systeme der beste Weg, um den Bedarf zu decken? Welche unbeabsichtigten Folgen könnte die Verwendung von Daten haben?3
Maschinelles Lernen ermöglicht es uns, viele dieser Fragen auf die Daten selbst zu schieben4: ML-Anwendungen werden auf Daten trainiert. Sie funktionieren, indem sie mit Daten arbeiten. Sie finden Muster, treffen Verallgemeinerungen und speichern diese als Modelle — Daten, die zur Beantwortung zukünftiger Fragen genutzt werden können4. Ihre Entscheidungen und Vorhersagen und wie diese das Lernen der Schülerinnen und Schüler beeinflussen, sind ebenfalls Daten. Daher ist das Wissen darüber, wie Programmierende, die Technologie und die Nutzenden mit Daten umgehen, ein wichtiger Teil des Verständnisses, wie künstliche Intelligenz funktioniert.
Über Daten
Daten beziehen sich im Allgemeinen auf eine Entität der realen Welt — eine Person, ein Objekt oder ein Ereignis. Jede Entität kann durch eine Reihe von Attributen (Merkmale oder Variablen) beschrieben werden5. Beispielsweise sind Name, Alter und Klasse einige Attribute eines Lernenden. Die Menge dieser Attribute sind die Daten, die wir über die Schülerinnen und Schüler haben, die zwar in keiner Weise mit der realen Person übereinstimmen, uns aber dennoch etwas über sie sagen. Daten, die im Bildungssystem gesammelt, verwendet und verarbeitet werden, nennt man Bildungsdaten1.
Ein Datensatz bezeichnet die Daten einer Sammlung von Entitäten, die in Zeilen und Spalten angeordnet sind. Die Anwesenheitsliste einer Klasse ist ein Datensatz. Jede Zeile ist der Datensatz eines Schülers oder einer Schülerin. Die Spalten können die An- oder Abwesenheit an einem bestimmten Tag oder in einem bestimmten Kurs darstellen. Jede Spalte ist also ein Attribut.
Daten werden erstellt, indem man Attribute auswählt und sie misst: Jeder Teil der Daten ist das Ergebnis menschlicher Entscheidungen und Wahlmöglichkeiten. Daher ist die Datenerstellung ein subjektiver, partieller und unübersichtlicher Prozess, der mit technischen Schwierigkeiten verbunden ist4,5. Außerdem kann das, was wir messen und was wir nicht messen, einen großen Einfluss auf die erwarteten Ergebnisse haben.
Datenspuren sind Aufzeichnungen von Schüleraktivitäten wie Mausklicks, Daten über geöffnete Seiten, das Timing von Interaktionen oder Tastenanschläge in einem digitalen System1. Metadaten bezeichnen Daten, die andere Daten beschreiben5. Abgeleitete Daten sind Daten, die aus anderen Daten berechnet oder abgeleitet werden: Die individuellen Noten eines jeden Schülers und einer jeden Schülerin sind Daten. Klassendurchschnitte sind abgeleitete Daten. Abgeleitete Daten sind oft nützlicher, wenn es darum geht, aussagekräftige Informationen zu erhalten, Muster zu finden und Vorhersagen zu treffen. Anwendungen für maschinelles Lernen können abgeleitete Daten erstellen und sie mit Metadaten verknüpfen, um detaillierte Lernmodelle zu erstellen, die bei der Personalisierung des Lernens helfen1.
Damit jede datenbasierte Anwendung erfolgreich ist, sollten die Attribute sorgfältig ausgewählt und korrekt gemessen werden. Die in ihnen entdeckten Muster sollten daraufhin überprüft werden, ob sie im pädagogischen Kontext Sinn ergeben. Wenn sie richtig konzipiert und gepflegt werden, können datengesteuerte Systeme sehr wertvoll sein.
Ziel dieses Kapitels ist es, einige Grundlagen zu Daten und datengestützter Technologie zu vermitteln, aber Datenkompetenz ist eine sehr wichtige Fähigkeit, die man besitzen sollte und die eine entsprechende Schulung, kontinuierliche Weiterbildung und Unterstützung verdient.1.
Wichtige Gesetzesgrundlagen
Aufgrund der drastisch gesunkenen Kosten für die Datenspeicherung werden immer mehr Daten und Metadaten gespeichert und länger aufbewahrt6. Das kann zu Datenschutzverletzungen und Rechtsverletzungen führen. Gesetze wie die Datenschutz-Grundverordnung (DSGVO) raten von solchen Praktiken ab und geben der EU-Bürgerschaft mehr Kontrolle über ihre persönlichen Daten. Sie geben rechtlich durchsetzbare Datenschutzbestimmungen für alle EU-Mitgliedstaaten vor.
Personenbezogene Daten sind gemäß der DSGVO alle Informationen, die sich auf eine bestimmte oder bestimmbare Person (Datensubjekt) beziehen. Schulen arbeiten nicht nur mit Unternehmen zusammen, die ihre Daten verarbeiten, sondern sie speichern auch große Mengen an persönlichen Daten über Schülerinnen und Schüler, Eltern, Mitarbeitende, Management und Lieferfirmen. Als für die Datenverarbeitung Verantwortliche sind sie verpflichtet, die von ihnen verarbeiteten Daten vertraulich und sicher zu speichern und über Verfahren zum Schutz und zur ordnungsgemäßen Verwendung aller personenbezogenen Daten zu verfügen1.
Zu den durch die DSGVO festgelegten Rechten für die Bürgerinnen und Bürger gehören:
- Das Recht auf Auskunft, das es zwingend vorschreibt, dass sie (einfach) erfahren können, welche Daten über sie gesammelt werden,
- Das Recht auf Information über die Verwendung der Daten,
- Das Recht auf Löschung, das es ermöglicht zu verlangen, dass Daten, die von einer Plattform erfasst wurden, aus dem von der Plattform erstellten Datensatz (der möglicherweise an andere verkauft wird) entfernt wurde,
- Das Recht auf Erklärung, bei dem Erklärungen gegeben werden sollten, wann immer sie Klarheit über automatisierte Entscheidungsprozesse benötigen, die sie betreffen.
Allerdings erlaubt die DSGVO die Erhebung einiger Daten im Rahmen des „berechtigten Interesses”7 und die Verwendung abgeleiteter, aggregierter oder anonymisierter Daten auf unbestimmte Zeit und ohne Einwilligung5. Der neue Digital Services Act schränkt die Verwendung personenbezogener Daten für gezielte Werbezwecke ein. Darüber hinaus stärkt das EU-US Privacy Shield die Datenschutzrechte für die EU-Bürgerschaft, wenn ihre Daten in Länder außerhalb der EU verschoben werden5.
Bei DSGVO für Dummies finden Sie die Analyse unabhängiger Experten der Civil Liberties Union for Europe (Liberties), die die Menschenrechte aller Bürgerinnen und Bürger in der Europäischen Union schützt.
1 Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators, European Commission, October 2022.
2 du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., Artificial Intelligence And Big Data Technologies To Close The Achievement Gap, in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256–285, 2018.
3 Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021.
4 Barocas, S., Hardt, M., Narayanan, A., Fairness and machine learning Limitations and Opportunities, 2022.
5 Kelleher, J.D, Tierney, B, Data Science, MIT Press, London, 2018.
6 Schneier, B., Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, W. W. Norton & Company, 2015.
7 Kant, T., Identity, Advertising, and Algorithmic Targeting: Or How (Not) to Target Your “Ideal User.”, MIT Case Studies in Social and Ethical Responsibilities of Computing, 2021.