Datenexploration - Datendetektive bei der Arbeit: Unterschied zwischen den Versionen

Aus Eduwiki
Wechseln zu:Navigation, Suche
Keine Bearbeitungszusammenfassung
 
(27 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Infobox|image=Datei:ProDaBi Logo.png|thema=ProDaBi|Material=Datei:Datenexploration - Datendetektive bei der Arbeit.zip|Autor=Podworny|subpages=True}}
{{Infobox|image=Datei:ProDaBi Logo.png|thema=ProDaBi|Autor=Podworny|subpages=True|Material1=|Material2=|Material1_Name=|Material2_Name=|Material=Media:Datenexploration.zip|Material_Name=Alle Materialien als ZIP|Material3=|Material3_Name=|Material4=|Material4_Name=}}
In dieser Unterrichtseinheit geht es um Data Science Inhalte für die 8.-10. Klasse. Anhand eines fiktiven Rahmenbeispiels einer Online-Plattform, die Werbung für Jugendliche passgenau schalten möchte, werden Schülerinnen und Schüler motiviert, als Datendetektive in einem Datensatz nach Spuren und Mustern zu suchen, um so die Online-Plattform zu beraten.


In dieser Unterrichtseinheit geht es um Data Science Inhalte für die 9./10. Klasse. Anhand eines fiktiven Rahmenbeispiels einer Online-Plattform, die Werbung für Jugendliche passgenau schalten möchte, sollen die Schülerinnen und Schüler motiviert werden, als Datendetektive in einem Datensatz nach Spuren und Mustern zu suchen, um so die Online-Plattform zu beraten.
Es stehen Arbeitsblätter, PowerPoint-Präsentationen, Anleitungen, der JIM-Datensatz, Variablenlisten und dieser Überblick über die einzelnen Stunden zur Verfügung. Für die Datenanalyse wird die Software CODAP (codap.concord.org) genutzt, die im Internet frei und kostenlos zugänglich ist.


Es stehen Arbeitsblätter, PowerPoint-Präsentationen, Anleitungen, der Datensatz (JIM-Datensatz), Variablenlisten und dieser Überblick über die einzelnen Stunden zur Verfügung. Für die Datenanalyse wird die Software CODAP (codap.concord.org) genutzt, die im Internet frei zugänglich ist.
Gearbeitet wird mit Daten von über 1000 Schülerinnen und Schülern, die zu vielen Merkmalen im Freizeit- und Medienbereich Angaben gemacht haben (JIM-PB für Jugend-Information-Medien Paderborn). Der Datensatz liegt für diese Unterrichtsreihe in zwei Versionen vor. Zum einen steht eine reduzierte Version mit 50 Variablen zur Verfügung. Zum anderen kann die Vollversion mit über 160 Variablen im Unterricht eingesetzt werden. Es wird empfohlen, aufgrund der besseren Übersichtlichkeit den Datensatz mit der reduzierten Variablenliste zu verwenden. Hier sind multivariate und interessante Entdeckungen möglich! Die Lehrkraft hat jedoch die Möglichkeit je nach Leistungsfähigkeit der Klasse/des Kurses zu differenzieren, oder für besonders leistungsfähige Schülerinnen und Schüler ein binnendifferenziertes Angebot zu unterbreiten (siehe unten).


Gearbeitet wird mit Daten von fast 500 Schülerinnen und Schülern, die zu vielen Merkmalen im Freizeit- und Medienbereich Angaben gemacht haben (JIM für Jugend-Information-Medien). Der Datensatz liegt für diese Unterrichtsreihe in zwei Versionen vor. Zum einen steht eine reduzierte Version zur Verfügung mit 50 Variablen. Zum anderen kann die Vollversion mit über 160 Variablen im Unterricht eingesetzt werden. Es wird empfohlen, aufgrund der besseren Übersichtlichkeit den Datensatz mit der reduzierten Variablenliste zu verwenden. Hier sind multivariate und interessante Entdeckungen möglich! Die Lehrkraft hat jedoch die Möglichkeit je nach Leistungsfähigkeit der Klasse/des Kurses zu differenzieren oder für besonders leistungsfähige Schülerinnen und Schüler ein binnendifferenziertes Angebot zu unterbreiten (siehe unten).
Der [[:Datei:Variablenliste JIM 2021 reduziert 50.docx|'''Link''']] zum Datensatz, mit dem im Projekt gearbeitet wird (50 Variablen): [https://codap.concord.org/app/static/dg/de/cert/index.html#shared=https%3A%2F%2Fcfm-shared.concord.org%2F1M6i59zhin1wBm8bXqDl%2Ffile.json '''CODAP-Umgebung''']


Der Link zum Datensatz, mit dem im Projekt gearbeitet wird (50 Variablen):


Datensatz


Die Unterrichtsreihe umfasst 8 Unterrichtsstunden. Das Herzstück der Unterrichtsreihe ist eine eigenständige Data Science Projektarbeit der Schülerinnen und Schüler in den Stunden 5 und 6 mit Präsentationen in Stunde 7. Die Projektarbeit findet in Kleingruppen statt, in denen sich die Schülerinnen und Schüler eigenständig als Data Science Experten mit dem Datensatz arbeiten. Dafür ordnen sie sich vier inhaltlichen Gruppen der JIM-Daten zu analog zu den Kundenwünschen der Online-Plattform (diese Zuordnung geschieht in Stunde 4):
Die Unterrichtsreihe umfasst 8 Unterrichtsstunden. Das Herzstück der Unterrichtsreihe ist eine eigenständige Data Science Projektarbeit der Schülerinnen und Schüler in den Stunden 5 und 6 mit Präsentationen in Stunde 7. Die Projektarbeit findet in Kleingruppen statt, in denen sich die Schülerinnen und Schüler eigenständig als Data-Science-Experten mit dem Datensatz beschäftigen. Dafür ordnen sie sich vier inhaltlichen Gruppen der JIM-Daten, analog zu den Kundenwünschen der Online-Plattform, zu (diese Zuordnung geschieht in Stunde 4):


·        Kunde 1 möchte TikTok bewerben,
*Kunde 1 möchte TikTok bewerben,
*Kunde 2 möchte LetsPlay_YouTube Videos bewerben,
*Kunde 3 möchte Online-Zeitungen bewerben,
*Kunde 4 möchte feste Spielekonsolen bewerben.


·        Kunde 2 möchte LetsPlay_YouTube Videos bewerben,


·        Kunde 3 möchte Online Zeitungen bewerben,
In der letzten Stunde findet eine Reflektion über das Vorgehen für die Datenexploration statt und persönliche und gesellschaftliche Aspekte können diskutiert werden. Außerdem kann hier als Exkurs das Thema Datenbereinigung angesprochen und in CODAP bearbeitet werden, die in der Arbeit eines echten Data-Scientists viel Zeit beansprucht.
 
·        Kunde 4 möchte feste Spielekonsolen bewerben.
 
Präsentationen aller Gruppen beschließen die Gruppenarbeit. In der letzten Stunde findet eine Reflektion über das Vorgehen für die Datenexploration statt und persönliche und gesellschaftliche Aspekte können diskutiert werden.


===Überblick über die Unterrichtsreihe===
===Überblick über die Unterrichtsreihe===
Zeile 31: Zeile 28:
|1
|1
|'''Einführung'''
|'''Einführung'''
In dieser Stunde wird in das Projekt „Datendetektive bei der Arbeit” eingeführt. Dazu wird der komplette Rahmen der Unterrichtsreihe aufgezeigt. In zwei Arbeitsphasen werden die SuS an die vorliegenden Umfragedaten und an die Datenanalyse in CODAP herangeführt.
Das Dokument Stunde_1_Überblick bietet Gestaltungshinweise für diese Stunde.


In dieser Stunde wird in das Projekt “Datendetektive bei der Arbeit”  eingeführt. Dazu wird der komplette Rahmen der Unterrichtsreihe aufgezeigt.  In zwei Arbeitsphasen werden die SuS an die vorliegenden Umfragedaten und an  die Datenanalyse in CODAP herangeführt.
Mit Arbeitsblatt 1 erkunden SuS den Datensatz selbständig.
|[[Medium:Datenexploration Stunde 1 Überblick.docx|Stunde_1_Überblick]]


Das Dokument Stunde_1_Überblick bietet Gestaltungshinweise für diese  Stunde.
[[Medium:Datenexploration Arbeitsblatt 1 Datensatz.docx|Arbeitsblatt1_Datensatz]]
|Stunde_1_Überblick


Arbeitsblatt1_Datensatz
[[Medium:Variablenliste JIM 2021 reduziert 50.docx|Variablenliste_JIM_2021_reduziert]]


[[:Datei:Variablenliste JIM 2021 reduziert 50.docx|Variablenliste_JIM_2021_reduziert]]
Kurzeinführung in CODAP:
 
<nowiki>https://youtu.be/2z5H4anfhWM</nowiki> (ca. 5 min)


|-
|-
|2-3
|2-3
|In diesen beiden Stunden geht es darum, dass die Schülerinnen und Schüler zu Data Science Experten werden, um anschließend selbständig arbeiten zu können.  
|In diesen beiden Stunden geht es darum, dass die Schülerinnen und Schüler zu Data-Science- Experten werden, um anschließend selbständig arbeiten zu können.
Zunächst kann, sofern noch nicht geschehen, Arbeitsblatt 1 besprochen werden.


'''Einführung in statistische Grundbegriffe und Erwartungshaltung  aufbauen'''
Die Präsentation zu Sitzung 2+3 kann als Lehrerhintergrundinformation oder zur Präsentation im Unterricht begleitend zu den Arbeitsblättern 3-6a genutzt werden.


Die SuS erhalten Informationen über grundlegende statistische Fachbegriffe (Infoblatt_Glossar). Die kennengelernten statistischen Grundbegriffe übertragen die SuS anhand von Arbeitsblatt2_Begriffe auf den vorliegenden Datensatz.  
'''Einführung in nötige Grundbegriffe und Erwartungshaltung aufbauen'''
Die SuS erhalten Informationen über grundlegende statistische Fachbegriffe (Infoblatt_Glossar). Die kennengelernten statistischen Grundbegriffe übertragen die SuS anhand von Arbeitsblatt 2 auf den vorliegenden Datensatz.


'''CODAP und Analysemethoden'''
'''CODAP und Analysemethoden'''
Es werden Auswertungsmöglichkeiten bezüglich verschiedener Prozente und damit verbundener Aussagen erarbeitet.


Es wird in die Bedienung von CODAP eingeführt und Auswertungsmöglichkeiten  bezüglich verschiedener Prozente werden nacheinander erarbeitet. Je nach  Kurs/Klasse können sich die SuS die Auswertungsmöglichkeiten anhand der  Anleitungen selbst erarbeiten und bei den Arbeitsblättern anwenden. Alternativ kann die Lehrkraft mithilfe der PowerPoint in die Analysemethoden  einführen und die SuS bearbeiten dann die Arbeitsblätter. Dies ist die  notwendige Voraussetzung für die eigenständige Schülerexploration in den  folgenden Stunden.
Zunächst steht thematisch das „Modellieren der Daten“ an. Interessierende Merkmale werden umcodiert, so dass die Ausprägungen von z. B. sieben (täglich, mehrmals pro Woche, … nie) auf zwei (z. B. häufig, selten) reduziert werden. Dies vereinfacht die Auswertungen. Mehrere Unterrichtserprobungen haben ge-zeigt, dass dies ein sinnvolles Vorgehen ist und gleichzeitig das Modellieren thematisiert wird. Dies wird in Anleitung_CODAP_umcodieren (diese Anleitung ist im YouTube-Video umge-setzt) erklärt.  


Die Anleitungen für die Selbstlernphase der SuS beinhalten das  Auswerten von eindimensionalen Verteilungen (Anleitung_CODAP_1dim) und zweidimensionalen Verteilungen (Anleitung_CODAP_2dim_A und _B).
Wir schlagen vor, mit der Anleitung (Anleitung_CODAP_umcodieren) in die Exploration zu starten und dann die Anleitung_CODAP_2dimProzente weiter zu nutzen.


Wir schlagen vor, mit der Anleitung (Anleitung_CODAP_2dim_red) in die Exploration von zweidimensionalen Verteilungen zu starten. Hier wird zunächst  von einer Variablen nur eine Ausprägung betrachtet und somit die Komplexität  der Auswertung von einer 7x7 Matrix auf eine 7x1 Matrix reduziert.
Eine Differenzierungsmöglichkeit besteht hier erneut darin, motivierte SuS Auswertungen mit den binären Merkmalen und zusätzlich mit den Merkmalen mit sieben Ausprägungen machen zu lassen (die Arbeitsblätter 3-5 lassen sich auf beide Arten bearbeiten).


Je nach Kurs/Klasse können sich die SuS die Auswertungsmöglichkeiten anhand der Anleitungen selbst erarbeiten und bei den Arbeitsblättern anwenden. Alternativ kann die Lehrkraft mithilfe der PowerPoint in die Analysemethoden einführen und die SuS bearbeiten dann die Arbeitsblätter. Dies ist die notwendige Voraussetzung für die eigenständige Schülerexploration in den folgenden Stunden. ''Erfahrungsgemäß benötigen SuS Unterstützen beim Bearbeiten und Interpretieren der prozentualen Auswertungen mit Zeilen-, Spalten- oder Zellenprozenten. Einen Einstieg auch zur Diskussion kann Arbeitsblatt 6 bieten.''


'''Technik'''
'''Technik'''
 
Hier sollte den SuS auch gezeigt werden, wie sie Graphiken aus CODAP in eine Word-Datei oder eine PowerPoint Präsentation kopieren können. Ggf. ist auch das Weitergeben des CODAP-Dokuments per Link eine gute Möglichkeit, um Schülerbearbeitungen zu dokumentieren, bzw. zu kontrollieren.
Hier sollte den SuS auch gezeigt werden, wie sie Graphiken aus CODAP in eine Word-Datei oder eine PowerPoint Präsentation kopieren können. Ggf. ist auch das Weitergeben des CODAP-Dokuments per Link eine gute Möglichkeit, um Schülerbearbeitungen zu dokumentieren, bzw. zu kontrollieren.
|
|
[[Medium:Datenexploration Infoblatt Glossar.docx|Infoblatt_Glossar]]


[[Medium:Datenexploration Arbeitsblatt 2 Begriffe.docx|Arbeitsblatt2_Begriffe]]


[[Medium:Datenexploration Folien Sitzung 2+3.pptx|PowerPoint-Präsentation (optional)]]


[[Medium:Datenexploration Anleitung CODAP 1dim.docx|Anleitung_CODAP_1dim]]


[[Medium:Anleitung CODAP umcodieren.docx|Anleitung_CODAP_umcodieren]]


(<nowiki>https://youtu.be/qcK_ZZsWfbQ</nowiki>)


[[Medium:Datenexploration Anleitung CODAP 2dim ausblenden.docx|Anleitung_CODAP_2dim_ausblenden]]




Infoblatt_Glossar
[[Medium:Datenexploration Arbeitsblatt 3.docx|Arbeitsblatt 3]]
 
Arbeitsblatt2_Begriffe
 
 
 
 
 
 
 
PowerPoint-Präsentation (optional)
 
Anleitung_CODAP_1dim
 
Anleitung_CODAP_2dim_red
 
Anleitung_CODAP_2dim_A
 
Anleitung_CODAP_2dim_B
 
Arbeitsblätter 3 – 5
 
 
 
 
 
 
 
 
 
 
 
 


[[Medium:Datenexploration Arbeitsblatt 4 Verteilungen II.docx|Arbeitsblatt 4]]


[[Medium:Datenexploration Arbeitsblatt 5.docx|Arbeitsblatt 5]]






[[Medium:Datenexploration Arbeitsblatt 6 Prozenteprüfen.docx|<br />Arbeistblatt 6]]




Zeile 113: Zeile 96:




 
Anleitung_Grafikenkopieren
Anleitung_Graphikenkopieren


Oder YouTube-Video zum Kopieren des Arbeitsstands per Link:
Oder YouTube-Video zum Kopieren des Arbeitsstands per Link:


<nowiki>https://youtu.be/otLuX8hhtq8</nowiki>
<nowiki>https://youtu.be/otLuX8hhtq8</nowiki>
|-
|-
|4
|4
|'''Erwartungshaltung aufbauen und passende Fragen stellen'''
|'''Erwartungshaltung aufbauen und passende Fragen stellen'''
In dieser Stunde werden die Schülerinnen und Schüler in Kleingruppen für die komplette restliche Unterrichtseinheit eingeteilt und vier verschiedenen inhaltlichen Bereichen der Daten/Kunden der Online-Plattform zugeordnet (Arbeitsblatt_6_Gruppenbildung). Jede Gruppe sollte vier SuS umfassen, damit die spätere Think-pair-share Phase gut funktioniert.


In dieser Stunde werden die Schülerinnen und Schüler in Kleingruppen  für die komplette restliche Unterrichtseinheit eingeteilt und vier  verschiedenen inhaltlichen Bereichen der Daten/Kunden der Online-Plattform  zugeordnet (Arbeitsblatt3_Gruppenbildung). Anhand von AB3 findet eine theoretische Auseinandersetzung mit den Daten, resp. der Variablenliste,  statt, um eine Erwartungshaltung für die kommenden Stunden aufzubauen. Diese  Erwartungshaltung ist zentral für die eigene Datenanalyse und soll auf  Plakaten festgehalten werden. Die hierzu erstellten Plakate sollten im  Verlauf der weiteren Unterrichtseinheit sichtbar für alle SuS im Klassenraum  hängen.
Die Erfahrung hat gezeigt, dass das Stellen von geeigneten (statistischen) Fragestellungen für SuS eine Hürde darstellt, deshalb liegt ein weiterer Fokus dieser Stunde darauf, die SuS anhand von AB 6b in Kleingruppen geeignete Fragen erarbeiten zu lassen. Hierfür wird die Methode Think-Pair-Share genutzt.


 
Anhand von AB 8 findet eine theoretische Auseinandersetzung mit den Daten, resp. der Variablenliste, statt, um eine Erwartungshaltung für die kommenden Stunden aufzubauen. Diese Erwartungshaltung ist zentral für die eigene Datenanalyse und soll auf Plakaten festgehalten werden. Die hierzu erstellten Plakate sollten im Verlauf der weiteren Unterrichtseinheit sichtbar für alle SuS im Klassenraum hängen.
Die Erfahrung hat gezeigt, dass das Stellen von geeigneten  (statistischen) Fragestellungen für SuS eine Hürde darstellt, deshalb liegt  ein weiterer Fokus dieser Stunde darauf, die SuS in Kleingruppen geeignete  Fragen erarbeiten zu lassen. Hierfür wird die Methode Think-Pair-Share  genutzt.
|[[Medium:Datenexploration Arbeitsblatt 7 Gruppenbildung.docx|Arbeitsblatt7 Gruppenbildung]]
|Arbeitsblatt6_Gruppenbildung


Plakate
Plakate




PowerPoint als Hintergrundinformation für L
[[Medium:Datenexploration Hintergrundinformationen.pptx|PowerPoint als Hintergrundinformation für Lehrende]]




Zeile 138: Zeile 121:




[[Medium:Datenexploration Arbeitsblatt 8 Fragestellung.docx|<br />Arbeitsblatt_8_Fragestellung]]


 
<br />
 
 
 
 
 
 
 
Arbeitsblatt6a_Fragen
|-
|-
|5-6
|5-6
|'''Projektarbeit in Kleingruppen'''
|'''Projektarbeit in Kleingruppen'''
In diesen beiden Stunden wird das Vorgehen der Datenexploration von den Kleingruppen zunächst geplant (Arbeitsblatt 9). Anschließend findet die Datenexploration in den Kleingruppen statt (Arbeitsblatt 10) und die Präsentation der Ergebnisse wird vorbereitet. Zu Beginn der sechsten Stunde können evtl. Kriterien für gute statistische Präsentationen besprochen werden, um die Erstellung der Präsentationen vorzubereiten (leere Power-Point-Vorlage). Die Lehrkraft steht in den Stunden 5-6 vor allem unterstützend für Fragen und Anregungen zur Verfügung, die SuS arbeiten möglichst selbständig mit CODAP und PowerPoint.
|[[:Datei:Datenexploration Arbeitsblatt 9 Planung.docx|Arbeitsblatt_9_Planung]]
[[Medium:Datenexploration Arbeitsblatt 10 Datenanalyse.docx|Arbeitsblatt_10_Datenanalyse]]


In diesen beiden Stunden wird das Vorgehen der Datenexploration von  den Kleingruppen zunächst geplant (Arbeitsblatt 7). Anschließend findet die  Datenexploration in den Kleingruppen statt (Arbeitsblatt 8) und die  Präsentation der Ergebnisse wird vorbereitet. Zu Beginn der sechsten Stunde  können evtl. Kriterien für gute statistische Präsentationen besprochen  werden, um die Erstellung der Präsentationen vorzubereiten (Leere  Power-Point-Vorlage). Die Lehrkraft steht in den Stunden 5-6 vor allem  unterstützend für Fragen und Anregungen zur Verfügung, die SuS arbeiten  möglichst selbständig mit CODAP und PowerPoint.
[[Medium:Datenexploration Anleitung Hinweise Präsentation.docx|Anleitung_Hinweise_Präsentation]]
|Arbeitsblätter 7-8
 
Anleitung_HinweisePräsentation


Leere PowerPoint-Vorlage für Schülerpräsentationen
[[Medium:Datenexploration Vorlage Präsentation.pptx|Leere PowerPoint-Vorlage für Schülerpräsentationen]]
|-
|-
|7
|7
|'''Präsentationen der Kleingruppen'''
|'''Präsentationen der Kleingruppen'''
 
In dieser Stunde finden die Präsentationen der Schülerergebnisse statt. Dabei kann immer eine Gruppe einen speziellen Feedback-Auftrag bekommen, damit eine inhaltliche Diskussion angeregt wird (Arbeitsblatt 11). Anhand von Arbeitsblatt 12, das sich gut als Hausaufgabe und Ergebnissicherung eignet, können die SuS überprüfen, ob sie eine Datenanalyse durchführen können.
In dieser Stunde finden die Präsentationen der Schülerergebnisse statt. Dabei kann immer eine Gruppe einen speziellen Feedback Auftrag bekommen, damit eine inhaltliche Diskussion angeregt wird (Arbeitsblatt 9). Anhand von Arbeitsblatt 10, das sich gut als Hausaufgabe und Ergebnissicherung eignet, können die SuS überprüfen, ob sie eine Datenanalyse durchführen können.
|PowerPoint-Präsentationen der SuS
|PowerPoint-Präsentationen der SuS
[[Medium:Datenexploration Arbeitsblatt 11 Feedback.docx|Arbeitsblatt_11_Feedback]]


Arbeitsblatt 9-10
[[Medium:Datenexploration Arbeitsblatt 12 Hausaufgabe.docx|Arbeitsblatt_12_Hausaufgabe]]
|-
|-
|8
|8
|'''Reflektieren'''
|'''Reflektieren'''
In dieser Stunde findet eine gemeinsame Reflexion des gesamten Projekts statt. Die einzelnen Schritte der durchgeführten Datenanalyse werden den Stationen des PPDAC-Kreislaufs zugeordnet (Powerpoint Präsentation Stunde 8). 


In dieser Stunde findet eine gemeinsame Reflexion des gesamten  Projekts statt. Die einzelnen Schritte der durchgeführten Datenanalyse werden  den Stationen des PPDAC-Kreislaufs zugeordnet (Powerpoint_Präsentation).
Weiter können unter anderem persönliche und gesellschaftliche Auswirkungen einer Datenexploration angesprochen werden und versucht werden, „über den Tellerrand” zu schauen.
 
|[[Medium:Datenexploration Folien Stunde 8.pptx|Powerpoint Präsentation Stunde 8]]
 
|-
Weiter können unter anderem persönliche und gesellschaftliche Auswirkungen einer Datenexploration angesprochen werden und versucht werden, „über den Tellerrand” zu schauen.
|Abschluss
|Powerpoint_Präsentation
|'''Zu Forschungszwecken''' bitten wir darum, dass die SuS am Ende der Unterrichtsreihe eine anonyme Umfrage ausfüllen und Feedback geben, wie Ihnen die Unterrichtsreihe gefallen hat.
|[https://umfrage-ddi.cs.uni-paderborn.de/limesurvey/index.php/545222?lang=de Link zu der Umfrage]
|-
|Exkurs
|'''Datenbereinigung als Detektivarbeit'''
Der Bereich Datenbereinigung kann als Exkurs in einer eigenen Stunde thematisiert werden. Hierzu gibt es die nebenstehende CODAP-Umgebung, in der sich der unbereinigte JIM-Datensatz befindet. Dort findet sich ebenfalls ein Textfeld mit Erklärungen und ersten Schritten, wie mit Hilfe von CODAP eine Datenbereinigung vorgenommen werden kann.
|<nowiki>https://tinyurl.com/jim-pb50-unbereinigt</nowiki>
|}
|}


Zeile 180: Zeile 163:


====Möglichkeit zur Differenzierung====
====Möglichkeit zur Differenzierung====
Die Unterrichtsreihe ist so angelegt, dass mit einem „kleinen“ Datensatz gearbeitet werden kann. Dieser enthält 50 Variable und bietet reichhaltig Möglichkeiten für Explorationen.
Die Unterrichtsreihe ist so angelegt, dass mit einem „kleinen“ Datensatz gearbeitet wird. Dieser enthält 50 Variable und bietet reichhaltig Möglichkeiten für Explorationen.


Für besonders motivierte Schülerinnen und Schüler kann stattdessen auch mit dem großen Datensatz gearbeitet werden, der alle 160 Variablen erhält, die in der Umfrage erhoben wurden. Dies erfordert jedoch ein hohes Engagement und gutes Arbeiten mit der Variablenliste seitens der Schülerinnen und Schüler!
Für besonders motivierte Schülerinnen und Schüler kann stattdessen auch mit dem großen Datensatz gearbeitet werden, der alle 160 Variablen erhält, die in der Umfrage erhoben wurden. Dies erfordert jedoch ein hohes Engagement und gutes Arbeiten mit der Variablenliste seitens der Schülerinnen und Schüler!
Eine weitere Möglichkeit zur Differenzierung besteht darin, besonders motivierte Schülerinnen und Schüler mit den „normalen“ Merkmalen mit allen sieben Ausprägungen arbeiten zu lassen. Der Standardfall sollte das Arbeiten mit binären Merkmalen sein, also Merkmalen, die zuvor von den SuS umcodiert wurden, wie in Anleitung_CODAP_umcodieren in Stunde 2+3 beschrieben.


====Zum Umgang mit den Aufgaben====
====Zum Umgang mit den Aufgaben====
Zeile 190: Zeile 175:
CODAP ist in weiten Teilen auf Deutsch verfügbar. Sollte die Sprache nicht auf Deutsch eingestellt sein, so kann rechts oben die Sprache umgestellt werden.
CODAP ist in weiten Teilen auf Deutsch verfügbar. Sollte die Sprache nicht auf Deutsch eingestellt sein, so kann rechts oben die Sprache umgestellt werden.


Link zum Datensatz mit allen 161 Variablen
Link zum Datensatz mit allen 161 Variablen:
<br />
 
<nowiki>https://tinyurl.com/jim-pb160</nowiki>
 
===Teilnahme an der Umfrage===
Wer mit seiner Klasse an der Umfrage teilnehmen möchte, kann dies gerne machen. Die Daten werden vollständig anonym erfasst (eventuell mit der Schulleitung abklären). Die Daten fließen dann jährlich in eine Neuauflage des Datensatzes ein, der per CODAP-Link zugänglich bleibt.
 
Über diesen Link können SuS an der Umfrage teilnehmen (Achtung: 161 Fragen!, genügend Zeit einplanen):
 
[http://go.upb.de/JIM-Umfrage Link]


===Unterseiten===
===Unterseiten===
Zeile 198: Zeile 191:
[[Kategorie:ProDaBi]]
[[Kategorie:ProDaBi]]
[[Kategorie:Praxiserprobt]]
[[Kategorie:Praxiserprobt]]
[[Kategorie:Gymnasium]]
[[Kategorie:Sekundarstufe I]]
[[Kategorie:Sekundarstufe II]]
[[Kategorie:Module]]

Aktuelle Version vom 17. Mai 2023, 09:34 Uhr

Übersicht

{{#if:Datei:ProDaBi Logo.png|

}}

{{#if:ProDaBi| }} {{#if:Podworny| }} {{#if:Media:Datenexploration.zip| {{#if:Alle Materialien als ZIP| | }} }} {{#if:| {{#if:| | }} }} {{#if:| {{#if:| | }} }} {{#if:| {{#if:| | }} }} {{#if:| {{#if:| | }} }} {{#if:True| }}
Themenfeld ProDaBi
Autor Podworny
Editiert am 17.5.2023
Material Alle Materialien als ZIP
Material Media:Datenexploration.zip
[[:|]]
[[:|]]
[[:|]]
[[:|]]
[[:|]]
[[:|]]
[[:|]]
[[:|]]
Unterseiten


In dieser Unterrichtseinheit geht es um Data Science Inhalte für die 8.-10. Klasse. Anhand eines fiktiven Rahmenbeispiels einer Online-Plattform, die Werbung für Jugendliche passgenau schalten möchte, werden Schülerinnen und Schüler motiviert, als Datendetektive in einem Datensatz nach Spuren und Mustern zu suchen, um so die Online-Plattform zu beraten.

Es stehen Arbeitsblätter, PowerPoint-Präsentationen, Anleitungen, der JIM-Datensatz, Variablenlisten und dieser Überblick über die einzelnen Stunden zur Verfügung. Für die Datenanalyse wird die Software CODAP (codap.concord.org) genutzt, die im Internet frei und kostenlos zugänglich ist.

Gearbeitet wird mit Daten von über 1000 Schülerinnen und Schülern, die zu vielen Merkmalen im Freizeit- und Medienbereich Angaben gemacht haben (JIM-PB für Jugend-Information-Medien Paderborn). Der Datensatz liegt für diese Unterrichtsreihe in zwei Versionen vor. Zum einen steht eine reduzierte Version mit 50 Variablen zur Verfügung. Zum anderen kann die Vollversion mit über 160 Variablen im Unterricht eingesetzt werden. Es wird empfohlen, aufgrund der besseren Übersichtlichkeit den Datensatz mit der reduzierten Variablenliste zu verwenden. Hier sind multivariate und interessante Entdeckungen möglich! Die Lehrkraft hat jedoch die Möglichkeit je nach Leistungsfähigkeit der Klasse/des Kurses zu differenzieren, oder für besonders leistungsfähige Schülerinnen und Schüler ein binnendifferenziertes Angebot zu unterbreiten (siehe unten).

Der Link zum Datensatz, mit dem im Projekt gearbeitet wird (50 Variablen): CODAP-Umgebung


Die Unterrichtsreihe umfasst 8 Unterrichtsstunden. Das Herzstück der Unterrichtsreihe ist eine eigenständige Data Science Projektarbeit der Schülerinnen und Schüler in den Stunden 5 und 6 mit Präsentationen in Stunde 7. Die Projektarbeit findet in Kleingruppen statt, in denen sich die Schülerinnen und Schüler eigenständig als Data-Science-Experten mit dem Datensatz beschäftigen. Dafür ordnen sie sich vier inhaltlichen Gruppen der JIM-Daten, analog zu den Kundenwünschen der Online-Plattform, zu (diese Zuordnung geschieht in Stunde 4):

  • Kunde 1 möchte TikTok bewerben,
  • Kunde 2 möchte LetsPlay_YouTube Videos bewerben,
  • Kunde 3 möchte Online-Zeitungen bewerben,
  • Kunde 4 möchte feste Spielekonsolen bewerben.


In der letzten Stunde findet eine Reflektion über das Vorgehen für die Datenexploration statt und persönliche und gesellschaftliche Aspekte können diskutiert werden. Außerdem kann hier als Exkurs das Thema Datenbereinigung angesprochen und in CODAP bearbeitet werden, die in der Arbeit eines echten Data-Scientists viel Zeit beansprucht.

Überblick über die Unterrichtsreihe

Stunde Thema Material
1 Einführung

In dieser Stunde wird in das Projekt „Datendetektive bei der Arbeit” eingeführt. Dazu wird der komplette Rahmen der Unterrichtsreihe aufgezeigt. In zwei Arbeitsphasen werden die SuS an die vorliegenden Umfragedaten und an die Datenanalyse in CODAP herangeführt.

Das Dokument Stunde_1_Überblick bietet Gestaltungshinweise für diese Stunde.

Mit Arbeitsblatt 1 erkunden SuS den Datensatz selbständig.

Stunde_1_Überblick

Arbeitsblatt1_Datensatz

Variablenliste_JIM_2021_reduziert

Kurzeinführung in CODAP:

https://youtu.be/2z5H4anfhWM (ca. 5 min)

2-3 In diesen beiden Stunden geht es darum, dass die Schülerinnen und Schüler zu Data-Science- Experten werden, um anschließend selbständig arbeiten zu können.

Zunächst kann, sofern noch nicht geschehen, Arbeitsblatt 1 besprochen werden.

Die Präsentation zu Sitzung 2+3 kann als Lehrerhintergrundinformation oder zur Präsentation im Unterricht begleitend zu den Arbeitsblättern 3-6a genutzt werden.

Einführung in nötige Grundbegriffe und Erwartungshaltung aufbauen Die SuS erhalten Informationen über grundlegende statistische Fachbegriffe (Infoblatt_Glossar). Die kennengelernten statistischen Grundbegriffe übertragen die SuS anhand von Arbeitsblatt 2 auf den vorliegenden Datensatz.

CODAP und Analysemethoden Es werden Auswertungsmöglichkeiten bezüglich verschiedener Prozente und damit verbundener Aussagen erarbeitet.

Zunächst steht thematisch das „Modellieren der Daten“ an. Interessierende Merkmale werden umcodiert, so dass die Ausprägungen von z. B. sieben (täglich, mehrmals pro Woche, … nie) auf zwei (z. B. häufig, selten) reduziert werden. Dies vereinfacht die Auswertungen. Mehrere Unterrichtserprobungen haben ge-zeigt, dass dies ein sinnvolles Vorgehen ist und gleichzeitig das Modellieren thematisiert wird. Dies wird in Anleitung_CODAP_umcodieren (diese Anleitung ist im YouTube-Video umge-setzt) erklärt.

Wir schlagen vor, mit der Anleitung (Anleitung_CODAP_umcodieren) in die Exploration zu starten und dann die Anleitung_CODAP_2dimProzente weiter zu nutzen.

Eine Differenzierungsmöglichkeit besteht hier erneut darin, motivierte SuS Auswertungen mit den binären Merkmalen und zusätzlich mit den Merkmalen mit sieben Ausprägungen machen zu lassen (die Arbeitsblätter 3-5 lassen sich auf beide Arten bearbeiten).

Je nach Kurs/Klasse können sich die SuS die Auswertungsmöglichkeiten anhand der Anleitungen selbst erarbeiten und bei den Arbeitsblättern anwenden. Alternativ kann die Lehrkraft mithilfe der PowerPoint in die Analysemethoden einführen und die SuS bearbeiten dann die Arbeitsblätter. Dies ist die notwendige Voraussetzung für die eigenständige Schülerexploration in den folgenden Stunden. Erfahrungsgemäß benötigen SuS Unterstützen beim Bearbeiten und Interpretieren der prozentualen Auswertungen mit Zeilen-, Spalten- oder Zellenprozenten. Einen Einstieg auch zur Diskussion kann Arbeitsblatt 6 bieten.

Technik Hier sollte den SuS auch gezeigt werden, wie sie Graphiken aus CODAP in eine Word-Datei oder eine PowerPoint Präsentation kopieren können. Ggf. ist auch das Weitergeben des CODAP-Dokuments per Link eine gute Möglichkeit, um Schülerbearbeitungen zu dokumentieren, bzw. zu kontrollieren.

Infoblatt_Glossar

Arbeitsblatt2_Begriffe

PowerPoint-Präsentation (optional)

Anleitung_CODAP_1dim

Anleitung_CODAP_umcodieren

(https://youtu.be/qcK_ZZsWfbQ)

Anleitung_CODAP_2dim_ausblenden


Arbeitsblatt 3

Arbeitsblatt 4

Arbeitsblatt 5



Arbeistblatt 6



Anleitung_Grafikenkopieren

Oder YouTube-Video zum Kopieren des Arbeitsstands per Link:

https://youtu.be/otLuX8hhtq8

4 Erwartungshaltung aufbauen und passende Fragen stellen

In dieser Stunde werden die Schülerinnen und Schüler in Kleingruppen für die komplette restliche Unterrichtseinheit eingeteilt und vier verschiedenen inhaltlichen Bereichen der Daten/Kunden der Online-Plattform zugeordnet (Arbeitsblatt_6_Gruppenbildung). Jede Gruppe sollte vier SuS umfassen, damit die spätere Think-pair-share Phase gut funktioniert.

Die Erfahrung hat gezeigt, dass das Stellen von geeigneten (statistischen) Fragestellungen für SuS eine Hürde darstellt, deshalb liegt ein weiterer Fokus dieser Stunde darauf, die SuS anhand von AB 6b in Kleingruppen geeignete Fragen erarbeiten zu lassen. Hierfür wird die Methode Think-Pair-Share genutzt.

Anhand von AB 8 findet eine theoretische Auseinandersetzung mit den Daten, resp. der Variablenliste, statt, um eine Erwartungshaltung für die kommenden Stunden aufzubauen. Diese Erwartungshaltung ist zentral für die eigene Datenanalyse und soll auf Plakaten festgehalten werden. Die hierzu erstellten Plakate sollten im Verlauf der weiteren Unterrichtseinheit sichtbar für alle SuS im Klassenraum hängen.

Arbeitsblatt7 Gruppenbildung

Plakate


PowerPoint als Hintergrundinformation für Lehrende




Arbeitsblatt_8_Fragestellung


5-6 Projektarbeit in Kleingruppen

In diesen beiden Stunden wird das Vorgehen der Datenexploration von den Kleingruppen zunächst geplant (Arbeitsblatt 9). Anschließend findet die Datenexploration in den Kleingruppen statt (Arbeitsblatt 10) und die Präsentation der Ergebnisse wird vorbereitet. Zu Beginn der sechsten Stunde können evtl. Kriterien für gute statistische Präsentationen besprochen werden, um die Erstellung der Präsentationen vorzubereiten (leere Power-Point-Vorlage). Die Lehrkraft steht in den Stunden 5-6 vor allem unterstützend für Fragen und Anregungen zur Verfügung, die SuS arbeiten möglichst selbständig mit CODAP und PowerPoint.

Arbeitsblatt_9_Planung

Arbeitsblatt_10_Datenanalyse

Anleitung_Hinweise_Präsentation

Leere PowerPoint-Vorlage für Schülerpräsentationen

7 Präsentationen der Kleingruppen

In dieser Stunde finden die Präsentationen der Schülerergebnisse statt. Dabei kann immer eine Gruppe einen speziellen Feedback-Auftrag bekommen, damit eine inhaltliche Diskussion angeregt wird (Arbeitsblatt 11). Anhand von Arbeitsblatt 12, das sich gut als Hausaufgabe und Ergebnissicherung eignet, können die SuS überprüfen, ob sie eine Datenanalyse durchführen können.

PowerPoint-Präsentationen der SuS

Arbeitsblatt_11_Feedback

Arbeitsblatt_12_Hausaufgabe

8 Reflektieren

In dieser Stunde findet eine gemeinsame Reflexion des gesamten Projekts statt. Die einzelnen Schritte der durchgeführten Datenanalyse werden den Stationen des PPDAC-Kreislaufs zugeordnet (Powerpoint Präsentation Stunde 8).

Weiter können unter anderem persönliche und gesellschaftliche Auswirkungen einer Datenexploration angesprochen werden und versucht werden, „über den Tellerrand” zu schauen.

Powerpoint Präsentation Stunde 8
Abschluss Zu Forschungszwecken bitten wir darum, dass die SuS am Ende der Unterrichtsreihe eine anonyme Umfrage ausfüllen und Feedback geben, wie Ihnen die Unterrichtsreihe gefallen hat. Link zu der Umfrage
Exkurs Datenbereinigung als Detektivarbeit

Der Bereich Datenbereinigung kann als Exkurs in einer eigenen Stunde thematisiert werden. Hierzu gibt es die nebenstehende CODAP-Umgebung, in der sich der unbereinigte JIM-Datensatz befindet. Dort findet sich ebenfalls ein Textfeld mit Erklärungen und ersten Schritten, wie mit Hilfe von CODAP eine Datenbereinigung vorgenommen werden kann.

https://tinyurl.com/jim-pb50-unbereinigt

Weitere Hinweise

Möglichkeit zur Differenzierung

Die Unterrichtsreihe ist so angelegt, dass mit einem „kleinen“ Datensatz gearbeitet wird. Dieser enthält 50 Variable und bietet reichhaltig Möglichkeiten für Explorationen.

Für besonders motivierte Schülerinnen und Schüler kann stattdessen auch mit dem großen Datensatz gearbeitet werden, der alle 160 Variablen erhält, die in der Umfrage erhoben wurden. Dies erfordert jedoch ein hohes Engagement und gutes Arbeiten mit der Variablenliste seitens der Schülerinnen und Schüler!

Eine weitere Möglichkeit zur Differenzierung besteht darin, besonders motivierte Schülerinnen und Schüler mit den „normalen“ Merkmalen mit allen sieben Ausprägungen arbeiten zu lassen. Der Standardfall sollte das Arbeiten mit binären Merkmalen sein, also Merkmalen, die zuvor von den SuS umcodiert wurden, wie in Anleitung_CODAP_umcodieren in Stunde 2+3 beschrieben.

Zum Umgang mit den Aufgaben

In der Unterrichtsreihe wird viel mit Arbeitsblättern gearbeitet. Um den Lernprozess zu dokumentieren und gleichzeitig die Motivation hoch zu halten, kann man die Aufgaben auch direkt in einer PowerPoint-Präsentation erarbeiten lassen. Neue Aufgaben können auf neuen Folien bearbeitet werden und am Ende können aus den verschiedenen Schulstunden Ergebnisse genommen werden, um die Abschlusspräsentation zu gestalten.

Zum Umgang mit CODAP

CODAP ist in weiten Teilen auf Deutsch verfügbar. Sollte die Sprache nicht auf Deutsch eingestellt sein, so kann rechts oben die Sprache umgestellt werden.

Link zum Datensatz mit allen 161 Variablen:

https://tinyurl.com/jim-pb160

Teilnahme an der Umfrage

Wer mit seiner Klasse an der Umfrage teilnehmen möchte, kann dies gerne machen. Die Daten werden vollständig anonym erfasst (eventuell mit der Schulleitung abklären). Die Daten fließen dann jährlich in eine Neuauflage des Datensatzes ein, der per CODAP-Link zugänglich bleibt.

Über diesen Link können SuS an der Umfrage teilnehmen (Achtung: 161 Fragen!, genügend Zeit einplanen):

Link

Unterseiten