19317212 Projektseminar

WiSe 17/18: Projektseminar: KI-gestützte Pflege einer internationalen Schuldatenbank

Christoph Benzmüller

Kommentar

Es soll ein Prototyp zur Verwaltung und Vereinigung von Schul-Datensätzen der gemeinnützigen Projekte „Mathe im Advent“ der Firma Mathe im Leben gemeinnützige GmbH und „Abiturpreis” der Deutschen Mathematiker-Vereinigung e.V. entwickelt werden. Beide Projekte haben eine große Zahl an Schuldaten, aus verschieden Quellen. Ausserdem werden von Lehrer_innen jedes Jahr die Schul-Datensätze angepasst und neue hinzugefügt. Dabei werden viele Schulen mit kleineren Abweichungen in Namen und Adresse mehrfach angelegt. Eine hohe Abdeckung von Schulen vereinfacht die Nutzung beider Projekte. Obwohl beide Projekte ähnliche Daten nutzen, gibt es aktuell keine einheitliche Schnittstelle, dies auszutauschen.

Ziel ist die Entwicklung eines Software-Prototypen zur automatischen Erkennung von Schul-Datensätze die zu der gleichen Schule gehören, deren Zusammenfassung und Korrektur.
Die Kernkomponenten sind hierbei:

  • KI-gestütztes oder musterbasiertes Suchen von ähnlichen Schul-Datensätzen (finden von doppelten Einträgen der gleichen Schule);
  • Ein Formular zur Vereinigung ähnlicher Schul-Datensätze in einen Schul-Datensatz,
  • Ein Formular zur Trennung von definitiv unterschiedlichen Schul-Datensätzen,
  • CSV-Import der Schul-Datensätze von „Mathe im Advent“ und „Abiturpreis”;
  • CSV-Export der aktuellen Schul-Datensätze in entsprechend benötigte Formate für „Mathe im Advent” und „Abiturpreis”.

Das Softwareprojekt wird von den Teilnehmern frei nach Scrum strukturiert und durchgeführt. Product-Owner werden hier die Hauptentwickler des gemeinnützigen Projekts „Mathe im Advent“ der Firma Mathe im Leben gemeinnützige GmbH sein. Je nach Interesse und Anzahl der Teilnehmer werden zusätzlich folgende Features implementiert:

Reinforced-Learning für das KI-gestützte Suchen ähnlicher Schul-Datensätzen basierend auf den Angaben der Nutzer in den Formularen zur Vereinigung/Trennung der Schul-Datensätze.
Präfung und Korrektur der Adressdaten von Schul-Datensätzen z.B. über die Google-Map-API.
Unterschiedliche Behandlung von bereits geprüften und neu importierten Schul-Datensätzen je nach Quelle
Erstellung von Diffs und darauf basierende Historien und die Möglichkeit Vereinigungen rückgängig zu machen.
Web-Crawler zur Ergänzung des Datenbestands aus verfügbaren Website-Daten

Eine anschliessende Weiterentwicklung und Pflege zu einer produktiv einsetzbaren Software ist möglich und wird bei entsprechender Qualität der Abgabe auf Honorarbasis von der Firma Mathe im Leben gemeinnützige GmbH entlohnt.

Schließen

17 Termine

Regelmäßige Termine der Lehrveranstaltung

Mo, 26.02.2018 12:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Di, 27.02.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Mi, 28.02.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Do, 01.03.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Fr, 02.03.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Mo, 05.03.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Mo, 12.03.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Mo, 19.03.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Mo, 26.03.2018 10:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Di, 03.04.2018 12:00 - 18:00

Räume:
T9/K 036 Rechnerpoolraum (Takustr. 9)

Mo, 26.02.2018 10:00 - 12:00

Räume:
T9/049 Seminarraum (Takustr. 9)

Mo, 05.03.2018 10:00 - 12:00

Dozenten:
Prof. Dr. Christoph Benzmüller

Räume:
T9/049 Seminarraum (Takustr. 9)

Mo, 12.03.2018 10:00 - 12:00

Dozenten:
Prof. Dr. Christoph Benzmüller

Räume:
T9/049 Seminarraum (Takustr. 9)

Mo, 19.03.2018 10:00 - 12:00

Dozenten:
Prof. Dr. Christoph Benzmüller

Räume:
T9/049 Seminarraum (Takustr. 9)

Mo, 26.03.2018 10:00 - 12:00

Dozenten:
Prof. Dr. Christoph Benzmüller

Räume:
T9/049 Seminarraum (Takustr. 9)

Di, 03.04.2018 10:00 - 12:00

Dozenten:
Prof. Dr. Christoph Benzmüller

Räume:
T9/049 Seminarraum (Takustr. 9)

Fr, 06.04.2018 10:00 - 14:00

Dozenten:
Prof. Dr. Christoph Benzmüller

Räume:
T9/049 Seminarraum (Takustr. 9)

Studienfächer A-Z