In dieser Aufgabe sollen sie eine Tabelle mit Kreditkartenabrechnungsdaten analysieren. Sie sollen SQL-Abfragen für gegebene Fragestellungen erstellen, durch die Postgres-Datenbank ausführen lassen und die Ergebnisse mittels Python visualisieren. Verwenden sie ein Sprachmodell ihrer Wahl (siehe z.B. ChatKI der HTW) und lassen sie pro Unteraufgabe erst einmal den SQL-Befehl erzeugen. Lassen sie danach Python-Code zur Datenvisualisierung erzeugen. Protollieren sie ihre Chats und präsentieren sie in der nächsten Übung ihre Ergebnisse:
Sollten sie eine korrekte Lösung nicht mit dem Sprachmodell erstellen können, so erstellen sie diese selbst.
Die folgenden Aufgaben basieren auf der Tabelle ccfraud
, die in der Postgres-Datenbank zur Verfügung steht.
Versuchen sie ähnliche Visualisierungen zu erstellen, wie ich in den Aufgaben vorgegeben habe. Machen sie eine Kopie von "intro-pg.ipynb" und benennen sie die in "ccfraud-llm.ipynb" um und tragen sie dort den vom LLM erzeugten Code ein.
Senden sie mir ihre Präsentationen vor Beginn der Übung als PDF zu.
Hier soll ein Balkendiagramm angezeigt werden.
Hier soll eine tabellarische Darstellung erfolgen
Hier soll ein Histgramm angezeigt werden.
Balkendiagramm
Balkendiagramm
Die Umsatzbereiche müssen durch einen Case-Ausdruck definiert werden.
Balkendiagramm
Sie müssen hier alle Transaktionen zusammenfassen, die vom selben User stammen, in unterschiedlichen Städten ausgelöst wurden und deren zeitlicher Abstand maximal 5 Minuten beträgt. Des Weitern müssen sie ein zweite Gruppe bilden, ebenfalls identischer User und unterschiedliche Stadt, aber zeitlicher Abstand größer als 5 Minuten.