Home Up PDF Prof. Dr. Ingo Claßen
P1

SQL-Anweisungen und Python-Code mittels LLM erzeugen

In dieser Aufgabe sollen sie eine Tabelle mit Kreditkartenabrechnungsdaten analysieren. Sie sollen SQL-Abfragen für gegebene Fragestellungen erstellen, durch die Postgres-Datenbank ausführen lassen und die Ergebnisse mittels Python visualisieren. Verwenden sie ein Sprachmodell ihrer Wahl (siehe z.B. ChatKI der HTW) und lassen sie pro Unteraufgabe erst einmal den SQL-Befehl erzeugen. Lassen sie danach Python-Code zur Datenvisualisierung erzeugen. Protollieren sie ihre Chats und präsentieren sie in der nächsten Übung ihre Ergebnisse:

  • Konnte die Aufgabe gelöst werden
  • Wieviel Rückfragen waren notwendig
  • Wie gut wurde auf die Rückfragen reagiert
  • usw.

Sollten sie eine korrekte Lösung nicht mit dem Sprachmodell erstellen können, so erstellen sie diese selbst.

Die folgenden Aufgaben basieren auf der Tabelle ccfraud, die in der Postgres-Datenbank zur Verfügung steht.

Versuchen sie ähnliche Visualisierungen zu erstellen, wie ich in den Aufgaben vorgegeben habe. Machen sie eine Kopie von "intro-pg.ipynb" und benennen sie die in "ccfraud-llm.ipynb" um und tragen sie dort den vom LLM erzeugten Code ein.

Senden sie mir ihre Präsentationen vor Beginn der Übung als PDF zu.

Anteil Datensätze pro Jahr

Hier soll ein Balkendiagramm angezeigt werden.

Anteil Datensätze Ok/Betrug

Hier soll eine tabellarische Darstellung erfolgen

Histogramm Nutzer

Hier soll ein Histgramm angezeigt werden.

Betrugsanteil pro Jahr

Balkendiagramm

Betrugsanteil pro Umsatzbereich

Balkendiagramm

Die Umsatzbereiche müssen durch einen Case-Ausdruck definiert werden.

Betrugsanteil pro Abstand in Minuten für selben User und Stadt unterschiedlich

Balkendiagramm

Sie müssen hier alle Transaktionen zusammenfassen, die vom selben User stammen, in unterschiedlichen Städten ausgelöst wurden und deren zeitlicher Abstand maximal 5 Minuten beträgt. Des Weitern müssen sie ein zweite Gruppe bilden, ebenfalls identischer User und unterschiedliche Stadt, aber zeitlicher Abstand größer als 5 Minuten.