Home Up PDF Prof. Dr. Ingo Claßen
Ü: Vektordatenbanken

Übung Vektordatenbanken

Sie sollen die Grundlage für eine RAG-Anwendung schaffen, die Fragen zum Studium der Wirtschaftsinformatik beantworten kann. Dazu müssen Informationen von der WI-Website heruntergeladen, aufbereitet und in Embeddings transformiert werden.
Arbeitspunkte

  • Starten sei mit einer URL, z.B. (link)
  • Extrahieren sie Informationen z.B. mittels Langchain
  • Zerlegen sie die Informationen in Chunks
  • Erzeugen sie Embeddings für die Chunks
  • Speichern Sie die Textfragmente mit ihren Embeddings in einer Vektordatenbank (s.u.)
  • Erweitern sie das Ganze mit relevanten URLs aus der WI-Website
  • Überlegen sie sich Fragen (Z.B "Wieviele Semester dauert das Bachelor-Studium?")
  • Lassen sie sich die drei ähnlichsten Texfragmente aus der Datenbank ausgeben
  • Präsentieren sie ihre Lösung

Vektordatenbanken

  • Chroma
  • LanceDB
  • Milvus
  • Pinecone
  • Qdrant
  • Weaviate