Vorbemerkung

Alle Zugriffe nur im Intranet. An der HTW oder über VPN.

Arbeiten mit dem Portainer

Einloggen

Host, Userid und Passwort werden in der LV bekannt gegeben
URL: https://aaa.f4.htw-berlin.de:9443/

Environment “local” auswählen

Auf "local" klicken
Dashboard wird angezeigt

Netzwerk

In der Navigationsleiste links auf "Networks" klicken
Auf Button "Add network" klicken
Name adbkt eintragen

Stack anlegen

Stacks entsprechen docker-compose
In der Navigationsleiste links auf "Stacks" klicken
Auf Button "Add stack" klicken
Docker-Compose-Code in Web-Editor eingeben
Auf "Deploy the stack" klicken

Postgres

Container erstellen

Achtung: Passwort eintragen.

networks:
  adbkt:
    external: true
    
services:
  pg:
    container_name: pg
    image: postgres:latest
    ports:
      - 5432:5432
    environment:
      POSTGRES_PASSWORD: #<-- hier Passwort eintragen
    networks:
      - adbkt
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U postgres -d postgres"]
      interval: 5s
      timeout: 5s
      retries: 3

Zugriff per DBeaver

DBeaver Download (link)
Passwort wie vorher vergeben
Verbindungsdaten
- user: postgres
- password: (wie vergeben)
- host: aaa.f4.htw-berlin.de:5432
- database: postgres

Python

Container erstellen

Version für eine Gruppe, die aus einer Person besteht. Sollten mehrere Personen in der Gruppe sein, müssen Namen und Ports angepasst werden, siehe weiter unten.

networks:
  adbkt:
    external: true

services:
  py:
    container_name: py
    image: iclassen/ubu-py-uv:latest
    entrypoint: ["/root/entrypoint.sh"]
    user: root
    ports:
      - 10000:8888
      - "20000:22"
      - 30000:3000
      - 40000:4000
      - 50000:5000
      - 60000:6000
    networks:
      - adbkt

Anpassungen für Gruppen mit mehreren Personen

Zweiergruppe:

Zwei Container py1 und py2
Eintrag py in py1 bzw. py2 im Docker-Compose-Code ändern
Portanpassungen entsprechend folgender Tabelle

Port	py1	py2
JupyterLab (8888)	10001:8888	10002:8888
SSH (22)	20001:22	20002:22
Port 3000	30001:3000	30002:3000
usw.	x0001:x000	x0002:x000

Entsprechend für Gruppen mit 3 Personen.

Auf JupyterLab zugreifen

Host anpassen
Port ggf. anpassen: 10001, 10002, ...

http://aaa.f4.htw-berlin.de:10000/lab

Bibliothek installieren

Terminal in JupyterLab öffnen
Code kopieren (Paste mit CTRL-SHIFT-V)

uv pip install -U psycopg[binary,pool]

Per Python auf Postgres zugreifen

Neues Notebook anlegen
Achtung: Passwort eintragen

import psycopg

conninfo = " ".join([
"user='postgres'",
"password=''",   #<-- hier Passwort eintragen
"host='pg'",
"port=5432",
"dbname='postgres'"])
print(conninfo)

sql1 = "drop table if exists kv"
sql2 = """
create table kv (
  k integer not null,
  v varchar not null
)
"""
sql3 = "insert into kv values (1, 'hallo'), (2, 'hi')"

with psycopg.connect(conninfo) as conn:
    conn.execute(sql1)
    conn.execute(sql2)
    conn.execute(sql3)

sql = "select * from kv"
with psycopg.connect(conninfo) as conn:
    rs = conn.execute(sql).fetchall()

print(rs)

Cassandra

Container erstellen

networks:
  adbkt:
    external: true

services:
  cas:
    container_name: cas
    image: cassandra:latest
    ports:
      - 9042:9042
    environment:
      - JVM_OPTS=-Xms1024M -Xmx1024M
      - HEAP_NEWSIZE=1024M
      - MAX_HEAP_SIZE=1024M
    networks:
      - adbkt
    healthcheck:
      test: ["CMD", "cqlsh", "-e", "describe keyspaces"]
      interval: 20s
      timeout: 10s
      retries: 3
      start_period: 60s

Keyspace erstellen

Konsole in Container cas öffnen
Cassandra Query Language Shell starten (cqlsh)
Code ausführen:

create keyspace test with replication = {
  'class': 'SimpleStrategy', 'replication_factor' : 1
};

use test;

create table t (
  pk int,
  sk int,
  v int,
  primary key (pk, sk)
);

insert into t(pk, sk, v) values (1, 1, 100);
insert into t(pk, sk, v) values (1, 2, 200);

select * from t where pk=1;

Bibliothek installieren

Terminal in JupyterLab öffnen
Code kopieren (Paste mit CTRL-SHIFT-V)

uv pip install -U cassandra-driver

Per Python auf Cassandra zugreifen

Neues Notebook anlegen. Code in erste Zelle kopieren.

from cassandra.cluster import Cluster

cluster = Cluster(["cas"], port=9042)
session = cluster.connect('test')

print(session.execute("SELECT release_version FROM system.local").one())

rows = session.execute("select * from t where pk=1")
for r in rows:
    print(f"{r.pk}|{r.sk}|{r.v}")

session.shutdown()
cluster.shutdown()

Neo4j

Container erstellen

Achtung: Passwort eintragen.

networks:
  adbkt:
    external: true

services:
  neo4j:
    container_name: neo4j
    image: neo4j
    ports:
      - 7474:7474
      - 7687:7687
    environment:
      - NEO4J_AUTH=neo4j/ #<-- hier Passwort eintragen
      - NEO4J_server_memory_heap_initial__size=500M
      - NEO4J_server_memory_heap_max__size=500M
      - NEO4J_server_memory_pagecache_size=500M
      - NEO4J_PLUGINS=["apoc", "graph-data-science"]
    healthcheck:
      test: ["CMD", "cypher-shell", "-u", "neo4j", "-p", "", "RETURN 1"] #<-- hier Passwort eintragen
      interval: 10s
      timeout: 10s
      retries: 3
      start_period: 30s

Auf Neo4j-Browser zugreifen

http://aaa.f4.htw-berlin.de:7474

Alle Daten löschen

MATCH (x) DETACH DELETE x;

Schema anzeigen

call db.schema.visualization()

Neo4j - UBahn-Daten laden

Achtung: Passwort eintragen.

import duckdb
from neo4j import GraphDatabase

parquet_url = "https://raw.githubusercontent.com/ic-htw/data/main/parquet/bubahn"

def load_df(table_name):
    return duckdb.query(f"SELECT * FROM '{parquet_url}/{table_name}.parquet'").to_df()

df_haltestelle = load_df("haltestelle")
df_segment = load_df("segment")
df_linie = load_df("linie")
df_unterlinie = load_df("unterlinie")
df_abschnitt = load_df("abschnitt")

neo4j_host = "neo4j://widb000l.f4.htw-berlin.de:7687"
neo4j_auth = ("neo4j", "") #<-- hier Passwort eintragen

cypher_create_stop = 'CREATE (h:Haltestelle {hid: $hid, bez: $bez, lat:$lat, lng:$lng})'
with GraphDatabase.driver(neo4j_host, auth=neo4j_auth) as driver:
    with driver.session() as session:
        for r in df_haltestelle.itertuples(index=False):
            session.run(cypher_create_stop, hid=r.HID, bez=r.BEZ, lat=r.LAT, lng=r.LNG)

cypher_create_linie = 'CREATE (l:Linie {lid: $lid, bez: $bez})'
with GraphDatabase.driver(neo4j_host, auth=neo4j_auth) as driver:
    with driver.session() as session:
        for r in df_linie.itertuples(index=False):
            session.run(cypher_create_linie, lid=r.LID, bez=r.BEZ)

cypher_create_segment = '''
MATCH (ha:Haltestelle), (hb:Haltestelle)
WHERE ha.hid=$hid_a AND hb.hid=$hid_b
CREATE (s:Segment {hid_a: ha.hid, hid_b: hb.hid, laengeInMeter: $laengeInMeter})
CREATE (s) -[:ProjSegA]-> (ha)
CREATE (s) -[:ProjSegB]-> (hb)
'''
with GraphDatabase.driver(neo4j_host, auth=neo4j_auth) as driver:
    with driver.session() as session:
        for r in df_segment.itertuples(index=False):
            session.run(cypher_create_segment, hid_a=r.hid_a, hid_b=r.hid_b, laengeInMeter=r.laenge_in_meter)


cypher_create_unterlinie = '''
MATCH (l:Linie)
WHERE l.lid=$lid
CREATE (ul:Unterlinie {ulid: $ulid})
CREATE (ul) -[:InL]-> (l)
'''
with GraphDatabase.driver(neo4j_host, auth=neo4j_auth) as driver:
    with driver.session() as session:
        for r in df_unterlinie.itertuples(index=False):
            session.run(cypher_create_unterlinie, ulid=r.ULID, lid=r.LID)


cypher_create_abschnitt = '''
MATCH (ha:Haltestelle), (hb:Haltestelle), (ul:Unterlinie)
WHERE ha.hid=$hid_a AND hb.hid=$hid_b AND ul.ulid=$ulid
CREATE (a:Abschnitt {nr: $nr, haelt: $haelt})
CREATE (a) -[:InUL]-> (ul)
CREATE (a) -[:ProjAbA]-> (ha)
CREATE (a) -[:ProjAbB]-> (hb)
'''
with GraphDatabase.driver(neo4j_host, auth=neo4j_auth) as driver:
    with driver.session() as session:
        for r in df_abschnitt.itertuples(index=False):
            session.run(cypher_create_abschnitt, ulid=r.ULID, nr=r.NR, hid_a=r.HID_A, hid_b=r.HID_B, haelt=r.HAELT)

Neo4j - Graphprojektion

Anlegen:

MATCH (ha:Haltestelle)<-[sa:ProjSegA]-(s:Segment)-[sb:ProjSegB]-(hb:Haltestelle)
WITH gds.graph.project(
    'bubahn',
    ha,
    hb,
    {relationshipProperties: s{.laengeInMeter}},
    {undirectedRelationshipTypes: ['*']}) AS g
RETURN
  g.graphName AS graph, g.nodeCount AS nodes, g.relationshipCount AS rels

Auflisten:

call gds.graph.list()

Löschen:

CALL gds.graph.drop('bubahn') YIELD graphName;

K6

networks:
  adbkt:
    external: true

services:
  k6:
    container_name: k6
    image:  iclassen/ubu-k6
    networks:
      - adbkt

InfluxDB

networks:
  adbkt:
    external: true

services:
  idb:
    container_name: idb
    image: influxdb:3-core
    ports:
      - 8181:8181
    command:
      - influxdb3
      - serve
      - --node-id=node0
      - --object-store=file
      - --data-dir=/var/lib/influxdb3/data
      - --plugin-dir=/var/lib/influxdb3/plugins
    networks:
      - adbkt

Grafana

networks:
  adbkt:
    external: true

services:
  grafana:
    container_name: grafana
    image:  grafana/grafana:12.1-ubuntu
    ports:
      - 3000:3000
    networks:
      - adbkt