4Stufe 4 — Power-KI: Hochwertige Analyse auf GPU-Server
Wenn du mehr als 20.000 Fotos hast oder detailliertere Beschreibungen willst, lohnt sich ein gemieteter GPU-Server. Statt Tagen dauert die Analyse Stunden.
Lokaler Mac vs. GPU-Server
| Lokaler Mac (Stufe 3) | GPU-Server (Stufe 4) |
|---|
| Modell | LLaVA 7B (klein) | Qwen2.5-VL-32B (groß, 4× besser) |
| Geschwindigkeit | ~200 Bilder/Std. | ~2.000–4.000 Bilder/Std. |
| Beschreibungsqualität | 1–2 Sätze, ~60 Zeichen | 10+ Sätze, ~900 Zeichen, 11 Tags |
| 50.000 Fotos | ~10 Tage | ~12–25 Stunden |
| Kosten | 0 € (nur Strom) | ~15–80 € (Servermiete) |
Option A: GPU-Server mieten (empfohlen)
Anbieter wie Trooper AI, Vast.ai, RunPod oder Lambda Labs vermieten GPU-Server auf Stundenbasis. Du mietest, lässt die Analyse laufen, und gibst den Server zurück.
| Parameter | Wert |
|---|
| GPU | NVIDIA RTX 4080 Super (16 GB VRAM) |
| System-RAM | 32 GB |
| Modell | Qwen2.5-VL-32B-Instruct-AWQ (4-bit quantisiert) |
| Parallelität | 2–4 Bilder gleichzeitig |
| Durchsatz | ~2.000–4.000 Bilder/Stunde |
| Kosten | ~80 €/Woche (~0,50 €/Stunde) |
Option B: Cloud-Vision-API (teuer, aber einfach)
Achtung
Cloud-APIs wie OpenAI GPT-4o oder Google Gemini Vision sind deutlich teurer als GPU-Miete — und deine Fotos verlassen deinen Rechner.
| Anbieter | Kosten/Bild | 10.000 Bilder | 50.000 Bilder | 100.000 Bilder |
|---|
| OpenAI GPT-4o | ~0,01–0,03 € | 100–300 € | 500–1.500 € | 1.000–3.000 € |
| Google Gemini | ~0,005–0,02 € | 50–200 € | 250–1.000 € | 500–2.000 € |
| Claude Vision | ~0,01–0,03 € | 100–300 € | 500–1.500 € | 1.000–3.000 € |
| GPU-Miete ✓ | ~0,001–0,005 € | 5–50 € | 15–80 € | 30–160 € |
Option C: Eigene GPU
| GPU | Preis (gebraucht) | VRAM | Modell-Empfehlung |
|---|
| RTX 3060 (12 GB) | ~200 € | 12 GB | Qwen 7B (gut) |
| RTX 3090 (24 GB) | ~500 € | 24 GB | Qwen 32B AWQ (sehr gut) |
| RTX 4090 (24 GB) | ~1.200 € | 24 GB | Qwen 32B AWQ (schneller) |
Schritt-für-Schritt: GPU-Server mieten
Auf dem GPU-Server
# 1. Account bei Trooper AI / Vast.ai erstellen
# 2. Server buchen (RTX 4080 Super, mind. 16 GB VRAM)
# 3. Verbinden und Modell starten
ssh user@gpu-server
python -m vllm.entrypoints.openai.api_server \
--model Qwen/Qwen2.5-VL-32B-Instruct-AWQ \
--max-model-len 8192 \
--gpu-memory-utilization 0.95 \
--max-num-seqs 4Vom Heimrechner aus
# 4. Nur Thumbnails hochladen (nicht die Originale!)
rsync -avz ~/Archivblick/thumbs/lg/ user@gpu-server:~/bilder/
# 5. KI-Analyse starten
archivblick describe --remote gpu-server:8000 --model qwen-32b
# 6. Ergebnisse importieren
scp user@gpu-server:~/ergebnisse/*.jsonl ~/Archivblick/import/
archivblick import ~/Archivblick/import/
# 7. Server herunterfahren / kündigen
Kostenbeispiele (reale Werte)
| Szenario | Bilder | GPU | Dauer | Kosten |
|---|
| Kleines Familienarchiv | 10.000 | RTX 4080 Super | ~3–5 Std. | ~5–10 € |
| Großes Familienarchiv | 50.000 | RTX 4080 Super | ~12–25 Std. | ~15–30 € |
| Profi-Archiv | 100.000 | RTX 4080 Super | ~25–50 Std. | ~30–60 € |
| Enterprise | 250.000+ | RTX 4080 Super | ~1 Woche | ~80 € |
Praxis-Referenz
Das ArchivBlick-Entwicklungsarchiv (268.000 Dateien) wurde in mehreren Runs auf einem Trooper-AI-Server analysiert: 88.452 Bilder mit Qwen 7B in 6 Stunden (~15 €), 58.894 Bilder mit Qwen 32B in ~1 Woche (~80 €).
5Stufe 5 — Vollausbau: Semantische Suche, Karten, Reiseberichte
Der Endausbau macht aus ArchivBlick ein professionelles Archiv-System mit Features, die kein anderes Fotoarchiv-Tool bietet.
Terminal — PostgreSQL einrichten
# macOS
brew install postgresql@16
brew services start postgresql@16
# Datenbank erstellen
createdb archivblick
# Erweiterungen installieren
psql archivblick -c "CREATE EXTENSION IF NOT EXISTS vector;" -- Vektorsuche
psql archivblick -c "CREATE EXTENSION IF NOT EXISTS postgis;" -- Geo-Queries
psql archivblick -c "CREATE EXTENSION IF NOT EXISTS pg_trgm;" -- Fuzzy-Suche
# Migration von SQLite
archivblick migrate --from sqlite --to postgresql
# Auf PostgreSQL umschalten
export ARCHIVBLICK_QUELLE=macmini
export ARCHIVBLICK_PG_DSN="host=localhost dbname=archivblick user=$USER"
archivblick start
Terminal — Embeddings generieren
# Auf GPU-Server (empfohlen) oder lokal:
archivblick embed --model bge-m3
Embedding-Modelle
| Modell | Dimensionen | Geschwindigkeit | Qualität |
|---|
| BGE-M3 | 1024 | ~10.000 Texte/Min. (GPU) | Sehr gut für Deutsch |
| all-MiniLM | 384 | ~50.000 Texte/Min. (CPU) | OK für Englisch |
Was du im Vollausbau hast
| Feature | Beschreibung | Beispiel |
|---|
| Semantische Suche | Findet Fotos nach Bedeutung | "gemütlicher Abend" → Kerzenlicht-Fotos |
| Karten-Ansicht | Alle Fotos auf Weltkarte, filterbar | Alle Fotos im Umkreis 5 km um Positano |
| Tippfehler-Toleranz | Findet trotzdem das Richtige | "Küstenstrasse" → "Küstenstraße" |
| Reisebericht-Generator | Automatische Berichte mit Wetter | Datum + Ort → fertiger Bericht |
| Foto-Scoring | Automatische Qualitätsbewertung | Panorama + Sonnenuntergang = hoher Score |
| Ähnliche Fotos | "Mehr wie dieses" | Klick auf Strandfoto → alle ähnlichen Strände |
PostgreSQL-Erweiterungen
| Erweiterung | Funktion | Warum wichtig |
|---|
| pgvector | Speichert 1024-dim Vektoren, HNSW-Index | Semantische Suche in Millisekunden |
| PostGIS | Geo-Datentypen, Radius-Queries | "Alle Fotos innerhalb dieses Kartenausschnitts" |
| pg_trgm | Trigramm-basierte Textähnlichkeit | Tippfehler finden, unscharfe Suche |
FAQ — Häufige Fragen
Brauche ich Programmierkenntnisse?
Stufe 1–2: Nein. Installation und Grundeinrichtung sind so einfach wie eine normale App. Stufe 3–5: Grundlegende Kommandozeilen-Kenntnisse helfen (Terminal öffnen, Befehle eingeben). Du musst aber keinen Code schreiben.
Muss ich alle Stufen durchlaufen?
Nein. Jede Stufe ist eigenständig nutzbar. Die meisten Familien-Nutzer sind mit Stufe 1 oder 2 komplett zufrieden. KI-Suche ist ein Bonus, kein Muss.
Kann ich später upgraden?
Ja. Deine Daten, Bewertungen und Struktur bleiben bei jedem Upgrade erhalten. Von SQLite auf PostgreSQL zu wechseln ist ein einzelner Befehl. Die User-Datenbank (Bewertungen, Smart Albums) ist immer portabel.
Was passiert, wenn MVX Labs den Betrieb einstellt?
ArchivBlick ist eine Lifetime-Lizenz — du hast die Software. Deine Daten liegen in offenen Formaten (SQLite, PostgreSQL, JPEG). Nichts ist proprietär verschlüsselt, nichts braucht einen Lizenz-Server.
Wie oft muss ich die KI-Analyse wiederholen?
Nur für neue Fotos. Einmal analysierte Bilder behalten ihre Beschreibungen für immer. Wenn du 1.000 neue Urlaubsfotos importierst, analysierst du nur diese — nicht das gesamte Archiv neu.
Funktioniert ArchivBlick auch mit Videos?
Ja. Videos werden über Filmstrips indexiert: ArchivBlick extrahiert Einzelbilder aus dem Video (z. B. alle 30 Sekunden) und analysiert diese. Du kannst in der Galerie über das Video scrubben, ohne es abspielen zu müssen.