268.000 Dateien aus 20 Jahren, verteilt auf Festplatten, iCloud, SharePoint und NAS — das ist die Ausgangslage, aus der ArchivBlick entstanden ist. Dieser Artikel rechnet ehrlich hoch, was der Aufbau eines persönlichen Bildarchivs kostet: an Zeit, an Speicher, an Nerven. Die gute Nachricht: Mit dem richtigen Werkzeug ist das Projekt in Wochen machbar, nicht in Jahren.
Die Ausgangslage: Chaos ist der Normalzustand
Wer über mehrere Jahre hinweg fotografiert, filmt und Fotos von verschiedenen Geräten importiert, landet unweigerlich in derselben Situation: Fotos auf dem Handy, auf der alten Festplatte im Schrank, in der iCloud, auf dem NAS, auf einer externen Backup-Platte — und niemand weiß mehr genau, was wo liegt, was doppelt vorhanden ist und was vielleicht verloren gegangen ist.
Marco Fuhrmann, der Entwickler von ArchivBlick, hat dieses Problem in seiner reinsten Form erlebt: 268.000 Dateien aus 20 Jahren, verteilt auf mindestens sechs verschiedene Speicherorte. Dieser Artikel nutzt diese reale Ausgangslage als Referenz und rechnet hoch, was der Weg vom Chaos zum durchsuchbaren Archiv für verschiedene Archivgrößen bedeutet.
Phase 1: Inventur und Konsolidierung
Bevor irgendetwas analysiert oder durchsucht werden kann, muss klar sein, was überhaupt vorhanden ist. Das klingt trivial — ist es aber nicht. Typischerweise liegen Fotos auf mehreren Festplatten, die über Jahre angesammelt wurden, auf dem Handy, in der Cloud und vielleicht noch auf alten DVDs oder CDs. Jede dieser Quellen hat ihre eigene Ordnerstruktur, ihre eigenen Dateinamen-Konventionen und ihren eigenen Grad an Metadaten-Vollständigkeit.
Der erste Schritt ist die physische Konsolidierung: Alle Festplatten anschließen, alle Cloud-Dienste exportieren, alles auf ein zentrales Laufwerk kopieren. Klingt einfach — aber wer schon einmal versucht hat, 50.000 Fotos von iCloud zu exportieren, weiß, dass das allein mehrere Stunden dauern kann. iCloud exportiert in Batches, Apple Photos muss geöffnet bleiben, und bei schlechter Internetverbindung bricht der Export ab.
- →iCloud-Export: Apple begrenzt den Export auf 1.000 Fotos pro Batch. Bei 50.000 Fotos sind das 50 manuelle Exportvorgänge — oder ein Skript, das das automatisiert.
- →Duplikate durch mehrfache Importe: Wer Fotos vom Handy sowohl in iCloud als auch manuell auf die Festplatte kopiert hat, hat dieselben Dateien doppelt — manchmal mit unterschiedlichen Dateinamen.
- →Externe Festplatten mit Fehlern: Alte Festplatten haben oft fehlerhafte Sektoren. Ein vollständiges Auslesen kann deutlich länger dauern als erwartet, und manche Dateien sind schlicht nicht mehr lesbar.
| Archivgröße | Manuell | Mit ArchivBlick | Speicher (Metadaten) |
|---|---|---|---|
| 10.000 Dateien | 1–2 Tage | 2–4 Stunden | ~200–300 MB |
| 50.000 Dateien | 1–2 Wochen | 1–2 Tage | ~1–1,5 GB |
| 250.000 Dateien | 2–3 Monate | 2–4 Wochen | ~5–7 GB |
Phase 2: Dateiorganisation und Ordnerstruktur
Sobald alle Dateien an einem Ort sind, beginnt die eigentliche Arbeit: Umbenennen, Sortieren, Metadaten korrigieren. Wer Fotos vom Handy importiert, hat Dateinamen wie IMG_20190814_143022.jpg — das ist noch gut. Wer alte Scans hat, findet Dateien wie scan001.jpg oder schlicht DSC00001.jpg, das auf zehn verschiedenen Kameras gleichzeitig der Startpunkt war.
Ein unterschätzter Zeitfresser
Wer mit mehreren Geräten in verschiedenen Zeitzonen fotografiert, hat ein Problem: Die Kamera speichert die lokale Zeit, aber ohne explizite Zeitzone. Ein Foto, das um 14:00 Uhr in New York aufgenommen wurde, kann in der Datenbank als 14:00 Uhr UTC erscheinen — und liegt damit sechs Stunden falsch. Bei 50.000 Fotos aus mehreren Urlauben ist die manuelle Korrektur ein Projekt für sich.
| Archivgröße | Zeitaufwand | Hauptproblem |
|---|---|---|
| 10.000 Dateien | 1–2 Tage | Inkonsistente Metadaten |
| 50.000 Dateien | ~1 Woche | Duplikate, Zeitzonenfehler |
| 250.000 Dateien | 2–4 Wochen | Skalierung, RAW-Handling |
Phase 3: Thumbnail-Generierung
Thumbnails sind das erste, was ein Nutzer sieht — und das letzte, worüber er nachdenkt. Dabei ist ihre Generierung einer der zeitintensivsten Schritte im gesamten Prozess. ArchivBlick erstellt für jede Datei vier Thumbnail-Größen: 80 Pixel (Miniatur), 176 Pixel (Kompakt), 360 Pixel (Galerie-Grid) und 800 Pixel (Lightbox). Das sind vier Bildoperationen pro Datei, multipliziert mit der Archivgröße.
Auf einem MacBook M2 dauert die Verarbeitung einer Datei (alle vier Größen) zwischen 0,15 und 0,3 Sekunden. Bei 250.000 Dateien summiert sich das auf 10 bis 21 Stunden reiner Rechenzeit. Das Ergebnis ist eine Thumbnail-Datenbank von 4,1 GB für 210.000 Dateien — etwa 20 KB pro Datei für alle vier Größen zusammen.
| Archivgröße | MacBook M2 | Mac mini M4 | Speicher Thumbs |
|---|---|---|---|
| 10.000 Dateien | 0,5–1 Stunde | ~30–45 Min. | ~200 MB |
| 50.000 Dateien | 2–4 Stunden | 1,5–3 Stunden | ~1 GB |
| 250.000 Dateien | 10–21 Stunden | 7–14 Stunden | ~5 GB |
Phase 4: KI-Bildbeschreibungen — das Herzstück
Hier liegt der fundamentale Unterschied zwischen ArchivBlick und jedem anderen Foto-Tool: Jede Datei bekommt eine vollständige, natürlichsprachliche Beschreibung. Kein Tag, kein Stichwort — eine echte Beschreibung dessen, was auf dem Bild oder im Video zu sehen ist. Das macht die Suche nach "Motorrad Alpen Drohne Sommer" möglich, auch wenn diese Wörter nirgendwo im Dateinamen oder in den Metadaten stehen.
Das Modell, das ArchivBlick dafür einsetzt, ist Qwen2.5-VL mit 32 Milliarden Parametern. Es läuft vollständig lokal — kein Cloud-Upload, keine API-Kosten, keine Datenschutzprobleme. Auf einem Mac mini M4 analysiert das Modell etwa 840 Bilder pro Stunde. Die reale Referenz aus dem Projekt: 150.000 Dateien wurden in einer Woche analysiert.
- 10.000 Dateien~12 Stunden (über Nacht)
- 50.000 Dateien~2,5 Tage (Wochenende)
- 150.000 Dateien~1 Woche (Dauerbetrieb)
- 250.000 Dateien~12–13 Tage
- 250.000 Dateien auf GPU (RTX 3090)~2,5 Tage
Der Stromverbrauch ist dabei überschaubar: Ein Mac mini M4 verbraucht unter Last etwa 65 Watt. Eine Woche Dauerbetrieb kostet bei einem deutschen Strompreis von 0,35 €/kWh etwa 3,85 Euro. Das ist der Preis für 150.000 KI-Bildbeschreibungen — einmalig, lokal, ohne Abo.
Phase 5: Filmstrips für Videos
Videos sind ein Sonderfall. ArchivBlick extrahiert aus jedem Video einen Frame alle 30 Sekunden und speichert diese als Sprite-Bild — ein einzelnes JPEG, das alle Frames in einem Raster enthält. Das ermöglicht das visuelle Durchblättern eines Videos, ohne es zu öffnen. Die Generierung läuft über FFmpeg und ist GPU-beschleunigt. Ein fünfminütiges GoPro-Video braucht auf einer modernen GPU etwa 1 bis 5 Sekunden.
| Video-Anzahl | GPU (RTX 3090) | CPU (M2 MacBook) | Speicherbedarf |
|---|---|---|---|
| 1.000 Videos | 1–3 Stunden | 5–15 Stunden | ~500 MB |
| 5.000 Videos | 5–15 Stunden | 1–3 Tage | ~2,5 GB |
| 20.000 Videos | 3–14 Tage | 1–3 Wochen | ~10 GB |
Phase 6: Datenbankaufbau und semantische Indexierung
Sobald alle Beschreibungen vorliegen, werden sie in Vektoren umgewandelt — mathematische Repräsentationen des Bedeutungsgehalts. Das Modell dafür ist BGE-M3, das 1024-dimensionale Embeddings erzeugt. Jeder Vektor belegt etwa 4 KB Speicher. Für 250.000 Dateien sind das rund 1 GB nur für die Embeddings — dazu kommt der HNSW-Index, der die schnelle Ähnlichkeitssuche ermöglicht und etwa das 2- bis 4-fache der Embedding-Größe belegt.
Die Embedding-Generierung läuft auf dem Mac mini mit etwa 890 Dateien pro Stunde. Für 250.000 Dateien bedeutet das etwa 11 Tage — aber auch dieser Prozess läuft vollständig im Hintergrund.
| Archivgröße | Zeitaufwand | Speicher (Embeddings + Index) |
|---|---|---|
| 10.000 Dateien | 1–2 Tage | ~80–160 MB |
| 50.000 Dateien | 3–7 Tage | ~400–800 MB |
| 250.000 Dateien | 2–4 Wochen | ~2–4 GB |
Phase 7: Laufender Wartungsaufwand
Ein Archiv ist kein statisches Projekt — es wächst. Wer jeden Monat 1.000 neue Fotos macht, muss diese regelmäßig einpflegen. Manuell bedeutet das: Importieren, Sortieren, Taggen, Duplikate entfernen — etwa 16 bis 33 Stunden pro Monat. Mit ArchivBlick reduziert sich dieser Aufwand auf 2 bis 4 Stunden monatlich, hauptsächlich für die Überprüfung der KI-Beschreibungen und das Einpflegen neuer Quellen.
Pflicht, keine Option
Drei Kopien der Daten, auf zwei verschiedenen Medien, davon eine außerhalb des Hauses. Für ein Archiv mit 250.000 Dateien bedeutet das mindestens zwei externe Festplatten (je 4–8 TB, Kosten: 80–150 €) und einen Cloud-Backup-Dienst für die Rohdaten — nicht für die Thumbnails oder die Datenbank, die sich jederzeit neu generieren lassen.
Die ehrliche Gesamtrechnung
Wer ein Archiv von Grund auf aufbaut, sollte mit folgenden Gesamtzeiten rechnen — aufgeteilt in aktive Zeit (du musst dabei sein) und passive Zeit (der Computer arbeitet, du nicht):
| Archivgröße | Aktive Zeit | Passive Zeit (Rechner läuft) | Speicher gesamt |
|---|---|---|---|
| 10.000 Dateien | 1–2 Tage | 1–2 Tage | ~5–8 GB |
| 50.000 Dateien | 3–5 Tage | 1–2 Wochen | ~25–40 GB |
| 150.000 Dateien | 1–2 Wochen | 3–4 Wochen | ~75–120 GB |
| 268.000 Dateien (Referenz) | 2–3 Wochen | 5–8 Wochen | ~130–200 GB |
- →Hardware: Mac mini M4 (~800 €) oder vorhandener Mac. Für Videos empfiehlt sich ein GPU-Server für die initiale Filmstrip-Generierung.
- →Speicher: Externe Festplatte für die Rohdaten (4–8 TB, 80–150 €) + SSD für die Datenbank (1–2 TB, 80–120 €).
- →Zeit: 2–3 Wochen aktive Arbeit für ein großes Archiv. Die passive Zeit läuft parallel.
- →Software: ArchivBlick (Lifetime-Lizenz) + PostgreSQL (kostenlos) + FFmpeg (kostenlos).
Ein Wochenend-Projekt — mit einem Monat Nachlauf
Die aktive Arbeit — Festplatten anschließen, Dateien konsolidieren, ArchivBlick einrichten — ist an einem langen Wochenende erledigt. Der Rest ist Geduld: Der Mac mini analysiert, generiert Thumbnails und baut die Datenbank auf, während du deinen normalen Alltag lebst. Nach vier bis acht Wochen hast du ein vollständig durchsuchbares Archiv — für immer, ohne monatliche Kosten, ohne Cloud-Abhängigkeit.
Marco Fuhrmann
Hat diesen Prozess mit 268.000 Dateien aus 20 Jahren selbst durchlaufen — und daraus ArchivBlick gebaut. Die Zahlen in diesem Artikel sind keine Schätzungen aus dem Lehrbuch, sondern Messwerte aus dem echten Betrieb.