Was Vision-KI heute kann — und was nicht
Moderne Vision-Modelle wie GPT-4o oder Claude 4 können aus einem Produktfoto bemerkenswert viele Informationen extrahieren:
- Objekterkennung: Was ist das für ein Artikel — ein Pullover, eine Uhr, ein Sofa?
- Marken-/Modell-Indikatoren: Logos, typische Designmerkmale, Material-Eigenschaften.
- Zustand: Gebrauchsspuren, Flecken, Vollständigkeit (fehlt etwas?).
- Größen-Hinweise: bei Kleidung aus Label oder Proportionen, bei Möbeln aus Kontext.
- Stimmung und Stil: „Vintage“, „minimalistisch“, „Retro“ — hilft für Käufer-Ansprache.
Was Vision-KI nicht kann:
- Exakte Maße ohne Referenzobjekt im Bild
- Materialprüfung jenseits offensichtlicher Unterschiede
- Originalität verifizieren (ist das Designerstück echt oder Fälschung?)
- Gebrauchsdauer erkennen (wie lange wurde der Artikel benutzt?)
Der richtige Einsatz: KI ist Start, nicht Endprodukt
Die sinnvollste Nutzung: Die KI liefert einen 80-%-Entwurf, den du in 2 Minuten finalisierst. Die 20 %, die fehlen, sind deine persönliche Expertise — Herkunft, Verkaufsgrund, ehrlicher Zustand.
Wer KI-Output ungeprüft veröffentlicht, liefert oft zu positive Beschreibungen, falsche Modell-Namen oder fehlende Größen-Angaben. Das führt zu Käufer-Frust und Retouren.
Schritt-für-Schritt: Beschreibung aus Foto generieren
1. Mehrere gute Fotos machen
Nicht nur ein Foto hochladen — 3–5 aus verschiedenen Winkeln:
- Gesamtansicht (Vorderseite)
- Detail-Aufnahme (Material, Verarbeitung)
- Mögliche Mängel (Flecken, Kratzer)
- Größen-Label / Preisschild wenn vorhanden
- Innenansicht (bei Taschen, Schuhen)
Je mehr Kontext du lieferst, desto präziser die KI-Antwort.
2. Strukturierter Prompt
Generischer Prompt: „Beschreib dieses Foto.“ Besserer Prompt:
Ich möchte diesen Artikel auf einem Marktplatz anbieten.
Bitte analysiere die Fotos und liefere:
1. Wahrscheinliche Marke und Modell (mit Unsicherheits-Angabe)
2. Material (soweit erkennbar)
3. Zustand objektiv (gut / sehr gut / akzeptabel)
4. Besonderheiten oder Auffälligkeiten
5. Vorgeschlagene Anzeigenbeschreibung (4-6 Sätze, nüchtern,
keine Superlative, ehrlicher Zustand)
6. 3 Vorschläge für einen Titel nach der Formel
[Marke] [Typ] [Eigenschaft] [Zusatz]
Wenn du bei etwas unsicher bist, sag es explizit.
3. Output prüfen und korrigieren
Die KI-Antwort immer gegenlesen. Typische Korrekturen:
- Marke falsch erkannt: manchmal verwechselt ChatGPT ähnlich gestaltete Marken.
- Modell geraten: bei Sneakern oft sehr gut, bei Uhren oft unzuverlässig.
- Zustand zu positiv: KI tendiert dazu, defekte optimistisch zu bewerten.
- Größe fehlt: wenn kein Label im Bild ist, kann die KI nur raten.
4. Persönliche Note hinzufügen
KI-Texte klingen oft neutral. Ein persönlicher Satz („Habe ihn 2 Jahre getragen, jetzt Kleiderschrank-Cleanup“) macht die Anzeige vertrauenswürdiger und erhöht den Klick auf „Kaufen“ messbar.
Welche Marktplätze erlauben KI-Generierte Anzeigen?
Generell: Die meisten Marktplätze (Kleinanzeigen, Vinted, eBay) haben keine explizite Regel gegen KI-Texte — aber alle verlangen Wahrheit und Vollständigkeit. Wenn deine KI-Beschreibung einen Defekt übersieht, den ein Käufer dann bemängelt, haftest du — nicht die KI.
Wichtig: KI darf keine Fakten erfinden. Modellnummer, Material, Herkunftsjahr — wenn du es nicht sicher weißt, schreib „vermutlich“ oder lass weg. Eine KI-Beschreibung ist juristisch deine eigene Anzeige, mit allen Pflichten.
Plattformen mit nativer Foto-zu-Text-Funktion
Einige Marktplätze haben inzwischen eigene KI-Funktionen integriert — sie bieten eine Beschreibungs-Generierung direkt beim Einstellen einer Anzeige. Das ist convenient, aber nicht immer die beste Qualität, weil die Modelle oft kleiner und schlechter als ChatGPT oder Claude sind.
Reseller-Tools wie das AnzeigenPilot-Tool gehen einen Schritt weiter: Sie kombinieren Vision-KI-Generierung mit deinem persönlichen Stil und können Beschreibungen für mehrere Plattformen gleichzeitig anpassen (Vinted kürzer, Kleinanzeigen detaillierter).
Grenzen: Wann Foto-zu-Text nicht reicht
Bei diesen Artikel-Typen ist KI-Generierung oft unzureichend:
- Vintage und Sammlerstücke: Die Geschichte und Provenienz lassen sich nicht aus einem Foto ableiten. Hier braucht es deine Recherche.
- Designer-Einzelstücke: Echtheit und Seltenheit sind für Käufer zentral und müssen manuell recherchiert werden.
- Technische Geräte mit Funktions-Test: Ob ein Kopfhörer funktioniert, sagt dir kein Foto. Hinweis auf getesteten Zustand musst du selbst schreiben.
Workflow-Beispiel: 10 Artikel in 30 Minuten
Mit KI-Unterstützung kannst du in 30 Minuten einen Bestand von 10 Artikeln vollständig beschreiben:
- Fotos machen (alle 10 Artikel am Stück, 3–5 Fotos pro Artikel): 15 Min
- KI-Beschreibungen generieren: 2 Min pro Artikel = 20 Min
- Jede Beschreibung prüfen und ergänzen: 1 Min pro Artikel = 10 Min
Summe: 45 Min für 10 Beschreibungen. Manuell: 90–120 Min. Zeitersparnis: 50 %.
Für den Workflow über direkten Chat-Zugriff auf dein Inventar siehe Kleinanzeigen mit ChatGPT erstellen (MCP) — dort lässt sich der ganze Prozess in einen Chat-Dialog verkürzen.
Prompt-Vorlage zum Kopieren
Analysiere die angehängten Fotos dieses Artikels und erstelle:
1) Eine objektive Zustandsbeschreibung (3-5 Punkte)
2) Eine 5-Satz-Verkaufsbeschreibung, die:
- faktisch bleibt (keine Superlative)
- Größe/Maße nennt, wenn erkennbar
- den Zustand ehrlich beschreibt
- einen persönlichen Satz enthält
(Grund, warum zu verkaufen / typischer Träger)
3) Drei Titel-Varianten (je max. 65 Zeichen) nach der Formel
Marke + Typ + wichtigste Eigenschaft + Zusatz
Markiere alles, bei dem du dir unsicher bist.
Fazit
Foto zu Anzeigenbeschreibung ist 2026 eine der nützlichsten KI-Anwendungen für Reseller. Einzelne Anzeigen gehen damit 50 % schneller von Foto bis online. Qualität erreicht das Ergebnis nur, wenn du die KI strukturiert briefst und gegenliest.
KI ist der Entwurfs-Assistent, du bist weiterhin der Verantwortliche für die Anzeige. Diese Rolle zu verinnerlichen, verhindert die häufigsten Fehler: zu positive Beschreibungen und falsche Modell-Namen.
Häufige Fragen — Foto zu Anzeigenbeschreibung
Welches KI-Modell liefert die besten Beschreibungen aus Fotos?
Aktuell (2026) liefern Claude 4.x und GPT-4o/5 sehr vergleichbare Ergebnisse. Claude neigt zu präziseren Material-Aussagen, ChatGPT zu stärker marketingorientierten Formulierungen. Teste beide, wähle das Modell, das zu deinem Stil passt.
Sind KI-generierte Beschreibungen rechtlich sicher?
Ja, solange sie wahr sind. Der Verkäufer ist rechtlich verantwortlich — die KI ist ein Hilfsmittel. Falsche Angaben (auch unbeabsichtigt) können zu Rückabwicklungen und Ersatzansprüchen führen.
Wie viele Fotos soll ich hochladen, um gute Beschreibungen zu bekommen?
Drei bis fünf aus verschiedenen Winkeln. Ein einzelnes Foto lässt die KI raten, was bei Details zu Fehlern führt. Mehr als 5 Fotos verwirren manche Modelle eher, als dass sie helfen.
Kann die KI mir auch einen Preis vorschlagen?
Nur eingeschränkt — die KI kennt aktuelle Markt-Preise nicht in Echtzeit. Für Preisvorschläge brauchst du echte Preis-Daten-Quellen (ähnliche Anzeigen auf derselben Plattform, Marktpreis-Tools). Siehe unseren Beitrag „Anzeigen mit KI erstellen (MCP)“ für Tools mit integriertem Marktpreis-Check.
Funktioniert das auch offline oder ist Cloud-KI nötig?
Praktikable Qualität gibt es aktuell nur mit Cloud-Modellen. Lokale Vision-Modelle (Llama 3 Vision, Qwen-VL) sind brauchbar für einfache Artikel, aber bei detaillierter Produktanalyse noch hinter den großen Cloud-Modellen.
Kann ich die KI-Beschreibung automatisch auf mehreren Plattformen ausspielen?
Ja, Reseller-Tools mit Cross-Plattform-Funktion nutzen die einmal generierte Beschreibung für alle verbundenen Plattformen. Manche Tools passen die Länge automatisch an (Vinted kürzer, Kleinanzeigen länger).
