Zum Inhalt springen

Was Ihr KI‑Agent wahrnimmt, wenn ein Besucher ein Bild oder eine Datei sendet. Bilder werden visuell analysiert; Dateien werden am Namen erkannt, ihr Inhalt wird nicht gelesen.

Wenn ein Besucher während einer Unterhaltung einen Anhang sendet, behandelt Ihr KI‑Agent Bilder und andere Dateien unterschiedlich. Wer den Unterschied kennt, setzt die richtigen Erwartungen und schreibt bessere Richtlinien.

Wenn ein Besucher ein Foto oder Bild sendet, sieht und analysiert Ihr KI‑Agent den Bildinhalt tatsächlich. Er kann beschreiben, was zu sehen ist, sichtbaren Text auslesen und Fragen dazu beantworten — das Bild wird zusammen mit der Nachricht des Besuchers an das zugrunde liegende, bildfähige Modell übergeben.

Das funktioniert in jedem Tarif und auf jedem Kanal, auf dem ein Besucher ein Bild anhängen kann (Telegram, WhatsApp, Intercom, HubSpot sowie Bilder, die über die Quickchat API übermittelt werden).

Wenn ein Besucher eine Datei sendet, die kein Bild ist — ein PDF, ein Word‑Dokument, eine Tabelle, eine Audio‑ oder Videodatei —, wird Ihrem KI‑Agenten mitgeteilt, dass eine Datei gesendet wurde, sowie deren Dateiname, aber er liest den Inhalt der Datei nicht. Der Agent weiß beispielsweise, dass invoice_2026.pdf eingegangen ist, kann die Datei also bestätigen und sinnvoll reagieren, aber er kann nicht extrahieren oder zusammenfassen, was darin steht.

Die Erkennung eingehender Dateien ist auf diesen Kanälen verfügbar:

KanalBesucher sendet ein BildBesucher sendet eine Datei (PDF, Dokument, …)
TelegramVisuell analysiertNur Dateiname
WhatsAppVisuell analysiertNur Dateiname
IntercomVisuell analysiertNur Dateiname
HubSpotVisuell analysiertNur Dateiname