Przejdź do głównej zawartości

Co Twój Agent AI dostrzega, gdy odwiedzający wyśle obraz lub plik. Obrazy są analizowane wizualnie; pliki są rozpoznawane po nazwie, a ich zawartość nie jest odczytywana.

Gdy odwiedzający wyśle załącznik podczas rozmowy, Twój Agent AI inaczej traktuje obrazy, a inaczej pozostałe pliki. Znajomość tej różnicy pomaga ustawić właściwe oczekiwania i pisać lepsze Wytyczne.

Gdy odwiedzający wyśle zdjęcie lub obraz, Twój Agent AI faktycznie widzi i analizuje zawartość obrazu. Potrafi opisać, co przedstawia, odczytać widoczny na nim tekst i odpowiadać na pytania na jego temat — obraz jest przekazywany do bazowego modelu obsługującego obrazy wraz z wiadomością odwiedzającego.

Działa to w każdym planie i na każdym kanale, na którym odwiedzający może dołączyć obraz (Telegram, WhatsApp, Intercom, HubSpot oraz obrazy przekazywane przez API Quickchat).

Gdy odwiedzający wyśle plik, który nie jest obrazem — PDF, dokument Word, arkusz kalkulacyjny, plik audio lub wideo — Twój Agent AI otrzymuje informację, że wysłano plik, oraz jego nazwę, ale nie odczytuje zawartości pliku. Agent wie na przykład, że dotarł invoice_2026.pdf, więc może potwierdzić plik i sensownie zareagować, ale nie potrafi wyodrębnić ani streścić tego, co jest w środku.

Rozpoznawanie przychodzących plików jest dostępne na tych kanałach:

KanałOdwiedzający wysyła obrazOdwiedzający wysyła plik (PDF, dokument, …)
TelegramAnalizowany wizualnieTylko nazwa
WhatsAppAnalizowany wizualnieTylko nazwa
IntercomAnalizowany wizualnieTylko nazwa
HubSpotAnalizowany wizualnieTylko nazwa