Przejdź do treści
Intum Dev

AI recepcjonistka głosowa — przypadek warsztatu samochodowego

Aktualizacja: 3 min czytania

O co chodzi

Programistka zbudowała AI recepcjonistkę głosową dla warsztatu samochodowego swojego brata. Warsztat tracił tysiące dolarów miesięcznie przez nieodebrane telefony — ponad 100 tygodniowo. System o nazwie Axle odbiera połączenia 24/7, odpowiada na pytania o ceny, godziny pracy i dostępne usługi.

Jak to działa

  1. Klient dzwoni na numer warsztatu
  2. System zamienia mowę na tekst (speech-to-text)
  3. Pytanie trafia do bazy wiedzy warsztatu — system wyszukuje odpowiednie informacje (RAG)
  4. Model AI generuje odpowiedź wyłącznie na podstawie prawdziwych danych warsztatu
  5. Odpowiedź jest czytana klientowi naturalnym głosem (text-to-speech)
  6. Gdy system nie zna odpowiedzi — zbiera dane do oddzwonienia

Użyte technologie

  • Vapi — platforma do obsługi połączeń głosowych
  • Deepgram — zamiana mowy na tekst
  • ElevenLabs — zamiana tekstu na mowę (naturalny głos)
  • Claude (Anthropic) — model AI generujący odpowiedzi
  • MongoDB Atlas Vector Search — wyszukiwanie w bazie wiedzy (wektory)
  • Voyage AI — tworzenie embeddingów (wektorów) z dokumentów
  • FastAPI (Python) — backend łączący wszystkie elementy

Co się sprawdziło

  • Odpowiedzi oparte na prawdziwych danych warsztatu, nie na “wiedzy ogólnej” modelu
  • Eskalacja do człowieka gdy AI nie zna odpowiedzi
  • Krótkie, naturalne odpowiedzi (2-4 zdania) — dostosowane do rozmowy głosowej

Uwagi użytkowników Hacker News

Dyskusja na HN była dość sceptyczna. Kilka najciekawszych wątków:

Wycena i ceny

Były recepcjonista z warsztatu zauważył, że AI nie ogarnie dynamicznych cen części zamiennych, dostępności materiałów u dostawców i zmiennych kosztów robocizny. Podanie klientowi złej ceny psuje reputację warsztatu — klient zapamięta kwotę od bota i będzie się na nią powoływał.

Niestandardowe naprawy

AI potrafi odpowiadać tylko na tematy, które ma w bazie wiedzy. Przy niestandardowych naprawach (a tych w warsztacie jest sporo) nie oszacuje kosztu ani czasu — bo to wymaga doświadczenia mechanika, nie wyszukiwania w dokumentach.

Dlaczego nie zatrudnić człowieka?

Kilka osób zadało fundamentalne pytanie: skoro warsztat traci tysiące dolarów miesięcznie przez nieodebrane telefony, to recepcjonistka za 3-4 tys. dolarów miesięcznie zwróci się natychmiast. Człowiek lepiej wyczuje kontekst, zbuduje relację z klientem i poradzi sobie z nietypowymi sytuacjami.

Outsourcing vs. budowanie od zera

Wskazano na istniejące usługi outsourcingowych recepcjonistek telefonicznych (150-500$/mies.) — specjalizujące się nawet w branży motoryzacyjnej. Tańsze, prostsze, sprawdzone.

Bot vs. poczta głosowa

Ciekawy punkt: na poczcie głosowej klient nagra wiadomość i czeka na oddzwonienie. Rozmawiając z botem może się sfrustrować i się rozłączyć — strata kontaktu, którą poczta głosowa by uratowała.

Ton głosu to najtrudniejsza część

Sama autorka przyznała, że najtrudniejsze nie było poskładanie technologii, ale dopracowanie naturalnego brzmienia. Krótkie zdania, odpowiedni głos, brak markdowna w odpowiedziach — to zajęło najwięcej czasu.

Pozytywne głosy

Część dyskutujących doceniła dostępność 24/7, brak czekania na linii i możliwość natychmiastowej obsługi prostych pytań (godziny otwarcia, lokalizacja, status naprawy). Jako pierwsza linia kontaktu — zanim klient trafi do człowieka — ma sens.

Intum jako alternatywa

Podobny efekt — AI odpowiadające na pytania klientów na podstawie bazy wiedzy — można uzyskać w Intum bez budowania własnego systemu od zera. Moduł Helpdesk z AI korzysta z bazy wiedzy i modelu Claude do automatycznych odpowiedzi na widgecie czatowym. Zamiast składać kilka zewnętrznych serwisów, wystarczy uzupełnić bazę wiedzy i włączyć AI w ustawieniach helpdesku.

Źródła

Czy ten wpis był pomocny?

Udostępnij

Komentarze