AI w pracy Office Managera: budowa agenta głosowego — Transcript

Jak zbudować w 15 minut bez kodu głosowego agenta AI dla Office Managera, który odpowiada na pytania pracowników 24/7.

Key Takeaways

  • Można szybko i bez kodowania stworzyć użytecznego agenta AI dla biura.
  • Profesjonalny prompt i twarde dane są kluczowe dla jakości odpowiedzi agenta.
  • Backupowy model LLM zapewnia ciągłość działania i minimalizuje ryzyko awarii.
  • Wielojęzyczność i realistyczny głos zwiększają użyteczność i zaufanie użytkowników.
  • Kontrola limitów rozmów i czasu chroni budżet firmy przed nadmiernymi kosztami.

Summary

  • Prezentacja tworzenia wirtualnego asystenta głosowego dla Office Managera bez pisania kodu w 15 minut.
  • Wykorzystanie platformy ElevenLabs z darmowym planem do testów i wdrożeń wewnętrznych.
  • Przegląd gotowych szablonów agentów i omówienie ich funkcji oraz workflow z drzewami decyzyjnymi.
  • Tworzenie własnego agenta FAQ z profesjonalnym promptem definiującym rolę, ton i zasady działania AI.
  • Wybór realistycznego głosu oraz ustawienie wielojęzyczności (polski i angielski) z automatycznym rozpoznawaniem języka.
  • Konfiguracja modelu LLM Gemini 2.5 Flash jako podstawowego oraz backupowego modelu zapasowego dla stabilności działania.
  • Dodanie dokumentów z firmowymi danymi (np. limity na hotele, diety) do bazy wiedzy agenta.
  • Ustawienie limitów czasowych i ilościowych na rozmowy w celu kontroli kosztów i zapobiegania nadużyciom.
  • Publikacja agenta poprzez widget na intranecie lub link udostępniany na Slacku.
  • Podsumowanie korzyści: automatyzacja powtarzalnych zadań, oszczędność czasu i łatwość wdrożenia.

Full Transcript — Download SRT & Markdown

00:07
Speaker A
Cześć, wyobraźcie sobie sytuację, jesteście Office Managerem, jest koniec miesiąca, skrzynka pęka w szwach od tych samych pytań.
00:15
Speaker A
Jakie są limity na hotel w delegacji, gdzie jest wniosek urlopowy, jak rozliczyć taksówkę? I zamiast po raz setny odsyłać ludzi do tego samego nudnego PDF-a w internecie, dzisiaj zrobimy coś spektakularnego.
00:28
Speaker A
To znaczy, zbudujemy waszego wirtualnego asystenta, który będzie odpowiadał na pytania pracowników 24 godziny na dobę, głosowo lub tekstowo. I uwaga, zrobimy to w 15 minut bez pisania kodu. I tu jedna informacja praktyczna na start.
00:46
Speaker A
Będziemy korzystać z ElevenLabs, który oferuje darmowy plan z kilkunastoma minutami rozmów miesięcznie, co w zupełności wystarczy do testów i pierwszych wdrożeń wewnętrznych, nie trzeba od razu kupować subskrypcji, żeby zobaczyć, czy to rozwiązanie ma sens w waszej firmie.
01:03
Speaker A
Jesteśmy w panelu platformy ElevenLabs, w zakładce Agents. Zanim zbudujemy coś własnego, spójrzcie na te gotowe szablony. Mamy tu agentów do wsparcia klienta, recepcjonistów, a nawet agentów sprzedażowych. I zobaczcie, jak to też wygląda pod maską, to nie jest tylko prosty czat.
01:21
Speaker A
W zakładce Workflow widzimy całe drzewa decyzyjne. Agent może przywitać dzwoniącego, zadać pytanie, a w zależności od odpowiedzi na przykład przełączyć rozmowę do żywego człowieka, wysłać SMS-a albo zapisać dane w naszym CRM-ie za pomocą tak zwanych tools.
01:37
Speaker A
Możliwości są ogromne. My dzisiaj skupimy się na prostej, ale niezwykle przydatnej wersji FAQ. Wracamy, wybieramy plus i klikamy Blank Agent.
01:50
Speaker A
Nazywamy naszego agenta Office Manager. I teraz najważniejszy krok. System Prompt, to tutaj niejako programujemy naszą sztuczną inteligencję, mówiąc jej językiem naturalnym, kim jest i co ma robić.
02:05
Speaker A
Moglibyśmy napisać po prostu: "Jesteś na przykład Olą, Office Managerem." Ale my chcemy profesjonalisty. Wklejamy więc bardziej rozbudowany prompt.
02:15
Speaker A
Ja przygotowałem taki: "Jesteś Olą, wewnętrznym Office Managerem firmy TechFlow. Jesteś bardzo pomocna, cierpliwa, ale stanowcza w kwestii przestrzegania firmowych procedur. Twoim zadaniem jest odpowiadanie na pytania pracowników dotyczące urlopów, rozliczeń, delegacji i benefitów. Jeśli nie znasz odpowiedzi, nie wymyślaj jej, poinstruuj pracownika,
02:36
Speaker A
aby napisał na adres [email protected]. Odpowiadaj zwięźle i konkretnie." Widzicie, dajemy agentowi rolę, ton wypowiedzi i bardzo ważne, tak zwane guardrails, czyli bariery ochronne, ma nie zmyślać, nie halucynować, jeśli czegoś nie wie.
02:56
Speaker A
No i mała wskazówka, jeśli nie wiecie, jak napisać taki prompt, większość tych narzędzi ma opcję Enhance. To taka magiczna różdżka, gdzie AI samo rozbuduje wasze jedno zdanie do profesjonalnego promptu.
03:11
Speaker A
Ustalmy jeszcze pierwszą wiadomość. Na przykład: "Cześć, tu Ola z administracji. W czym mogę ci dzisiaj pomóc?" A skoro to agent, nadajmy mu brzmienie.
03:23
Speaker A
ElevenLabs ma niesamowicie realistyczne głosy. Wybierzemy jeden z nich, który brzmi naturalnie i wzbudza zaufanie.
03:32
Speaker A
"-Cześć, tu mówi Maria. Mój głos jest spokojny i niski. Zapraszam do skorzystania z niego w waszych projektach." No i też kwestia języka. Nasza firma może być międzynarodowa, dlatego w sekcji Language ustalamy domyślny język, na przykład angielski, ale dodajmy też język polski.
03:53
Speaker A
Co nam to daje? Agent sam rozpozna, w jakim języku odezwał się do niego pracownik i płynnie w ułamku sekundy przełączy się na polski lub angielski.
04:03
Speaker A
Jest to genialne w swojej prostocie. I ważna uwaga dla tych z was, którzy nie chcą infolinii głosowej. W zaawansowanych ustawieniach możecie włączyć tryb czatu tekstowego.
04:13
Speaker A
Wtedy wasza Ola będzie klasycznym, bardzo mądrym chatbotem na firmowym Slacku czy intranecie. I teraz przechodzimy do serca naszego agenta, czyli z sekcji LLM.
04:26
Speaker A
Domyślnie ustawiony jest tu model Gemini 2.5 Flash. Dlaczego? Jako Prototype Managerowie musimy patrzeć na trzy rzeczy. Koszty, latencje i bardzo ważne, cel użycia.
04:40
Speaker A
Do agenta FAQ nie potrzebujemy modelu premium. Użytkownicy pytają o limit diet i zasady urlopowe.
04:47
Speaker A
Zależy nam na szybkości i precyzji, nie na maksymalnej naturalności odpowiedzi. Gemini Flash czy Gemini Flash-Lite jest bardzo tani, niezwykle szybki i do prostego odpowiadania z bazy wiedzy nadaje się idealnie. Gdybyśmy budowali agenta sprzedażowego lub onboardingowego, gdzie ton rozmowy buduje relacje, myślę,
05:08
Speaker A
że rozważylibyśmy mocniejszy model, tu nie musimy. Gdy zadzwonicie do agenta, odpowiedź musi paść natychmiast.
05:16
Speaker A
Przecież nikt nie lubi ciszy w słuchawce. W świecie IT rzeczy czasem przestają działać. Serwery głównego modelu mogą być przeciążone.
05:25
Speaker A
Dlatego koniecznie ustawiamy Backup LLM, czyli model zapasowy, tak zwany fallback. Wybieramy z listy inny model, na przykład jeden z własnych ultraszybkich modeli ElevenLabs, Claude'a czy GPT. I zwróćcie teraz uwagę na kolumnę z opóźnieniem w milisekundach. Im niższa wartość,
05:43
Speaker A
tym szybciej agent zareaguje. Ustawienie fallbacku to gwarancja, że wasi pracownicy nigdy nie usłyszą: "Przepraszam, mam awarię." Ale prompt to za mało. Nasza Ola musi znać twarde dane.
05:59
Speaker A
I tu przechodzimy do Knowledge Base. Klikam Add Document i wgrywam plik tekstowy. To jest zwykły plik z limitami na hotele, dietami i zasadami zwrotu w naszej firmie.
06:12
Speaker A
Nic nie muszę formatować, po prostu wrzucam dokument. I od tej sekundy agent potrafi czytać ze zrozumieniem i przeszukiwać ten plik w ułamku sekundy, gdy tylko padnie pytanie.
06:29
Speaker A
"-Cześć, tu Ola z administracji. W czym mogę ci dzisiaj pomóc? -Cześć Ola, byłem w Bostonie na pięciodniowej konferencji.
06:38
Speaker A
Ile maksymalnie przysługuje mi zwrotu za nocleg na jeden dzień? -Cześć. W Bostonie maksymalna stawka za nocleg, która podlega zwrotowi, to 275 dolarów za noc. Pamiętaj, że musisz przedstawić oryginalne rachunki za wszystkie wydatki powyżej 25 dolarów.
06:59
Speaker A
-Dobrze, to w takim razie łącznie ile mogę otrzymać zwrotu? -Maksymalny zwrot za nocleg w Bostonie to 275 dolarów za noc.
07:10
Speaker A
Jeśli byłeś tam przez 5 dni, to łącznie możesz otrzymać zwrot w wysokości 1375 dolarów za noclegi. Pamiętaj, aby dołączyć wszystkie wymagane dokumenty.
07:22
Speaker A
-Super, bardzo ci dziękuję." I spójrzcie, agent wyciągnął limit dla konkretnego miasta z naszego pliku, dokonał nawet poprawnego mnożenia i grzecznie, ale stanowczo poinformował mnie o przepisach, bez nerwów i bez waszego udziału.
07:40
Speaker A
Zanim to jednak opublikujemy, musimy zachować się jak odpowiedzialni menadżerowie operacyjni. Modele AI kosztują, a rozmowy głosowe generują zużycie.
07:49
Speaker A
Nie chcemy, żeby ktoś z firmy dzwonił do agenta i przez godzinę testował jego poczucie humoru na nasz koszt.
07:55
Speaker A
Przechodzimy do zakładki Advanced i znajdziemy tu pierwszą kluczową opcję. Max Conversation Duration. Ustawiam na przykład na 600 sekund, czyli 10 minut.
08:07
Speaker A
Jeśli sprawa jest tak skomplikowana, że trwa dłużej, pracownik i tak powinien napisać maila do żywego człowieka.
08:14
Speaker A
Następnie w zakładce Security wybieramy Daily Call Limit, czyli ograniczam liczbę konwersacji na dzień, na przykład do 100.
08:25
Speaker A
Dzięki tym dwóm prostym opcjom chronicie swój budżet operacyjny. I gotowe. Klikamy Publish. Jak to wdrożyć? Macie dwie drogi.
08:35
Speaker A
W zakładce Widgets otrzymujecie gotowy kod. Możecie go skopiować, wrzucić na stronę firmowego intranetu, SharePointa czy Notion i po prawej stronie na dole pojawi się dymek czatu rozmowy. Jeśli nie chcecie niczego osadzać, ElevenLabs daje wam po prostu shareable link,
08:52
Speaker A
który kopiujecie, przypinacie go na firmowym kanale Slack w sekcji FAQ, HR i gotowe. Podsumujmy więc.
09:01
Speaker A
W około kilkanaście minut, korzystając z języka polskiego jako naszego kodu, stworzyliśmy dwujęzycznego, inteligentnego agenta. Zabezpieczyliśmy go zapasowym modelem LLM, nałożyliśmy limity kosztowe i nakarmiliśmy twardymi, firmowymi danymi. Właśnie więc zautomatyzowaliście przynajmniej kilkanaście godzin powtarzanej pracy w miesiącu.
09:23
Speaker A
Jesteście więc Prototype Managerami, tak więc zalogujcie się, wgrajcie swój regulamin, zbudujcie własną Olę z administracji jeszcze dzisiaj. Dzięki za uwagę.
Topics:Office Manageragent głosowyAI w pracyElevenLabswirtualny asystentprompt AILLM Geminiautomatyzacja biuraFAQ AIbudowa agenta bez kodu

Frequently Asked Questions

Jakie narzędzie jest używane do tworzenia agenta głosowego w tym filmie?

W filmie wykorzystano platformę ElevenLabs, która oferuje darmowy plan z kilkunastoma minutami rozmów miesięcznie oraz funkcje tworzenia agentów głosowych i tekstowych.

Czy do stworzenia agenta potrzebna jest znajomość programowania?

Nie, cały proces tworzenia agenta odbywa się bez pisania kodu, korzystając z gotowych szablonów i prostych ustawień w panelu ElevenLabs.

Jak agent radzi sobie z pytaniami, na które nie zna odpowiedzi?

Agent ma ustawione tzw. guardrails, które zapobiegają wymyślaniu odpowiedzi; w takich sytuacjach instruuje pracownika, aby napisał maila na wskazany adres HR.

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

Or transcribe another YouTube video here →