BIZNES

Dawid Wójcicki (Voicetel): Zależy nam na swobodnej komunikacji człowieka z robotem

Smart speech to rozwiązanie polegające na rozpoznawaniu ludzkiej mowy wraz ze zrozumieniem jej sensu. Dzięki rozumieniu całych zdań i nieliniowej analizie wypowiedzi komputer jest w stanie poprawnie zareagować. Dostępne na rynku rozwiązania firm Microsoft, Amazon, Google czy Apple bazują głównie na porozumiewaniu się językiem komend. Brilliance – jest więc w tym wypadku bardziej zaawansowana. Opowie o tym nasz gość Dawid Wójcicki z firmy Voicetel.

Karol Bancerz: Ostatnio rozmawialiśmy o technologiach automatyzujących obsługę klienta, mówiliśmy o komendach głosowych. Chciałbym powrócić do tego tematu i porozmawiać z Tobą na temat technologii Smart speech. Czym to właściwie jest i czym Brilliance różni się od pozostałych technologii dostępnych na rynku?

Dawid Wójcicki: Ogólnie podział przebiega wzdłuż linii dialog — komendy głosowe. Po jednej stronie mamy systemy, które reagują na bardzo określone frazy, a po drugiej systemy, które przypominają systemy dialogowe.

Najbardziej znanymi systemami reagującymi na komendy głosowe są OK Google, Cortana, czy Siri. Są to systemy, które potrafią rozpoznawać sporo różnych wzorców wypowiedzi, wyciągać informacje, które w pytaniach klienta zostały zawarte i na tej podstawie konstruować wypowiedzi.

Zwykle korzystamy z tych systemów, w taki sposób, że eksperymentujemy z nimi. Pytamy je, np. ile masz lat? I widzimy, że system zrozumiał tę komendę. Bardzo ciężko jest odnieść tego typu realia do obsługi klienta.

Abstrahując od tego, że nie pytamy konsultanta, w jakim jest wieku, to musimy go wdrożyć w naszą historię i w naszą opowieść i powiedzieć co chcielibyśmy załatwić i z czym mamy problem.

Fakt też jest taki, że ta komunikacja jest już bardzo często formatowana przez call center, więc wiemy, na jaki temat konsultant powinien zadać człowiekowi pytania.

Pamiętajmy, że te odpowiedzi ze strony człowieka nie mają szablonowego formatu. Więc systemy komend głosowych oczekujących bardzo szablonowych wypowiedzi, de facto ograniczają pole do komunikacji z konsultantem czy automatem.

Skutkuje to wydłużeniem czasu takiej rozmowy.

K.B: Bo w rzeczywistości mamy rozmowę przypominającą wypełnienie formularza na stronie internetowej?

D.W: Tak, wypełnianie długiego i żmudnego formularza. Taka rozmowa mogłaby potrwać trzy minuty, a potrwa np. 10 czy 15.

Powstaje więc pytanie: dlaczego? Po to, aby mieć w ogóle jakąkolwiek automatyzację i zakładać, że dzięki temu nie potrzebujemy konsultantów? Chyba nie.

Myślę, że po to szukamy automatyzacji, aby jednak nasi klienci byli zadowoleni, a rozmowa z call center kojarzyła im się pozytywnie. Mamy do czynienia z takim paradoksem, gdzie odchodzimy od kanałów telefonicznych do kanałów tekstowych, bo wiemy, że kanał telefoniczny nie działa.

Jeżeli próbujemy dodzwonić się do firmy, a tak jesteśmy dwudziestą trzecią osobą w kolejce i czekamy na rozmowę z konsultantem, to przechodzimy na inne kanały, próbujemy się przykładowo przedzierać przez kanał tekstowy, który w Polsce działa różnie.

Raz konsultanci mają więcej, a raz mniej kompetencji. Koniec końców nie chcemy zastąpić automatyzacji telefonicznej inną komunikacją telefoniczną, gdzie owszem nie musimy czekać na konsultanta, ale ten automat, z którym będziemy rozmawiać, będzie nam po kolei zadawał pytania o fragmenty adresu, czy fragmenty naszych danych identyfikacyjnych, nie będzie pozwalał nam definiować, z jakim problemem dzwonimy, tylko przestawi ich katalog i będzie próbował rozpoznać, czy jakaś fraza mu pasuje.

Będąc klientem, nie będziemy usatysfakcjonowani z takich rozwiązań, z resztą już nie jesteśmy. Więc pamiętajmy, że systemy komend głosowych, to jest jakieś podejście do automatyzacji, natomiast nie jest to dobre podejście, nastawione na dobro klienta.

K.B: Jak rozwiązania Smart speech, wyglądają w przypadku technologii Brilliance?

D.W: Technologia Brilliance opiera się na takim bardzo ważnym założeniu dotyczącym tego, że nie chcemy, aby człowiek uczył się ją obsługiwać.

Jest to bardzo ważne, bo z jednej strony daje to większe pole do elastyczności, jeśli chodzi o komunikacje ze strony człowieka, z drugiej strony stwarza to szereg wyzwań dla nas.

Ale bierzemy te wyzwania na siebie właśnie po to, aby klient na końcu był zadowolony i aby ta komunikacja była swobodna.

Dążymy do tego, aby człowiek rozmawiając z naszym robotem, nie musiał sztywno trzymać się żadnego scenariusza, aby mógł wrócić do wcześniej udzielonych wypowiedzi, aby mógł zmienić ich kontekst, aby mógł się rozmyślić, aby ostatecznie mógł się zawahać i zaczekać.

K.B: W czasie rozmowy mógłby zwrócić się do kogoś innego, kto by zajmował rozmówcę, czyli no mógłby zwrócić uwagę głośno zachowującemu się dziecku.

D.W: Abyśmy mogli tak zrobić, to jest trochę przed nami, ponieważ potrzebujemy dostosować się do niektórych nawyków typowo ludzkich, a jest ich tak wiele, że można dostosowywać je dość długo.

Natomiast sama nieliniowość i brak wymuszania kolejnych kroków tej konwersacji pozwala na bardzo dużo.

Chociażby na stworzenie systemu pytań i odpowiedzi, gdzie człowiek może zadać dowolne pytanie w dowolnej kolejności i wrócić do głównego toru obsługi lub pozostawić to Brilliance, aby zrobiła to za niego.

Coś takiego byłoby absolutnie nie do pomyślenia, jeśli chodzi o systemy komend głosowych. Wreszcie, to co jest najważniejsze to sama forma wypowiedzi człowieka.

Nasza technologia owszem opiera się o pewne frazy, które gdzieś w niej występują, ale sposób ich formułowania pozostawiamy człowiekowi. Nie wymuszamy, aby mówił dokładnie to, do czego nasz system został przygotowany.

K.B: Czyli podczas rozmowy mogą wystąpić jakieś elementy, które zakłócają naszą rozmowę np. w postaci chrypki. To nie jest jakaś przeszkoda dla technologii Brilliance?

D.W: Nie. Z jednej strony możemy poprosić o powtórzenie, a z drugiej w zależności od tego, jakie są to informacje, możemy domyślić się co, właśnie miało zostać powiedziane.

K.B: Możemy też wyciągnąć wnioski z poprzednich fragmentów rozmowy.

D.W: No właśnie na tym to polega. Wszystkie informacje, które do nas docierają, są skrupulatnie odnotowywane w systemie na potrzeby bieżącej konwersacji i jeżeli zachodzi taka potrzeba, także na potrzeby przyszłych rozmów z tego typu klientem. Dzięki temu człowiek nie musi się usztywniać i trzymać się konkretnych wąskich ram.

K.B: I nie musi zadawać pytań połączonych z wcześniej zadanymi pytaniami. Więc dla przykładu rozwiązanie Alexa, gdzie zadajemy pytanie np. o ulubioną piosenkę, ale w przypadku gdy chcemy dynamiczniejszą piosenkę, musimy ponownie zadać polecenie. W przypadku technologii Brilliance system będzie sam pamiętał.

D.W: Pamiętajmy o różnicy między Alexą, a Brilliance dzisiaj. Rozmowa z konsultantem nie jest rozmową na temat ulubionych kolorów, bo takiej konsultantki nie pytamy o jej ulubiony kolor, chyba że ta rozmowa rzeczywiście bardzo dobrze przebiega, tak samo, jak pytanie o wysokość ostatniego rachunku nie powinno trafić do robocika.

K.B: Dokładnie. Dziękuję za rozmowę.

foto: Oskar Kujawa

Komentarze Facebook
Udostępnień
Click to comment

Skomentuj

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Ostatnio

Pierwsza na świecie telewizja nadająca regularny program na Facebooku i YouTube, produkująca profesjonalne treści filmowe we współpracy z polskimi przedsiębiorcami, artystami, dziennikarzami, muzykami.

Copyright © 2016 - 2017 by: Compas Multimedia Tomasz Słodki

Do góry
Udostępnień
ś