BIZNES

Dawid Wójcicki (Voicetel): W technologii Brilliance najważniejsza jest efektywność

Google Duplex to najnowsze rozwiązanie firmy Google, które już wzbudziło ogromne zainteresowanie na całym świecie. O tym, czy to narzędzie sprawdzi się w praktycznym zastosowaniu opowie Dawid Wójcicki, prezes firmy Voicetel.

Karol Bancerz: Kiedy pierwszy raz zobaczyłeś premierę Google Duplex, to co pomyślałeś?

Dawid Wójcicki: Z jednej strony pomyślałem, że fajnie, że ktoś i to nie byle kto, bo Google rozwiał pewne spekulacje na temat tego, czy z klientami powinno się rozmawiać komendami głosowymi, czy naturalnym dialogiem. To już zostało ustalone i za to bardzo Google dziękujemy.

Z drugiej strony zastanowiła mnie formuła tego produktu. Czy w dzisiejszej epoce, w której walczymy z obciążeniem infolinii i zastanawiamy się jak pomóc konsultantom i firmom, to takie podejście w tym aspekcie, jakim jest generowanie dodatkowego ruchu na infolinii, albo wyręczania człowieka w próbach skomunikowania się z tą infolinią, da coś firmom?

Tutaj szczerze powiedziawszy mam pewne wątpliwości. Zastanawia mnie też na ile ta komunikacja jest faktycznie realna. My siedzimy już dość długo w tych tematach i nasze roboty komunikują się w języku naturalnym, korzystając m.in. z technologii Google do rozpoznawania mowy i wiem, jak to działa i jakie ma silne i słabe strony. Więc patrząc z technicznego punktu widzenia na te filmy, które widzieliśmy, a jest w końcu rozmowa telefoniczna…

K.B: Nie wiem, czy zauważyłeś, ale jest to nagrana rozmowa telefoniczna.

D.W: No właśnie. Jest to rozmowa nagrana, wiemy, że ona może przypominać podobną rozmowę z wykorzystaniem różnych technologii, które my tworzymy, ale są tam takie momenty, które wzbudzają nasze zastanowienie.

K.B: Które momenty dają do myślenia?

D.W: Na przykład komunikacja od strony tej pani, która odbiera telefon od Google. Ona posługuje się potocznym językiem, którym rozmawiamy przez telefon. A wiemy jak technologia rozpoznawania mowy radzi sobie właśnie z tego typu ekspresją i z taką melodią wymowy.

Nie zawsze da się rozpoznać te wyrazy, które mają tam kluczowe znaczenie. A tutaj Google radzi sobie zadziwiająco bezbłędnie. Możliwe, że w Stanach Zjednoczonych mają lepsze łącza telefoniczne niż w Polsce, nie wykluczam takiej sytuacji, natomiast, nie chciałbym mówić wprost, że jest to sfingowane, ale jest to nad wyraz dobra prezentacja.

K.B: Oglądając tę transmisję, zastanawiałem się nad bardzo ważnym aspektem, czy te osoby, które rozmawiały z robotem miały tego świadomość. Panuje przeświadczenie, że klient nie powinien wiedzieć, czy rozmawia z człowiekiem, czy z robotem, jak to jest według Ciebie?

D.W: Na bazie naszych doświadczeń i różnych rozwiązań, które tworzymy, bo są to rozwiązania z wykorzystaniem głosu lektora i z wykorzystaniem syntezy mowy, obserwujemy, że zdecydowanie lepiej dla samego procesu jest, kiedy ludzie wiedzą, że rozmawiają z robotem.

Wtedy ta komunikacja z ich strony jest bardziej merytoryczna, kompaktowa i treściwa, dzięki czemu sam proces jest realizowany o wiele szybciej. W przypadku kiedy jest to komunikacja naturalna, a człowiek nie wie, że rozmawia z robotem, powstaje tam pole swobodnej komunikacji treści, które nie mają bezpośredniego przełożenia na sam proces.

To skutkuje tym, że taka rozmowa się wydłuża i generuje obciążenie infolinii, zmniejszając efektywność takiego procesu. Jednak z drugiej strony dzięki takiej formie komunikacji łatwiej jest zbudować relacje z klientem.

K.B: Czy według Ciebie właśnie tak będzie wyglądała komunikacja między firmą a klientami? Czy będzie to może coś innego?

D.W: W jednym aspekcie tak, w drugim nie. Jeżeli chodzi o customer experience, ja uważam, że właśnie tak klienci będą komunikowali się z firmą – używając naturalnego języka i komunikując się swobodnie.

K.B: Ale czy firma będzie komunikowała się właśnie w ten sposób?

D.W: Firma musi właśnie na takie usługi odpowiadać w analogiczny sposób, czyli również w języku naturalnym. Wtedy taka komunikacja jest bardziej płynna i jesteśmy w stanie zapewnić klientowi, na pewno więcej satysfakcji z takiej rozmowy. Z drugiej strony w jednym aspekcie nie mogę się zgodzić.

Nie spodziewam się, że tak będzie wyglądała komunikacja między klientem a firmą, że w imieniu klienta robot dzwoni do firmy. Przecież jeżeli po jednej stronie mamy robota, a po drugiej firmę, czyli nie tylko konsultantów, ale też systemy CRM, to dlaczego między jeden system informatyczny, a drugi wstawiać komunikację naturalną? Przecież tak naprawdę, taka komunikacja powinna być cyfrowa i tak byłoby najprościej dla klienta.

K.B: I chyba najszybciej? Ten proces byłby zdecydowanie tańszy.

D.W: W eksploatacji na pewno były tańszy, ale właśnie tu dochodzimy do tego clue, że nie byłby tańszy w przygotowaniu, ponieważ zintegrowanie Twoich oczekiwań, jako klienta z możliwościami, jakie jest w stanie zaoferować Ci firma, przez pryzmat swojego systemu informatycznego, to już jest rzecz integracji. W tym momencie pojawia się oprogramowanie, które musi Twoje potrzeby korelować z możliwościami oferowanymi przez firmę.

Na płaszczyźnie komunikacji naturalnej, kiedy Ty dzwonisz, a konsultant z Tobą rozmawia, ten tak zwany interfejs jest w jakiś sposób załatwiany — pewnie szybciej w krótkim okresie, ale na pewno drożej w długim. Więc absolutnie nie zakładam, że tak będzie wyglądała komunikacja między klientem a firmą. Prędzej to firmy będą przystosowywały swoje systemy do Twojego, z którego będziesz korzystał, tak aby te systemy mogły się ze sobą porozumieć, niż będzie istniała komunikacja naturalna. Ty możesz się komunikować w języku naturalnym ze swoim osobistym asystentem, a ale już Twój osobisty asystent już jak najbardziej cyfrowo będzie załatwiał Twoje potrzeby z daną firmą.

Wiadomo, że nie jest to prosta rzecz do zrobienia i że Google patrząc z dość wysoka na firmy na całym świecie, nawet największe, nie jest w stanie zintegrować się z nimi w żaden sposób. Zresztą spójrzmy na historię różnych produktów i podejścia Google — to nie jest firma, która wspiera przedsiębiorców. To firma, która wspiera użytkowników indywidualnych i oczywiście, samą siebie. Natomiast nie jest to przedsiębiorstwo, które tworzy systemy informatyczne, które ułatwiają życie w kontakcie z firmą.

K.B: Wspomniałeś o komunikacji naturalnej. Firma Voicetel od dłuższego czasu przygotowuje boty, które komunikują się w trybie naturalnym. Powiedz w takim razie, czym różni się Google Duplex od Twojego rozwiązania?

D.W: Nasze rozwiązanie potencjalnie jest w stanie realizować całe procesy, tak jak widzieliśmy na prezentacji Google, więc może hipotetycznie do Ciebie zadzwonić, umówić Cię na spotkanie, porozmawiać z Tobą na temat pasujących terminów itd. Jednak w praktyce te procesy realizujemy raczej w inboudzie i wykorzystujemy tam częściej syntezę właśnie po to, aby ten proces był bardziej efektywny.

Jeżeli chodzi o taką naprawdę naturalną komunikację, z wykorzystaniem nagrań lektora, to realizujemy te procesy w outboudzie, ale są one zdecydowanie krótsze. Jest bardzo określony cel, np. potwierdzenie zainteresowania klienta produktem, dokonanie miękkiej windykacji, zbadanie satysfakcji po rozmowie z konsultantem, czy uzyskanie zgody na przetwarzanie danych osobowych.

Te procesy trwają od 40 sekund do 1,5 minuty, w skrajnych przypadkach do 3 minut. Taka jest specyfika outboudu, że my zaskakujemy klienta w większości przypadków — albo jest w kolejce w sklepie, albo jedzie metrem, albo jest w łazience. Jeżeli chcemy przeprowadzić krótką rozmowę, to faktycznie ten proces musi być bardzo mocno zdefiniowany.

Przeprowadzenie długiej rozmowy bez umawiania się na ten kontakt ma bardzo niską efektywność. Oczywiście nasze rozmowy przyjmują takie deklaracje np. poproszę o kontakt w godzinach popołudniowych albo zadzwońcie do mnie jutro. Nasze roboty to rozumieją i faktycznie oddzwaniają później, ale ten proces jest na tyle krótki, aby łatwo było ocenić i zmierzyć jego efektywność.

K.B: Czytając komentarze internautów po premierze Google Duplex, zauważyłem, że część z nich pyta o to, kiedy pojawi się polska wersja językowa. Jak myślisz, ile to może zająć czasu?

D.W: To zależy od tego, ile Google chciałby przeznaczyć na to zasobów i jak dużą wagę przywiązałby do Polski jako targetu. Myślę, że nie jesteśmy w top 3 ani w top 5, jeżeli chodzi o kraje. Wystarczy spojrzeć na inne rozwiązania Google z obszaru sztucznej inteligencji.

Polski język nie jest tam priorytetem i trudno się dziwić, bo ani nie jesteśmy jakimś istotną siłą nabywczą w skali całego globu, a nasz język nie jest specjalnie prosty, więc chyba tylko ze względów PR-owych Google mogłoby zająć się językiem polskim przed np. językiem niemieckim, aby udowodnić, że dobrze radzi sobie z trudnymi językami. Jeśli taki kuriozalny cel Google by przyjęło, no to wtedy można by się było tego spodziewać nawet po dwóch latach, jednak nie sądzę, aby to szybko nastąpiło.

K.B: Ale Twoja technologia Brilliance jest już na tyle zaawansowana, że stworzenie nowego języka nie byłoby tak skomplikowane, jak w przypadku Google. W jednym z programów wspomniałeś, że system potrzebowałby na to około czterech tygodni.

D.W: To prawda, dzięki temu, że jesteśmy w Polsce, mogliśmy zacząć od bardzo wysoko postawionej poprzeczki. Trudny język, trudna gramatyka, wiele synonimów, dowolny szyk zdania, czyli coś, co jest bardzo rzadko spotykane w obcych językach i na to musieliśmy naszą technologię przygotować.

Jednak tworzyliśmy Brilliance w taki sposób, aby język nie był tym głównym czynnikiem, który warunkuje cały projekt. Nasz proces jest uwarunkowany intencjami, a one nie przynależą do żadnego języka.

Więc jeśli chcemy dostosować nasze rozwiązanie do innego języka, to tylko część systemu musimy przetłumaczyć, natomiast cała logika przetwarzania informacji, kontekstu i znaczeń w odniesieniu do bardzo konkretnego procesu i ścieżek, którymi może on podążać, jest załatwiona i język, który chcemy użyć do komunikacji, nie ma na nią żadnego wpływu.

K.B: To prawda, że Google Duplex nie przeszło testu Turinga?

D.W: Jeżeli nie przeszedł, to nie ma się co dziwić, dlatego że aspiracją Google nie było przekonanie drugiego człowieka, że rozmawia z człowiekiem.

K.B: Jednak na filmie to się udało, bo robot wypadł bardzo naturalnie i człowiek nie odkrył, że nie rozmawia z człowiekiem.

D.W: Wiemy jakie wrażenie robią takie prezentacje. Doskonale zdaje sobie sprawę, jak jest to odbierane i te brawa publiczności po filmiku Google w ogóle mnie nie dziwią, bo tego nie da się wyobrazić. To trzeba przeżyć, posłuchać i zobaczyć. To robi wrażenie.

Natomiast ani nasze rozwiązania, ani Google Duplex nie powstało z intencją wprowadzenia człowieka w błąd, aby myślał, że rozmawia z drugim człowiekiem. A w końcu test Turinga polega na tym, że rozmówca ma określić, spodziewając się, że rozmawia z człowiekiem, lub nie, czy po drugiej stronie jest człowiek, czy robot.

Ważniejsza jest ta efektywność całego procesu i dopiąć swego, niż to aby na koniec rozmowy powiedzieć, że rozmawiałeś z robotem, a się nie zorientowałeś. To nie jest żadna korzyść.

K.B: Dziękuję bardzo za rozmowę.

foto: Oskar Kujawa

Komentarze Facebook
Udostępnień
Click to comment

Skomentuj

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Ostatnio

Pierwsza na świecie telewizja nadająca regularny program na Facebooku i YouTube, produkująca profesjonalne treści filmowe we współpracy z polskimi przedsiębiorcami, artystami, dziennikarzami, muzykami.

Copyright © 2016 - 2017 by: Compas Multimedia Tomasz Słodki

Do góry
Udostępnień
ś