Akcje dotyczące rozmów

Akcje związane z rozmowami rozszerzają możliwości Asystenta Google, umożliwiając tworzenie niestandardowych doświadczeń, czyli rozmów, z użytkownikami Asystenta. Akcja rozmowy obsługuje prośby od Asystenta i zwraca odpowiedzi z komponentami dźwiękowymi i wizualnymi. Akcje konwersacyjne mogą też komunikować się z zewnętrznymi usługami internetowymi za pomocą webhooków, aby uzyskać dodatkową logikę konwersacyjną lub biznesową, zanim zwrócą odpowiedź.

Podczas rozmowy z Asystentem Google użytkownik pyta o sesję konferencji i otrzymuje na nią odpowiedź.
Rysunek 1. Przykład akcji dotyczącej rozmowy

Dlaczego warto tworzyć

Typowe interfejsy komputerowe wymagają do działania uporządkowanych i przewidywalnych danych wejściowych, przez co korzystanie z nich jest nienaturalne, a czasem utrudnione. Jeśli użytkownicy nie będą w stanie łatwo zrozumieć tych uporządkowanych danych wejściowych, będą mieli problem z zastanowieniem się, co zrobić.

Rozważ np. proste pytanie użytkownika, np. „Jaka jest prognoza na dzisiaj?”. Inni użytkownicy mogą też zapytać: „Jaka będzie teraz pogoda?” lub „Jaka będzie jutro temperatura w Warszawie?” Nawet przy tak prostym pytaniu widać, że trudno jest wdrożyć funkcje konwersacyjne, ponieważ interpretowanie i przetwarzanie języka naturalnego wymaga solidnego parsera języka, który jest w stanie zrozumieć niuanse języka. Twój kod musiałby obsłużyć wszystkie tego typu żądania (a potencjalnie wiele innych), aby działała ta sama logika: wyszukanie pewnych informacji o prognozach dotyczących czasu i lokalizacji. Z tego powodu tradycyjny interfejs komputerowy wymaga dobrze znanych, standardowych żądań wejściowych, co negatywnie wpływa na wygodę użytkowników, ponieważ łatwiej jest obsługiwać wysoce ustrukturyzowane dane wejściowe.

Gdy jednak tworzysz akcje rozmowy, Asystent zajmuje się rozumieniem języka naturalnego (NLU), dzięki czemu możesz łatwo tworzyć otwarte, konwersacyjne interfejsy. Te narzędzia interfejsu pozwalają zrozumieć ogromne i zróżnicowane niuanse ludzkiego języka oraz przełożyć je na standardowy i uporządkowany sposób zrozumiałości dla aplikacji i usług. Zobaczmy, jak akcja może obsługiwać poprzednie przykłady z prośbami o prognozę pogody.

Rysunek 1. Dopasowywanie intencji NLU

Aby uzyskać prognozę pogody, możesz potrzebować kilku informacji, np. o godzinie, na jaką ma być potrzebna prognoza, oraz lokalizacji. Jednak, jak już wspomnieliśmy, różni użytkownicy mogą poprosić o prognozę w inny sposób. Asystent rozumie te różnice i przekształca je w standardową intencję użytkownika, aby uzyskać prognozę. Następnie może przeanalizować żądanie użytkownika dotyczące odpowiednich danych, które są potrzebne do jego realizacji. W takim przypadku chodzi o prognozę pogody. Na koniec możesz użyć tych danych, aby wyszukać pogodę przy użyciu publicznego interfejsu API REST i zwrócić informacje o pogodzie użytkownikowi w formie promptu.

Kiedy należy tworzyć

Akcje związane z rozmowami sprawdzają się najlepiej w prostych przypadkach, w których użytkownicy mogą sprawnie wykonywać zadania, oraz w rzeczywistych sytuacjach, w których jest włączone dyktowanie. Dobre akcje konwersacyjne często dzielą się na te ogólne kategorie:

  • Na które pytania można łatwo odpowiedzieć. Działania, które można wykonać na podstawie znajomych danych, takich jak godzina lub data, jak np. rezerwowanie lotu.
  • Szybkie, ale przydatne polecenia. Zwykle zapewniają użytkownikom natychmiastowe korzyści, gdy poświęcają bardzo mało czasu, np. wiedzą, kiedy gra ich ulubionej drużynie sportowej.
  • Działania, które z natury są lepiej dostosowane do nagrań głosowych. Są to zwykle rzeczy, które chcesz robić bez użycia rąk, np. ćwiczenia jogi lub lekkie ćwiczenia albo gry, które stworzono z myślą o interakcjach głosowych.

Jak tworzyć

W Actions on Google możesz tworzyć akcje konwersacyjne za pomocą pakietu Actions on Google lub Actions Builder albo obu naraz. Ta funkcja pozwala wybrać najlepszy proces programowania odpowiadający Twoim potrzebom, a jednocześnie daje możliwość swobodnego przełączania się w razie potrzeby.

Actions SDK udostępnia ustandaryzowany schemat oparty na plikach do tworzenia akcji i bibliotek do interakcji z Asystentem oraz interfejs wiersza poleceń do wdrażania projektu Actions i zarządzania nim. Actions Builder działa w oparciu o tę samą technologię co Actions SDK. Umożliwia tworzenie łatwych w obsłudze i zaawansowanych IDE.

Więcej informacji znajdziesz w artykule Omówienie kompilacji.

Dalsze kroki

Zapoznaj się z tymi materiałami, by zacząć tworzyć już teraz:

  • Krótki przewodnik – przeczytaj krótkie wprowadzenie, z którego dowiesz się, jak skonfigurować środowisko i zacząć programować za pomocą Actions SDK i Builder.
  • Codelabs – Codelabs zawiera szczegółowe instrukcje tworzenia działań dla Asystenta Google.
  • Sample – pobierz wszystkie nasze przykłady na GitHubie, aby już teraz zacząć eksperymentować.