Alexa Amazona wkrótce wyjdzie ze skorupy, a to, co się pojawi, będzie bardzo interesujące. W środę podczas jesiennej imprezy sprzętowej firma zaprezentowała zupełnie nowego asystenta głosowego Alexa obsługiwanego przez nowy model Alexa Big Language. Według Dave’a Limba, wiceprezesa Amazon ds. obecnych urządzeń i usług, nowa Alexa może rozumieć frazy konwersacyjne i odpowiednio reagować, skuteczniej interpretować kontekst i realizować wiele żądań za pomocą jednego polecenia.
Asystenci głosowi potrzebują zmian. Zamiast niesamowitego postępu technologicznego, jakiego oczekiwaliśmy, gdy pojawiły się one na scenie dziesięć lat temu, ogólny brak innowacji i niezrozumiałych ulepszeń zredukowały je do prymitywnych narzędzi.
Wydaje się, że przez jakiś czas generatywna sztuczna inteligencja będzie miała większą szansę na przetrwanie. Chociaż ci asystenci cyfrowi zawsze będą zawierać elementy sztucznej inteligencji, brakuje im możliwości złożonego przetwarzania, a sztuczna inteligencja jest w stanie nawiązywać interakcje przypominające ludzkie. To ważny moment dla inteligentnego domu, ponieważ może przenieść automatyzację domu na wyższy poziom, przechodząc od zdalnego sterowania do naprawdę inteligentnego domu.
W wywiadzie na krawędzi Przed wydarzeniem Limp wyjaśnił, że nowy Alexa LLM „to model z dużym językiem, który można naprawdę uogólnić i który jest wysoce zoptymalizowany pod kątem aplikacji Alexa; Tego nie znajdziesz w przypadku Barta, ChatGPT lub żadnego z nich.
Jednak ta nowa Alexa nie jest dostępna wszędzie i dla wszystkich na raz. Firma będzie go powoli wdrażać w ramach programu podglądu „w nadchodzących miesiącach” – tylko w USA. Najwyraźniej wyciągnięto wnioski z błędów Microsoftu i Google’a, a Amazon postępuje ostrożnie.
Pierwszą dużą zmianą w nowej Alexie będzie bardziej konwersacyjny asystent
„Łącząc LLM ze światem rzeczywistym, chcesz zminimalizować halucynacje — i chociaż uważamy, że mamy odpowiednie systemy… nic nie zastąpi umieszczenia tego w prawdziwym świecie” – mówi Limb. Jeśli chcesz otrzymać powiadomienie, kiedy będziesz mógł dołączyć do podglądu, powiedz „Alexa, porozmawiajmy” do swojego urządzenia Echo, a Twoje zainteresowanie zostanie zarejestrowane.
Nic dziwnego, że ta supermocna Alexa nie zawsze jest niezależna. Chociaż Alexa jest obecnie bezpłatna, Limp powiedział: „pomysł humanoidalnego asystenta, który może doładować Twój inteligentny dom i wykonywać w Twoim imieniu złożone zadania, może zapewnić wystarczającą użyteczność, za którą moglibyśmy pobierać opłaty. Poniżej.”
Pierwszą dużą zmianą w nowej Alexie będzie asystent bardziej konwersacyjny, który rozumie więcej z tego, co mówisz i wymaga mniej szczegółowego nazywania, aby robić to, o co prosisz. Jest to jedna z najczęstszych przyczyn frustracji w przypadku asystentów głosowych — gdy poprosisz termostat, aby go ściszył, lub gdy termostat odpowie: „Niektóre rzeczy mają wspólną nazwę „Światła”.
Dzięki nowej Alexie możesz powiedzieć np. „Alexa, jest mi zimno”, a Asystent podniesie temperaturę na podłączonym termostacie. Lub, jak wyjaśnił Limb: „Powiedz: «Alexa, spraw, aby ten pokój wyglądał jak kolory Seahawka», a ona będzie wiedzieć, w którym pokoju się znajduję i jakie są kolory Seahawka, a następnie dokona tłumaczeń między interfejsami API”.
Alexa, supermocarstwo, nie zawsze będzie niezależna
Interfejsy API są kluczowe, mówi Limp. „Do naszego LLM dodaliśmy ponad 200 interfejsów API inteligentnego domu”. Dane te, w połączeniu z wiedzą Alexy o tym, jakie urządzenia znajdują się w Twoim domu i w jakim pomieszczeniu się znajdujesz, na podstawie głośnika Echo, z którym rozmawiasz, dają Alexie kontekst potrzebny do bardziej proaktywnego i płynnego zarządzania inteligentnym domem.
To kontekstowe zrozumienie rozciąga się na inne podłączone urządzenia, którymi możesz chcieć sterować, na przykład przewidywanie zmian w domu. „Jeśli dodasz nowe urządzenie do swojego domu, możesz powiedzieć: «Alexa, włącz nowe światło», a urządzenie będzie wiedziało, jakie jest nowe światło. To wyjaśnia sprawę, więc jeśli podłączysz nową inteligentną wtyczkę lub światło, łatwiej będzie sterować” – wyjaśnia Limb.
Kolejną nową możliwością jest odpowiadanie na wiele żądań jednocześnie. Nie tylko podstawowe rzeczy, takie jak „Alexa wyłącz światło i zamknij drzwi” (w pewnym stopniu), jest to już wykonalne. Jest jeszcze bardziej zaawansowany. „Możesz powiedzieć: «Alexa, włącz zraszacze, otwórz bramę garażową, wyłącz światła zewnętrzne» i wszystko się ułoży” – mówi Limp.
Możliwość ta obejmuje tworzenie procedur na bieżąco – całkowicie głosowo – w aplikacji Alexa, bez konieczności ręcznego programowania. „Dziś rano przygotowałam taki zestaw dla mojego dziecka, mówiąc: «Alexa, każdego ranka o 8:00 włączaj światło, włączaj muzykę na pobudkę dla mojego dziecka w jego sypialni i włączaj ekspres do kawy»” – mówi Limb. wyskakuje jak zwykle.”
Limp twierdzi, że początkowo funkcja wielu poleceń będzie działać tylko z podzbiorem typów urządzeń – w tym ze światłami, inteligentnymi wtyczkami i innymi. Zespół pracuje jednak nad tym, aby uwzględnić wszystko.
Programiści mogą wykorzystać nowe funkcje poznawcze Alexy i zintegrować swoje produkty i usługi z tym formatem konwersacyjnym. Amazon wprowadza dwa narzędzia, które pozwalają nowej Alexie kontrolować niektóre unikalne funkcje produktów innych producentów, których nie ma w zestawie narzędzi ekosystemu inteligentnego domu Amazon. Nazywa się je kontrolerem dynamicznym i kontrolerem akcji.
Kontroler dynamiczny sprawia, że funkcje takie jak gotowe sceny do sterowania oświetleniem wyglądają bardziej naturalnie. Tak więc, jeśli masz kolorowe żarówki GE Cync i powiesz: „Alexa, przestrasz mnie tutaj”, Alexa będzie wiedziała, co zrobić, bez konieczności programowania zwykłego programu lub importowania scen do aplikacji Alexa.
Podobnie Action Controller umożliwia programistom dodawanie prostych akcji, które może wykonać Alexa. Jeśli na przykład powiesz: „Alexa, podłoga jest brudna”, Asystent będzie wiedział, że chcesz, aby robot odkurzający działał.
Amazon twierdzi, że współpracuje już nad tymi funkcjami z GE Cync, Philips, GE Appliances, iRobot, Roborock i Xiaomi. Już teraz złóż wniosek o udział. Blog programistów Amazon zawiera więcej szczegółów na temat nowych możliwości i narzędzi.
Limb twierdzi, że to dopiero początek nowej podróży Alexy. „Opracowaliśmy nową generatywną sztuczną inteligencję LLM, która z czasem będzie zasilać wiele obszarów Alexy, w tym nowe doświadczenia związane z inteligentnym domem” – mówi. „Pierwsze wiadro ma na celu ułatwienie tych codziennych zadań”. Dalsza podróż będzie interesująca.
Nowy asystent głosowy oparty na technologii Alexa LLM zostanie wprowadzony jako pierwszy w wersji zapoznawczej w USA i będzie dostępny dla każdego posiadacza urządzenia Echo. Amazon nie ogłosił daty podglądu, a nowe funkcje inteligentnego domu zasilane przez Alexa LLM będą częścią dodatkowej wersji zapoznawczej dostępnej tylko na zaproszenie. W ramach podglądu możesz poprosić o jednorazowe zaproszenie. Amazon twierdzi, że będą dostępne w późniejszym terminie.
Aktualizacja, czwartek, 21 września o 9:20: Dodano szczegóły dotyczące sposobu, w jaki programiści mogą rejestrować swoje urządzenia i usługi w celu integracji z Alexa LLM.