Dyrektor generalny Perplexity uważa agentów AI za kolejne pole bitwy w sieci

Perplexity wykorzystało potencjał generatywnej sztucznej inteligencji — ze wszystkimi jej problematycznymi tendencjami — aby rzucić wyzwanie wyszukiwarce Google jako dominującemu narzędziu wyszukiwania informacji online.
Narzędzie wyszukiwania AI zyskało na znaczeniu w 2024 r. i zostało pochwalone jako obiecująca alternatywa dla Google. Jednak podobnie jak inni gracze AI, usługa została pozwana za domniemane naruszenie praw autorskich . Forbes oskarżył ją o plagiatowanie artykułów informacyjnych, ścisłe parafrazowanie innych stron internetowych i halucynacje nieprawidłowych informacji.
Pomimo zamieszania, Perplexity twierdzi dziś, że jego usługa otrzymuje 650 milionów zapytań miesięcznie i podobno zabiega o inwestycję, która wyceniłaby firmę na 18 miliardów dolarów. Firma promuje asystentów AI dla urządzeń mobilnych i pracuje nad własną przeglądarką internetową . W kwietniu Motorola ogłosiła, że Perplexity będzie dołączany do jej nowych telefonów Razr Ultra . W zeszłym miesiącu firma nawiązała współpracę z PayPal, aby ułatwić użytkownikom kupowanie produktów za pomocą jej asystenta. Mówi się również, że Samsung prowadzi rozmowy w sprawie ewentualnego umieszczenia Perplexity na swoich urządzeniach , zgodnie z raportem Bloomberga. (Perplexity odmówiło komentarza na ten temat po wywiadzie.).
Dyrektor naczelny Perplexity, Aravind Srinivas, rozmawiał przez telefon i e-mail z Willem Knightem, starszym autorem w WIRED.
Ta rozmowa została zredagowana w celu zwiększenia przejrzystości i zwięzłości.
WIRED: Umowa PayPal wydaje się ważna dla wizji, jaką wszyscy mają dla agentów. Czy e-commerce to zabójcza aplikacja „agencka”?
Aravind Srinivas: Agenci to zabójcza aplikacja do wszystkiego. Agenci pozwalają użytkownikom na korzystanie z najlepszych dla nich doświadczeń. Niektórzy lubią robić zakupy i robić badania, a inni chcą, aby robiono to za nich. Istnieje spektrum pomiędzy, a my skupiamy się na tym, co jest najlepszym doświadczeniem dla użytkownika.
Mówiąc o doświadczeniu, agenci nadal popełniają błędy. Co się dzieje, gdy kupują coś przez przypadek?
Kupcy i kupujący dostosowali się do każdej nowej technologii od czasów starożytnych. Po prostu pokazujemy im obu, co jest możliwe, a oni wybierają. Każda udana technologia musiała traktować bezpieczeństwo i rozwiązywanie błędów bardzo poważnie i to się nie zmieni.
Integracja AI z urządzeniami osobistymi to kolejny ważny temat. Dlaczego umowa z Motorolą jest dla Ciebie ważna?
To wielka sprawa, ponieważ Motorola jest jedną z największych marek telefonów na świecie. Ta współpraca daje nam możliwość uczynienia godnej zaufania sztucznej inteligencji bardziej dostępną niż kiedykolwiek. Teraz, wprowadzając Perplexity milionom ludzi na całym świecie, w natywny i płynny sposób, więcej osób zobaczy, jak wiele więcej jest naprawdę możliwe dzięki wyszukiwaniu.
Czy rozważyłby Pan w przyszłości opracowanie własnych urządzeń?
Skupiamy się na stworzeniu najlepszego asystenta AI i mechanizmu odpowiedzi.
Motorola będzie oferować także inne asystenty AI. Czym zatem wyróżni się Perplexity?
W miarę jak asystenci AI stają się coraz bardziej popularni, dokładność i zaufanie staną się jeszcze ważniejsze. Asystent nie jest zbyt przydatny, jeśli jest zawodny. Co gorsza, jeśli asystent wprowadza w błąd lub pochlebia, to nie jest asystentem — jest manipulatorem. To nie tylko bezużyteczne, ale i niebezpieczne. Niedokładna AI ma negatywny efekt kumulacyjny, a my zawsze byliśmy liderem w rozwijaniu AI i asystentów AI skupionych na dokładności i weryfikowalności. To będzie miało pozytywny efekt kumulacyjny.
Ale zaczekaj... Perplexity — podobnie jak inne wyszukiwarki oparte na sztucznej inteligencji — było krytykowane za halucynacje i błędne interpretacje wyników.
Witamy tę krytykę, ponieważ jest to najlepszy sposób na ciągłe doskonalenie. W rzeczywistości błędy stanowią niewielką część wyników, a nasze odpowiedzi są o wiele dokładniejsze niż 10 niebieskich linków zanieczyszczonych przez dziesięciolecia treści zoptymalizowanych pod kątem SEO. [W odpowiedzi na prośbę o dalsze informacje Perplexity nie podało dalszych szczegółów na temat wskaźników błędów, ale Jesse Dwyer, rzecznik, powiedział, że niezawodność stale się poprawia]. Ale faktem jest, że dokładność i zaufanie będą stawać się coraz ważniejsze, gdy sztuczna inteligencja będzie integrować się z większą częścią naszego życia, więc jest to coś, na czym nieustannie się skupiamy. Nie możemy tam dotrzeć bez tej informacji zwrotnej.
Perplexity również czerpie z artykułów objętych prawami autorskimi w sekcji „discover”. Czy rozumiesz, dlaczego niektórzy wydawcy są zdenerwowani?
Odpowiedzieliśmy na to wcześniej. Zobacz nasz wpis na blogu o tym, jak szanujemy plik robots.txt [plik dodawany do witryn internetowych, który określa, czy roboty indeksujące powinny uzyskiwać dostęp do ich treści].
Asystent Perplexity na Androida i iOS wydaje się „agentyczny”, ponieważ może podejmować działania. Jak duża jest to zmiana?
AI jest teraz całkiem dobra w odpowiadaniu na pytania. To, co naprawdę trzeba zrobić, to sprawić, by AI podejmowała działania. Ludzie używają słowa „agenci”; możesz wybrać, co chcesz — „agent” lub „asystent” — ale ostatecznie musi połączyć narzędzia i wykonywać działania. Dlatego [budujemy również] przeglądarkę i asystenta na iOS, Androida.
Czy Apple i Google mają zbyt dużą kontrolę nad swoimi platformami mobilnymi w porównaniu z podmiotami zewnętrznymi, które chcą budować agentów?
W przypadku systemu iOS jest to szczególnie trudne, ponieważ trzeba połączyć ze sobą wiele interfejsów API zdarzeń. W systemie iOS Mail, Calendar, Reminders, Podcasts, wszystkie te rzeczy są natywnie dostępne za pośrednictwem Apple SDK [zestawu narzędzi do tworzenia oprogramowania używanego do tworzenia aplikacji], więc można przynajmniej tworzyć wersje robocze wiadomości e-mail, planować spotkania, przenosić spotkania, ustawiać przypomnienia, wszystkie te rzeczy, otwierać podcasty dość łatwo. Można wyszukiwać podcasty... „znajdź mi ten, w którym Mark Andreessen omawia de-banking z Joe Roganem”. To może ci się udać dość szybko.
To jest trudne głównie dlatego, że nie masz dostępu do innych aplikacji. iOS nie różni się bardzo od Androida, ponieważ AI nie ma dostępu do większości aplikacji na Androidzie (co oznacza, że asystent Perplexity może łatwiej wchodzić w interakcje z niektórymi aplikacjami niż z innymi). [Ale] aplikacje innych firm mogą budować swoje SDK, aby były dostępne w SDK Androida. Na przykład nasz system Android może wyświetlić piosenkę w Spotify. W iOS możesz połączyć się tylko z konkretną piosenką Spotify i musisz ręcznie rozpocząć odtwarzanie dźwięku.
A więc to twórcy aplikacji blokują rozwój agentów AI?
To jest wyzwanie. Jeśli ludzie oferują nam API — powiedzmy, Open Table, Uber, DoorDash lub Instacart — gdzie możemy uzyskać dostęp do informacji w aplikacji, nawet bez konieczności otwierania aplikacji. W zapleczu jest to całkiem potężne. Na przykład, jeśli możemy uzyskać dostęp do informacji o Uberze i stwierdzić, że Uber Comfort nie kosztuje więcej niż 5 lub 10 procent Ubera X, możemy po prostu zarezerwować Uber Comfort dla Ciebie — jeśli jest to preferencja, którą ustawisz w Perplexity.
Albo podobnie [możemy] znaleźć najlepszą tajską restaurację w pobliżu i zamówić mi dash [dostawę] znacznie szybciej niż wchodząc do aplikacji DoorDash, szukając tajskiego jedzenia i przewijając wszystkie te opcje, czytając wszystkie te recenzje, a następnie wpisując swój adres, dokonując płatności, wszystkie te rzeczy. Szczerze mówiąc, moglibyśmy zrobić to wszystko w naszym systemie i po prostu sprawić, aby doświadczenie było o wiele bardziej płynne i proste. Myślę, że to właśnie tam zmierzamy, ale ludzie muszą udostępnić nam swoje aplikacje, a my zobaczymy, kto będzie chciał co zrobić.
Czy największym problemem nie jest to, że agenci AI nie są jeszcze zbyt inteligentni i użyteczni?
Moja analogia [do agentów AI] jest taka, że jesteśmy w punkcie, w którym Perplexity było w 2022 r. [tuż przed startem]. Nie jest tak, że udzieliliśmy wszystkich prawidłowych odpowiedzi, ludzie wyśmiewali halucynacje, a niektórzy nazywają to „Google w makrosekundach”. Nie było to jeszcze to.
Dopiero wiele miesięcy później, gdy modele stały się lepsze, nabrało rozpędu i spodziewam się tego samego trendu u agentów i asystentów. Będzie pewien zestaw rzeczy, które naprawdę działają, codzienne przypadki użycia, i będzie długi ogon rzeczy, które nie działają, które będziemy naprawiać z czasem.
Ale właśnie dlatego budujemy przeglądarkę [internetową], ponieważ front-end przeglądarki pozwoli ci również wykonać pracę samodzielnie, jeśli nie jesteś zadowolony z tego, co zrobiła sztuczna inteligencja. Wtedy możemy się z tego uczyć i to naprawić z czasem. Waymo i autonomiczne prowadzenie Tesli nie działało przez długi czas. Teraz ludzie traktują je jak coś oczywistego. Myślę, że to podobna ścieżka dla nas.
Czy to dlatego rzuciłeś pomysł, aby Perxplexity przejęło kontrolę nad Chrome, gdyby Google zostało zmuszone do jej oddania?
Nie mówimy, że jesteśmy zainteresowani kupnem Chrome. Mówimy, że jeśli nie ma innej drogi, jeśli Google znajdzie się w sytuacji, w której będzie musiało pozbyć się Chrome, to będziemy otwarci na jego prowadzenie. Ale Google nie powinno musieć pozbywać się Chrome, ponieważ Chrome i Chromium są ze sobą powiązane.
Chromium to projekt typu open source, którym Google bardzo dobrze zarządza. To właśnie dzięki niemu powstały przeglądarki Microsoft Edge i Brave.
OpenAI wykazało również zainteresowanie przejęciem kontroli nad przeglądarką Chrome.
Oddanie własności Chrome lub Chromium firmie takiej jak OpenAI byłoby katastrofą, ponieważ open source i OpenAI są w tym momencie oksymoronem. [OpenAI nie odpowiedział na prośbę o komentarz. Firma twierdzi, że latem tego roku wyda model AI z otwartym kodem źródłowym.]
Istnieją tylko dwie firmy, które potencjalnie mogą uruchomić Chrome: Microsoft i Meta. Szczerze mówiąc, Microsoft by to zepsuł, tak jak zepsuł Edge. A przeniesienie Chrome do Meta to przeniesienie Chrome z jednego monopolu do drugiego. [FTC złożyła pozew , w którym oskarża Meta o działanie jako monopolista w sieciach społecznościowych; firma twierdzi, że tak nie jest .]
Do czego w pierwszej kolejności spodziewasz się przydatności agentów?
Myślę, że [dzięki nim] wiele Twoich osobistych wyszukiwań stanie się o wiele lepszych.
Jak pytanie: „Jaki artykuł przeczytałem w zeszłym tygodniu o tej konkretnej firmie?” lub „Czy możesz mi streścić mój kanał X, żebym wiedział, co jest na topie?”, ponieważ nie chcesz iść do X i się tym rozpraszać. Albo „Czy możesz zaplanować dla mnie to spotkanie z tą osobą i jeśli będzie konflikt, wyślij jej e-mail z prośbą o inny termin?” Wszystkie te nudne rzeczy, myślę, że będziemy mogli je dość szybko [w przyszłości] zautomatyzować.
wired