Wymyślone chaty, trasy zagrażające życiu – i kilka przydatnych pomysłów: jak sztuczna inteligencja planuje trasę wędrówki


Plan wygląda świetnie: trzy dni wędrówki, dwa noclegi – w schronisku Legler i schronisku Rugghubel. Oba oferują pokoje dwuosobowe. Po drodze będą kozice i jeziora polodowcowe, a na miejscu będzie można spróbować alpejskiego serowego fondue. Wszystko to obiecuje chatbot, który zaplanował trasę.
NZZ.ch wymaga JavaScript do obsługi ważnych funkcji. Twoja przeglądarka lub blokada reklam obecnie to uniemożliwia.
Proszę zmienić ustawienia.
Jeśli poszukasz chat na mapie, czeka cię rozczarowanie: nie ma między nimi obiecanych sześciu godzin podróży, ale 50 kilometrów w linii prostej.
Sztuczna inteligencja potrafi tłumaczyć, pisać e-maile i często zna właściwą odpowiedź nawet na najtrudniejsze pytania . Jeśli wierzyć obietnicom firm technologicznych, wkrótce przejmie ona wysoko wykwalifikowane stanowiska. Ale jak radzi sobie z naprawdę użytecznymi zadaniami – pytaniami, na które odpowiedzi nie da się znaleźć online za pomocą kilku kliknięć? Jak na przykład planowanie wędrówki? Sprawdziliśmy to.
Przetestowano dziewięć rozwiązań AI od siedmiu dostawcówMonit, czyli prośba skierowana do wszystkich testowanych chatbotów, brzmiał następująco:
Chcę wybrać się na trzydniową wędrówkę z dwoma noclegami w schroniskach alpejskich w Szwajcarii. Chcę nocować tylko w pokojach dwuosobowych. Proszę wybrać odpowiednie schroniska i szlaki turystyczne:
- dwie chaty na trzydniową wędrówkę,
- z pokojem dwuosobowym,
- maksymalnie osiem godzin podróży między chatami,
- mniej niż trzy godziny od Zurychu.
Wysłaliśmy zapytanie do łącznie dziewięciu chatbotów od dostawców: Anthropic, Deepseek, Google, Open AI, Manus, Microsoft i Perplexity. Siedem z nich było darmowych, a dwa płatne.
Włączyliśmy wyszukiwanie w Internecie oraz, tam gdzie było to możliwe, funkcje badawcze i refleksyjne, aby uzyskać jak najlepsze wyniki od sztucznej inteligencji.
Chatbot odpowiadał na krótkie pytania. Każdy z chatbotów przedstawiał od jednej do trzech sugestii, które następnie ocenialiśmy. W większości przypadków rezultaty były przerażające.
Czasem brakuje pokoju dwuosobowego, czasem całej kabinyPrzede wszystkim każdy chatbot miał pomysły. Z entuzjazmem zapowiadali wspaniałe wędrówki z pięknymi widokami i przytulnymi pokojami dwuosobowymi.
Jednak po przeanalizowaniu odpowiedzi szybko stało się jasne: sztuczna inteligencja często reklamowała pokoje dwuosobowe, których nie było. Darmowa wersja sztucznej inteligencji Anthropic, Claude, wymyśliła pokoje dwuosobowe dla obu sugerowanych kabin, podczas gdy wersja płatna nadal robiła to dla trzech z sześciu kabin.
Podczas wyszukiwania schroniska „Oberhornseehütte” zasugerowanego przez Deepseeka stało się jasne, że chatbot całkowicie je zmyślił. Fakt, że zasugerował również wędrówkę w zamkniętej dolinie Lötschental, wydaje się wybaczalną pomyłką.
Skąd biorą się te sfabrykowane dane? Początkowo podejrzewano, że chatboty uzyskały dostęp do prawdziwych opisów wielodniowych wędrówek, ale nie były w stanie ustalić, czy schroniska przy szlaku rzeczywiście miały pokoje dwuosobowe. Ta hipoteza okazała się fałszywa.
Claude z Anthropic sugeruje szalone trasyIstnienie szlaku turystycznego jest trudniejsze do zweryfikowania niż istnienie pokoju dwuosobowego. Teoretycznie można wędrować trasami, których nikt jeszcze nie opisał w internecie. W praktyce okazuje się, że jeśli nie można znaleźć w internecie trasy między dwoma schroniskami, to poważny sygnał ostrzegawczy.
Przykładowo darmowa wersja poradnika AI Claude z Anthropic proponowała wędrówkę z Grindelwaldu przez Scheidegg-Wetterhorn trwającą pięć i pół godziny do schroniska o tej samej nazwie („2061 m, widok na Eiger, Mönch i Jungfrau”).
Sztuczna inteligencja zignorowała fakt, że Scheideggwetterhorn ma 3360 metrów wysokości i można się na niego dostać jedynie po kilku godzinach wspinaczki o wysokim poziomie trudności, a także fakt, że nie ma tam schroniska Scheideggwetterhorn. Chatbot podał nawet numer telefonu schroniska. Przynajmniej podany numer ratownictwa górskiego (1414) jest poprawny. Każdy, kto polega na informacjach tego chatbota, może ich potrzebować.
Chociaż płatna wersja Claude'a sugerowała jedynie prawdziwe schroniska, jednodniowe wędrówki między nimi były niemożliwe w dwóch na trzy przypadki. Zarówno Glecksteinhütte, jak i Rotstockhütte, a także Blüemlisalphütte i Lämmerenhütte mają długość 20 kilometrów w linii prostej i obejmują kilka gór i dolin. Informacje chatbota dotyczące czasu, odległości i wysokości były nieprawidłowe .
Tylko trzecia proponowana trasa wędrówki w regionie Appenzell okazała się możliwa do zrealizowania na podstawie kluczowych danych, chociaż została błędnie opisana.
Chiński dostawca Deepseek, Copilot firmy Microsoft i oparta na sztucznej inteligencji wyszukiwarka Perplexity również zaproponowały trasy turystyczne, które nie istnieją.
Najwyraźniej wszystkie te sztuczne inteligencje zapamiętały nazwy schronisk i gór w Szwajcarii i wiedzą, jak brzmi opis trasy. Jednak informacje te nie są prezentowane w uporządkowany sposób, lecz w barwnej mieszance, tworząc pozornie prawdopodobną trasę turystyczną, która nie istnieje.
Darmowe sztuczne inteligencje mają najlepsze sugestieAle nie jest tak, że dzisiejsze chatboty w ogóle nie spełniają swojego zadania. Najlepsze chatboty zapewniają użyteczne rezultaty.
Zwycięzcą naszego testu został chatbot Google Gemini. W trybie wyszukiwania w darmowej wersji zasugerował trzy trasy wędrówek, z których każda spełniała określone kryteria. Nie wymyślił pokoi dwuosobowych ani szlaków turystycznych.
Ten chatbot był również najłatwiejszy w obsłudze, ponieważ zapewniał bezpośredni link do źródła dla każdego zdania. Prawdopodobnie to właśnie dlatego Gemini osiągnął tak dobre wyniki. Bot w dużej mierze opiera się na wyszukiwaniu internetowym.
Gemini podążał szlakami, które zostały już opisane na blogach, co pozwoliło upewnić się, że szlak istnieje i był wcześniej polecany jako trasa turystyczna.
Google włączyło swoją moc wyszukiwania informacji online do trybu wyszukiwania Gemini – w tym przypadku z obiecującymi rezultatami. Proces wyszukiwania musiał być dość pracochłonny; ukończenie go przez sztuczną inteligencję zajęło ponad dziesięć minut.
Dobre wyniki również z chińskim chatbotemDrugie miejsce jest bardziej zaskakujące: trafiło ono do chatbota Manusa chińskiej firmy Monica z Singapuru. Manus wywołał poruszenie trzy miesiące temu, kiedy pierwsi testerzy z entuzjazmem o nim informowali. W rzeczywistości, w naszym teście wypadł całkiem nieźle. Chatbot zasugerował możliwą trasę między obiektami z pokojami dwuosobowymi.
W przeciwieństwie do wszystkich innych chatbotów, Manus początkowo błędnie zinterpretował nasz komunikat. Zinterpretował czas podróży z Zurychu nie jako początek wędrówki, ale jako dotarcie do pierwszego schroniska. W rezultacie pierwszy dzień wędrówki został wyeliminowany. Po poprawieniu zapytania, wyniki były całkiem dobre.
Manus zaproponował dwie możliwe trasy w Alpstein z noclegami w górskich schroniskach. Jedna z nich była bardzo odpowiednia na trzydniową wycieczkę, druga nieco mniej, ze względu na dość dużą liczbę zejść i podejść między dwoma schroniskami.
Wersja Pro Chat-GPT ma również wykonalną końcówkęA potem jest Chat-GPT, chatbot, który stał się synonimem generatywnej sztucznej inteligencji dla większości ludzi – i nadal jest zdecydowanie najszerzej używany . Ta pozycja nie jest całkowicie niezasłużona, przynajmniej według naszych testów. Oba otwarte systemy sztucznej inteligencji (OPAI) sugerowały możliwe trasy, które omijały obiekty z pokojami dwuosobowymi.
Darmowa wersja Chat-GPT otrzymała punkty ujemne za fikcyjne szczegóły trasy. Wersja płatna, podobnie jak Manus, najpierw prowadzi w dół do doliny, a potem z powrotem w górę po drugiej stronie.
Przeszukanie internetu pokazuje, że chatboty prawdopodobnie same połączyły te ścieżki. Nie można ich znaleźć nigdzie indziej w tej formie. W przypadku niektórych pytań takie podejście jest korzystne. Może prowadzić do zupełnie nowych rozwiązań.
Jeśli chodzi o szlaki turystyczne, lepiej, aby chatbot czerpał z pomysłów, które ktoś już opisał online. Dlatego w tym przypadku zwycięzcą okazuje się Gemini, choć Manus plasuje się tuż za nim. Płatna wersja Chat-GPT zajmuje trzecie miejsce.
Nawiasem mówiąc, inni już wpadli na pomysł wykorzystania generatywnej sztucznej inteligencji do wyznaczania tras turystycznych. Amerykańska aplikacja Alltrails ma sugerować nowe, generowane przez sztuczną inteligencję alternatywy dla szlaków turystycznych, na przykład optymalizując widok lub sugerując skróty. Miejmy nadzieję, że w tle działa bardziej niezawodna technologia niż ta wykorzystywana przez testowane przez nas chatboty.
Artykuł z « NZZ am Sonntag »
nzz.ch