ChatGPT jako pierwszy system AI przeszedł klasyczny test Turinga

Model GPT-4.5 od OpenAI jako pierwszy system sztucznej inteligencji zdołał przejść klasyczny test Turinga w jego pierwotnej, trójstronnej wersji.

W badaniu wzięło udział 284 ochotników pełniących funkcję sędziów. Każdy z nich prowadził jednocześnie pięciominutowe rozmowy tekstowe z dwoma rozmówcami – jednym człowiekiem i jednym dużym modelem językowym (LLM). Po zakończeniu rozmowy uczestnicy musieli zdecydować, który z rozmówców był człowiekiem. W ramach eksperymentu oceniano cztery modele językowe: historycznego chatbota ELIZA z lat 60., wcześniejszą wersję GPT-4o, model LLaMa-3.1-405B stworzony przez firmę Meta oraz GPT-4.5 – najnowszy model od OpenAI.

GPT-4.5 został błędnie uznany za człowieka w 73% przypadków

Uczestnicy badania wskazali GPT-4.5 jako człowieka w 73% przypadkach i częściej mylono go z człowiekiem niż faktycznego ludzkiego rozmówcę, co uznaje się za przełomowe osiągnięcie w historii testu Turinga.

Przejście testu Turinga nie oznacza jednak, że GPT-4.5 ma świadomość czy zdolność do rozumienia na ludzkim poziomie. Pokazuje to raczej, że model potrafi generować wypowiedzi tekstowe w sposób tak przekonujący, że trudno go odróżnić od człowieka w krótkiej rozmowie. Naukowcy podkreślają, że ten wynik może mieć istotne konsekwencje dla przyszłości interakcji między ludźmi a sztuczną inteligencją – zwłaszcza w kontekście etyki, dezinformacji oraz bezpieczeństwa.

Test Turinga, zaproponowany w 1950 roku przez Alana Turinga, ma na celu ocenę, czy maszyna jest w stanie imitować ludzkie zachowanie w stopniu, który czyni ją nierozróżnialną dla człowieka.

W jego klasycznej wersji bierze udział trzech uczestników: sędzia (człowiek), drugi człowiek oraz maszyna. Sędzia prowadzi rozmowę z pozostałymi, nie wiedząc, kto jest kim, i na podstawie tej wymiany musi wskazać człowieka. Jeśli nie potrafi jednoznacznie odróżnić maszyny od człowieka, uznaje się, że maszyna przeszła test.

Źródło: livescience.com

Dodaj komentarz