Historický milník ve vývoji AI
ChatGPT 4.5 umím dokonale napodobit člověka, je v tom přesvědčivější než živí lidé
3. 4. 2025
čas čtení
2 minuty
Turingův test překonán, tentokrát bez různých "ale". GPT-4.5 dokáže hrát člověka hyper-realisticky, realističtějšího než skuteční lidé, píše na sociální síti Jan Kulveit, český vědec zabývající se vývojem AI.
Z výzkumné zprávy podrobující různé LLM systémy Turingovu testu:
"Hodnotili jsme 4 systémy (ELIZA, GPT-4o, LLaMa-3.1-405B a GPT-4.5) ve dvou randomizovaných, kontrolovaných a předem registrovaných Turingových testech na nezávislých populacích. Účastníci měli 5 minut konverzace současně s jiným lidským účastníkem a jedním z těchto systémů, načež posoudili, o kterém konverzačním partnerovi si mysleli, že je člověk. Když byl GPT-4.5 vyzván k tomu, aby se adaptoval na lidské chování, byl GPT-4.5 považován za člověka v 73 % případů: podstatně častěji než když měli účastníci identifikovat skutečného lidského účastníka. LLaMa-3.1 byl na základě stejné výzvy posouzen jako člověk v 56 % případů – ne významně více či méně často než lidé, se kterými byli srovnáváni – zatímco základní modely (ELIZA a GPT-4o) dosahovaly míry výher výrazně pod hranicí náhody (23 % a 21 %). Výsledky představují první empirický důkaz, že jakýkoli umělý systém projde standardním třístranným Turingovým testem. Výsledky mají implikace pro debaty o tom, jaký druh inteligence vykazují velké jazykové modely (LLM) a jaké sociální a ekonomické dopady tyto systémy pravděpodobně budou mít."
Co je to Turingův test?
Turingův test probíhá tak, že do oddělených místností umístíme jednak testujícího, jednak předmět zkoumání (např. počítač s příslušným programem) a nějakého dalšího člověka. Testující poté klade otázky v přirozené řeči a předává je do druhé místnosti, kde je zodpoví buď počítač, nebo druhý člověk (což se rozhodne náhodně). Odpovědi jsou předávány zpět testujícímu (samozřejmě v nějaké neutrální podobě, např. vytištěné na papíře). Pokud testující nedokáže rozpoznat, jestli komunikuje se strojem, nebo s člověkem, pak tato umělá inteligence splňuje Turingův test.
Více na Wikipedia (heslo nebylo v čase článku aktualizováno, takže uvádí, že žádný systém Ai doposud testem úspěšně neprošel).
2910
Diskuse