В 1950 году Алан Тьюринг предложил изящный и в то же время сложный способ определить, можно ли считать машины «мыслящими». Этот показатель машинного интеллекта, известный как тест Тьюринга, ставит людей и машины в соревнование, где судьи должны различать искусственный интеллект и настоящий интеллект с помощью текстовых взаимодействий.
Как сообщает Discover, несмотря на многочисленные попытки, ни одна искусственная система не смогла убедительно пройти это испытание. Но Кэмерон Джонс и Бенджамин Берген из Калифорнийского университета в Сан-Диего впервые собрали доказательства того, что GPT-4.5 от OpenAI, сложная большая языковая модель, успешно прошла тест.
GPT-4.5 не только прошла, но и превзошла человеческие аналоги при определенных условиях, убедив участников в своей человечности.
В тесте Тьюринга следователь сталкивается с двумя собеседниками — человеком и машиной, которые общаются с ним через текстовые сообщения. Задача допрашивающего — определить, кто из собеседников является человеком.
Несмотря на прогресс в компьютерной лингвистике и машинном обучении, системы искусственного интеллекта по-прежнему не справляются с этой задачей.
Чтобы пройти тест, Джонс и Берген набрали 284 участника из разных слоев общества. Исследователи сравнили несколько современных моделей искусственного интеллекта.
Результаты показали, что GPT-4.5 превзошла человеческие аналоги и была оценена как человек в 73% случаев, что подчеркивает способность ИИ имитировать человеческий разговор.