Нейросети успешно сдали базовый ЕГЭ по математике

Искусственный интеллект демонстрирует значительный прогресс в решении экзаменационных заданий. Ранее блогер likonit ik с помощью ChatGPT решил вариант ЕГЭ по информатике, набрав 90 баллов из 100. В 2023 году тот же тест был сдан лишь на 14 баллов.

Журналисты решили проверить способности нейросетей на базовом ЕГЭ по математике. Для эксперимента использовали задания с сайта «РешуЕГЭ», основанного учителем года-2007 Дмитрием Гущиным, который ранее выражал опасения о возможной блокировке ресурса.

В исследовании участвовали три нейросети: американские ChatGPT и Perplexity, а также китайская DeepSeek. Все они получали идентичные задания без дополнительных пояснений, что имитирует типичное использование школьниками.

ChatGPT правильно выполнил 17 из 21 задания. Ошибки были допущены при чтении графика, расчете площади озера Великое и в других задачах.

DeepSeek справился с 18 заданиями. Эта нейросеть неверно определила рейтинг автомобиля, площадь озера и поверхность многогранника.
Perplexity также дал 18 верных ответов. Он ошибся в вычислении длины отрезка в треугольнике, объеме пирамиды и поиске четырехзначного числа.
Все три системы получили прогнозируемую оценку «отлично». Эксперты отмечают, что при более детальной работе с каждым заданием результат мог бы быть идеальным.
Доцент Института прикладных компьютерных наук ИТМО Алексей Комиссаров пояснил, что для решения ЕГЭ можно использовать ИИ двумя способами: как инструмент на основе обученных данных или как агента, способного искать информацию и взаимодействовать с другими системами.
«Самое простое сравнение — это двигатель от машины и машина. До марта 2025 года мы строили двигатели, а сейчас научились строить машины, куда вставляем различные двигатели разной мощности… За последний год мир шагнул сильно-сильно дальше. Сейчас не нейросети, сейчас агенты», — сказал Комиссаров.
Эксперт упомянул тест «Последний экзамен человечества», который включает сложные вопросы для узких специалистов. По его словам, ИИ уже показывает на нем хорошие результаты. «Есть единственный вариант, когда ИИ не может решить ЕГЭ сейчас — это вопросы ЕГЭ поставлены некорректно или неправильно», — отметил он.
Комиссаров добавил, что стопроцентный результат на ЕГЭ может быть недостижим для ИИ из-за возможных расхождений школьной программы с современными научными знаниями. «Возможно, если ему [ИИ] сказать, что это школьный экзамен… и там могут быть неправильные ответы с точки зрения современной науки, то, скорее всего, он сможет решить достаточно хорошо», — заключил преподаватель.



















