OpenAI и Google превосходят математиков, но не друг друга

Модели искусственного интеллекта от OpenAI и Google DeepMind завоевали золотые медали на Международной математической олимпиаде (IMO) 2025 года — одном из старейших и самых сложных в мире соревнований по математике на уровне старших классов средней школы, о чем компании независимо друг от друга объявили на днях.

Результаты подчёркивают, насколько быстро развиваются системы искусственного интеллекта, и насколько равными кажутся Google и OpenAI в гонке ИИ. Компании, занимающиеся ИИ, яростно борются за общественное восприятие лидерства в гонке ИИ: это неуловимая борьба «аудиторий», которая может иметь серьёзные последствия для привлечения ведущих специалистов в области ИИ. Многие исследователи ИИ имеют опыт работы в соревновательной математике, поэтому такие бенчмарки, как IMO, значат больше, чем другие.

В прошлом году Google завоевала серебряную медаль на IMO, используя «формальную» систему, которая требовала от людей перевода задач в машиночитаемый формат. В этом году OpenAI и Google представили на конкурс «неформальные» системы, способные обрабатывать вопросы и генерировать обоснованные ответы на естественном языке. Обе компании утверждают, что их модели ИИ правильно ответили на пять из шести вопросов теста IMO, набрав больше баллов, чем большинство старшеклассников и прошлогодняя модель ИИ от Google, без необходимости перевода человеком-машиной.

В интервью TechCrunch исследователи, стоящие за проектами OpenAI и IMO от Google, заявили, что эти золотые медали представляют собой прорыв в области моделей рассуждений ИИ в непроверяемых областях. Хотя модели рассуждений ИИ, как правило, хорошо справляются с вопросами с простыми ответами, такими как простые математические задачи или задачи по программированию, эти системы испытывают трудности с задачами с более неоднозначными решениями, такими как покупка хорошего стула или помощь в сложных исследованиях.

Однако Google ставит под сомнение результаты OpenAI, которые она продемонстрировала и объявила о своей золотой медали на IMO. В конце концов, если вы собираетесь использовать модели ИИ на математическом конкурсе для старшеклассников, то можете рассуждать как подростки.

Вскоре после того, как OpenAI объявила о своем достижении в субботу утром, генеральный директор и исследователи Google DeepMind выступили в социальных сетях с критикой OpenAI за преждевременное объявление о присуждении золотой медали — вскоре после того, как в пятницу вечером IMO объявила, какие старшеклассники стали победителями соревнования, — и за то, что IMO не провела официальную оценку тестирования их модели.

Кстати, мы не объявляли об этом в пятницу, потому что уважали первоначальную просьбу Совета ИМО о том, чтобы все лаборатории ИИ делились своими результатами только после того, как официальные результаты будут проверены независимыми экспертами, а студенты по праву получат заслуженное признание.
— Демис Хассабис (@demishassabis) 21 июля 2025 г.

Тханг Луонг, старший научный сотрудник Google DeepMind и руководитель проекта IMO, рассказал TechCrunch, что Google отложила объявление результатов IMO из уважения к студентам, участвовавшим в конкурсе.

Мероприятие Techcrunch

Сан-Франциско | 27–29 октября 2025 г.

Луонг сказал, что Google сотрудничает с организаторами IMO с прошлого года, готовясь к тестированию, и хотела получить благословение и официальную оценку президента IMO, прежде чем объявить официальные результаты, что и было сделано в понедельник утром .

«У организаторов ИМО есть свои правила оценки, — сказал Луонг. — Поэтому любая оценка, не основанная на этих правилах, не может претендовать на золотой уровень [результатов]».

Ноам Браун, старший исследователь OpenAI, работавший над моделью IMO, рассказал TechCrunch, что несколько месяцев назад IMO обратилась к OpenAI с предложением принять участие в официальном математическом соревновании, но создатель ChatGPT отказался, поскольку работал над системами естественного языка, которые, по его мнению, были более интересными. Браун утверждает, что OpenAI не знала о проведении IMO неофициального тестирования совместно с Google.

Компания OpenAI заявила, что наняла сторонних оценщиков — трёх бывших медалистов IMO, которые разбирались в системе оценок, — для оценки эффективности своей модели искусственного интеллекта. По словам Брауна, после того, как OpenAI узнала о своей золотой медали, компания связалась с IMO, которая попросила компанию подождать с объявлением результатов до церемонии награждения IMO в пятницу вечером.

IMO не отреагировала на просьбу TechCrunch прокомментировать ситуацию.

Google не обязательно ошибается — компания действительно прошла более официальную и строгую процедуру отбора, чтобы получить золотую медаль, — но в ходе дискуссии может быть упущена из виду общая картина: модели ИИ из нескольких ведущих лабораторий ИИ быстро совершенствуются. В этом году страны со всего мира отправили на IMO своих самых талантливых студентов, и лишь несколько процентов из них показали такие же высокие результаты, как модели OpenAI и Google.

Хотя раньше OpenAI значительно лидировала в отрасли, сейчас, безусловно, похоже, что конкуренция гораздо более напряжённая, чем любая компания готова признать. Ожидается, что OpenAI выпустит GPT-5 в ближайшие месяцы, и компания, безусловно, надеется создать впечатление, что она по-прежнему лидирует в индустрии ИИ.

techcrunch

OpenAI и Google превосходят математиков, но не друг друга

Кстати, мы не объявляли об этом в пятницу, потому что уважали первоначальную просьбу Совета ИМО о том, чтобы все лаборатории ИИ делились своими результатами только после того, как официальные результаты будут проверены независимыми экспертами, а студенты по праву получат заслуженное признание.
— Демис Хассабис (@demishassabis) 21 июля 2025 г.

Мероприятие Techcrunch

Сан-Франциско | 27–29 октября 2025 г.

IMO не отреагировала на просьбу TechCrunch прокомментировать ситуацию.

techcrunch

OpenAI и Google превосходят математиков, но не друг друга

Похожие новости

OpenAI и Google превосходят математиков, но не друг друга

Похожие новости

Можно ли рассчитывать на конфиденциальность на публике? В центре внимания сага Coldplay о поцелуях на камеру.

Отдайте свою старую фритюрницу в Shark Ninja и получите что-то гораздо лучшее за меньшие деньги.

Все пользователи Android предупреждены о наиболее «рискованных» приложениях. Сколько их установлено на вашем телефоне?

Latent Labs запускает веб-модель искусственного интеллекта для демократизации разработки белков

Samsung предлагает вам бесплатное обновление Galaxy, но предложение действует до конца недели.