Звери, зарплаты и data leak: как разрабатываются задания для олимпиады школьников по ИИ

В этом году участники Всероссийской олимпиады школьников по искусственному интеллекту впервые смогут зачесть ее результаты при поступлении в вузы. Елена Кантонистова, председатель методической комиссии олимпиады и академический руководитель онлайн-магистратуры факультета компьютерных наук «Машинное обучение и высоконагруженные системы», рассказала новостной службе «Вышка.Главное» о том, как ученые ВШЭ составляли задания для соревнований 2023 года, откуда взялась задача об уссурийских тиграх и почему школьникам полезно осваивать ИИ.
Во Всероссийской олимпиаде школьников по искусственному интеллекту могут участвовать ученики 8–11-х классов. Первые два этапа, отборочный и основной, проходят онлайн. Лучшие 50 участников, отобранные по их результатам, приезжают в Москву на заключительный очный финал.
В олимпиаде есть задания по математике, алгоритмам, машинному обучению. В 2023 году в отборочном и основном этапах было по два задания по каждому направлению. В отборочном этапе задания несложные и доступные всем участникам, добросовестно изучившим школьную программу по математике и информатике. В основном этапе задания уже сложнее, а в заключительном — всего две задачи по машинному обучению, но обе довольно непростые.
Елена Кантонистова
В прошлом году большинство членов методической комиссии, которая разрабатывает задания, были сотрудниками факультета компьютерных наук Вышки.
Расскажу подробнее о заданиях по машинному обучению, так как они представляют наибольший интерес и являются основными в олимпиаде. В 2023 году в отборочном этапе была классическая задача регрессии, то есть прогноз на основе набора данных с различными признаками. Участникам нужно было предсказать стоимость домов по различным характеристикам.
Вторая задача была посвящена несложному и интересному анализу данных. Летом один из российских заповедников предоставил нам данные о наблюдениях за животными: например, где и когда видели северных оленей, волков, уссурийских тигров, что они при этом делали и так далее. Участникам нужно было ответить на вопросы по этим данным, от несложных (сколько пропусков в данных, какой зверь встречается людям чаще всего) до довольно хитрых (например, какое животное было замечено осенью 2022 года ближе всего к центру Москвы или какое животное чаще всего уличают в кражах).
Такие несложные, но содержательные по смыслу задачи — очень хорошее подспорье, чтобы заинтересовать школьников, только начинающих свой путь в анализе данных. Для решения не нужно знать никаких сложных алгоритмов, но при этом придется поизучать данные и их особенности, чтобы получить ответ.
В основном этапе задачи были уже сложнее. Одна задача требовала построения рекомендательной системы: на основе информации о пользователях «ВКонтакте» нужно было порекомендовать им группы, которые могут им понравиться. Вторая задача тоже была нестандартная: по описанию вакансии спрогнозировать среднюю зарплату, которую будет получать сотрудник. Для решения этих задач уже нужно иметь опыт в решении разнообразных задач машинного обучения.

Все задачи подобраны таким образом, чтобы от тура к туру их сложность возрастала. Кроме того, нам не хотелось повторяться в темах, поэтому все задачи были разнотипными и из разных областей. Наконец, самое непростое: так как олимпиада имеет статус всероссийской, то в ней не могут использоваться стандартные открытые наборы данных (датасеты). Необходимо было найти новые датасеты для задач, а это всегда большая проблема. В итоге, конечно, все разрешилось: какие-то данные члены методической комиссии собрали сами, а какие-то предоставили коллеги из больших технологических компаний (а также заповедник).
В заключительном этапе была одна относительно несложная задача — предсказать вероятность клика по рекламному объявлению (на табличных данных) — и одна очень интересная: image-text matching. Здесь нужно было обучить модель, которая по паре (картинка и текст) предсказывает степень их смыслового соответствия. Разработчики задач пытались поставить участников в ситуацию из реальной жизни, где данные не идеальны. Особенностями обеих задач был умышленный data leak (утечка данных). При нахождении утечки можно было значительно улучшить качество прогноза в задаче и подняться на первые позиции в рейтинге.
В итоге многие ребята успешно справились с задачами, и участники из топа рейтинга показали очень хорошие результаты.
Для школьников участие в этой олимпиаде не только интересно, но и полезно. Перед каждым этапом проходят подготовительные вебинары — их тоже проводила по большей части команда преподавателей ФКН. После окончания этапов проводились разборы заданий. Также участникам предоставили список материалов для изучения, чтобы им легче было справиться с заданиями олимпиады.
У команды разработчиков было много трудностей. Одна из основных — составить задачи так, чтобы их нельзя было решить современными генеративными моделями (речь, в частности, о ChatGPT). То есть сами задачи не должны быть стандартными, а также должны иметь формулировки, в которых разберется человек, но пока не разбираются генеративные модели. В прошлом году нам удалось составить такие задания. Дальше, конечно, будет сложнее.
В этом году олимпиада примет еще большие масштабы, так как ее результаты можно будет учесть для поступления в вузы. Мы надеемся поучаствовать в составлении заданий и для следующих олимпиад.
Вам также может быть интересно:
Школьники из 34 стран мира приняли участие в первой Международной олимпиаде по промышленной разработке PROD
В Москве прошла церемония награждения победителей и призеров первой Международной олимпиады по промышленной разработке PROD. В ней приняли участие более 4 тысяч старшеклассников из всех регионов России и еще 33 стран, включая Армению, Бразилию, Германию, Грузию, Данию, Израиль, Индонезию, Китай, Конго, Лаос, Либерию, США, Южную Корею и Японию.
Ученые Вышки научили нейросеть «слышать» неисправности в электродвигателях
Ученые Института искусственного интеллекта и цифровых наук (ИИиЦН) факультета компьютерных наук НИУ ВШЭ разработали метод Signature-Guided Data Augmentation (SGDA), который способен с точностью 99% определять неисправность двигателей и с точностью 86% классифицировать типы возникших поломок. Применение этой разработки может снизить расходы на ремонт промышленного оборудования, уменьшить простои и сделать производство безопаснее. Результаты исследования опубликованы в журнале Engineering Applications of Artificial Intelligence.
«Подготовка инженеров нового поколения невозможна без интеграции инструментов ИИ в отраслевые ОП»
26 февраля в Уфе на площадке Межвузовского студенческого кампуса Евразийского научно-образовательного центра прошла защита итоговых проектов пилотного курса образовательной программы «ИИ-инженерия в нефтегазовой отрасли». Эксперты НИУ ВШЭ оценили студенческие проекты в сфере искусственного интеллекта, выполненные для «Газпрома» в рамках федерального проекта «Экономика данных и цифровая трансформация государства».
Стартует набор на онлайн-программу повышения квалификации «Основы ИИ-агентов для автоматизации процессов»
В Центре непрерывного образования факультета компьютерных наук НИУ ВШЭ открыт набор на новую онлайн-программу повышения квалификации «Основы ИИ-агентов для автоматизации процессов». Программа разработана для тех, кто стремится перейти от базового использования нейросетей в формате чат-ботов к созданию прикладных интеллектуальных инструментов для автоматизации бизнес-задач. Курс ориентирован на слушателей, заинтересованных в практическом освоении современных подходов к разработке автономных ИИ-агентов на базе больших языковых моделей и их внедрении в рабочие процессы.
Заключительный этап олимпиады «Высшая проба» прошел в 31 городе России
Всероссийская олимпиада школьников «Высшая проба» входит в число крупнейших интеллектуальных состязаний и хорошо известна старшеклассникам. В этом году олимпиадные состязания проводятся по 28 профилям, и все они включены в Перечень олимпиад школьников на 2025/26 год. В этот раз интерес к олимпиаде проявили 75 855 школьников.
Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве
Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.
В Вышке продолжается набор на программу «ИИ-лидеры: бизнес-лаборатория для руководителей»
26 февраля на факультете компьютерных наук стартует 6-месячное очное обучение. О программе рассказывает ее автор и руководитель Евгений Соколов, научный руководитель Центра непрерывного образования ФКН.
Школьники и космос: названы победители «Высшего пилотажа» по спутникостроению
Состоялся заключительный этап Всероссийского конкурса «Высший пилотаж» по направлению «Спутникостроение и геоинформационные технологии: Terra Notum». Защитить свой проект можно было в онлайн-формате или очно в корпусе Московского института электроники и математики им. А.Н. Тихонова ВШЭ.
«Если все вовлечены в процесс, можно найти решение практически любой задачи»
Продолжается регистрация на «Твой проект» — интеллектуальный командный конкурс по созданию проектов для решения практических кейсов от индустриальных партнеров и подразделений НИУ ВШЭ. Успешное участие помогает упростить поступление в магистратуру на ряд программ и усовершенствовать мягкие и профессиональные навыки. Организаторы инженерных направлений конкурса и студенты, успешно защитившие проекты в 2025 году, рассказали подробнее о состязании.
«Я — профессионал»: ВШЭ — в лидерах по числу студентов в заключительном этапе
С сентября самые талантливые студенты со всей страны боролись за право стать частью вселенной карьерных возможностей «Я — профессионал» и получить доступ к бонусам при поступлении в магистратуру Высшей школы экономики, стажировкам в известных компаниях-партнерах («Яндекс», Сбербанк, ВТБ, РЖД и др.) и денежному вознаграждению до 300 000 рублей. Вышка вошла в число лидеров по количеству студентов, прошедших в заключительный этап олимпиады «Я — профессионал», который состоится с февраля по апрель 2026 года.


