Исследователи НИУ ВШЭ выяснили, как нейросети понимают каламбуры

Международная команда с участием исследователей ФКН НИУ ВШЭ представила KoWit-24 — корпус из 2700 русскоязычных заголовков «Коммерсанта» с игрой слов. Корпус позволил оценить, как искусственный интеллект распознает и объясняет языковую игру. Эксперименты с пятью большими языковыми моделями подтвердили: даже передовые системы пока ошибаются, причем интерпретация игры слов является для них более сложной задачей, чем ее выявление. Результаты работы были представлены на конференции RANLP, cтатья доступна в репозитории Arxiv.org, датасет и код для воспроизведения экспериментов — в GitHub.
Игра слов — это прием, когда автор специально ломает норму языка ради эффекта: чтобы привлечь внимание, усилить иронию или вызвать улыбку. В российских новостных заголовках такие приемы встречаются часто и могут выглядеть по-разному. Например, «Особо бумажные персоны» обыгрывает фразу «особо важные персоны»: «важные» рифмуются с «бумажные», и смысл сдвигается к производству бумаги. Или «Код накликал» звучит почти так же, как идиома «кот наплакал» (очень мало), что создает шутливую двусмысленность.
Для читателя такая игра слов очевидна и заголовки не нуждаются в пояснении. Однако современные большие языковые модели, например ChatGPT или GigaChat Max, часто теряются: им трудно заметить каламбур и тем более объяснить, на чем построена шутка. Одна из причин — это ограниченность наборов данных, на которых обучаются языковые модели. Чаще всего юмор в них представлен короткими шутками из интернета, которые помечены ярлыком «шутка». Этого мало, чтобы алгоритм понял, почему это смешно. Кроме того, у таких наборов почти нет разметки — понятных машине и человеку слоев описания, которые могут показывать, есть ли там игра слов или нет, какой это тип приема, к чему отсылает заголовок и т.д.
Исследователи факультета компьютерных наук НИУ ВШЭ вместе с коллегами из Австрийского университета междисциплинарных трансформаций, а также независимыми исследователями создали набор данных KoWit-24. Он содержит 2700 заголовков «Коммерсанта» за январь 2021 года — декабрь 2023-го с контекстом: к каждому заголовку приложены подводка к статье, название рубрики и краткое описание сюжета. Для примеров с игрой слов авторы вручную отметили тип приема, выделили «якоря» — ключевые слова, где происходит смысловой сдвиг, указали исходные выражения и добавили ссылки на статьи в «Википедии» там, где это возможно.
Авторы работы использовали определение лингвиста Алана Скотта Партингтона: игра слов возникает, когда одна и та же фраза читается минимум двумя способами, и этот эффект не случаен. При этом игра слов может возникать в нескольких случаях. Первый, когда двусмысленность заложена в самом слове или в его звучании. Например, заголовок «“Волгу” не могут заставить течь быстрее»: «Волга» здесь и река, и название федеральной трассы. Второй — легкая переделка известной фразы или названия: автор меняет форму, а читатель узнает исходник и достраивает шутку. Например, «Миссия сократима» отсылает к фильму «Миссия невыполнима» и одновременно намекает, что дипломатическую миссию можно сократить.
Исследователи отдельно выделили окказионализмы (разовые неологизмы под задачу) и оксюмороны (сочетание противоположных смыслов). Все это позволило не только собрать и описать примеры, но и сравнить разные языковые модели между собой.
После разметки авторы проверили корпус на пяти больших языковых моделях: GPT-4o, YandexGPT4, GigaChat Lite, GigaChat Max и Mistral NeMo. Моделям давали заголовок и подводку к новости и просили решить две задачи: сначала определить, есть ли в заголовке игра слов, а затем объяснить ее, то есть назвать исходную фразу или отсылку. При этом исследователи сравнивали два режима подсказок: короткий вопрос «Есть ли игра слов?» и расширенную инструкцию, в которой объясняется, что считать игрой слов, и приводятся примеры разных типов. Трем моделям из пяти более подробные инструкции помогали в распознавании игры слов, а лучшую точность показала GPT-4o. При этом интерпретировать источник шутки всем моделям заметно сложнее, чем просто фиксировать, что игра слов есть.
Павел Браславский
«KoWit-24 закрывает две ключевые проблемы прежних наборов — дает контекст к каждому заголовку и многоуровневую разметку. Это превращает подборку примеров в полноценный “тестовый стенд” для ИИ. Теперь можно объективно сравнивать модели между собой: видит ли модель сам факт игры слов, находит ли “якорь”, правильно ли восстанавливает исходную фразу или отсылку. Такие проверяемые метрики помогают не только точнее оценивать текущие системы, но и целенаправленно их улучшать — подбирать формулировки подсказок, обучающие примеры и стратегии проверки фактов. В будущем мы хотим исследовать, можно ли с помощью этого набора улучшить генерацию шуток», — отмечает один из авторов работы, доцент факультета компьютерных наук НИУ ВШЭ Павел Браславский.
Кроме того, корпус задает общий понятный стандарт оценки: исследователи работают с одними и теми же данными и сценариями экспериментов. Это уменьшает «шум» в результатах и помогает создавать модели, которые лучше понимают живой язык, а не просто следят за логикой текста.
Вам также может быть интересно:
Студенты Вышки — среди победителей акселератора высокотехнологичных стартапов от «Яндекса»
«Яндекс» подвел итоги акселератора Yandex AI Startup Lab, в финальный раунд которого вышли 12 ИТ-проектов. Их создатели, студенты и молодые предприниматели, вместе с экспертами компании три месяца работали над развитием своих продуктов. Четыре стартапа в сферах цифрового маркетинга, медицины и робототехники признаны лучшими: их команды получили денежные призы и гранты на облачные ресурсы. В их числе и стартап Gradius от студентов НИУ ВШЭ .
AI AWARDS 2026: аналитическую основу премии формирует iFORA НИУ ВШЭ
Высшая школа экономики вошла в число партнеров премии AI AWARDS 2026, которая пройдет 29 апреля в Москве. Проект, реализуемый командой «Билайн Big Data & AI», посвящен практическому применению искусственного интеллекта и объединяет компании, технологии и команды, которые уже сегодня влияют на развитие новой цифровой экономики. Вклад номинантов AI AWARDS в развитие ИИ анализируется на основе данных, поэтому качество аналитической базы и прозрачность методологии становятся для рынка принципиально важными.
НИУ ВШЭ и Альфа-Банк запускают исследовательские проекты в сфере искусственного интеллекта
НИУ ВШЭ и Альфа-Банк объявили о старте трех совместных проектов в области искусственного интеллекта. Они направлены на развитие аналитических инструментов для банковских сервисов — от более точных прогнозов до новых подходов к управлению рисками и персонализации клиентского опыта.
Участники «Я — профессионал» разработают ИИ-агентов для бизнеса на Весенней экономической школе Вышки и Сбера
На площадке СберУниверситета стартовала Весенняя экономическая школа, организованная Высшей школой экономики и Сбером для участников Всероссийской олимпиады студентов «Я — профессионал» Президентской платформы «Россия — страна возможностей». С 22 по 24 апреля студенты будут работать над созданием ИИ-агента для бизнеса — от идеи и научной гипотезы до прототипа, готового к защите перед экспертами.
Уже не выбор, а реальность: трансформация мира под влиянием ИИ
Искусственный интеллект уже не воспринимается как технология будущего: он стремительно меняет процессы принятия решений, рынок труда и социальные практики. Вместе с тем он несет с собой не только новые грандиозные возможности, но и системные риски, связанные с ростом зависимости от данных, трансформацией профессий и изменением человеческого поведения. В НИУ ВШЭ создали семантическую карту разломов, которая показала ключевые тренды в развитии технологий.
НИУ ВШЭ и ДИТ Москвы подписали соглашение о развитии сети 5G и 6G
Департамент информационных технологий города Москвы и Высшая школа экономики подписали соглашение о сотрудничестве в области инновационного развития ИТ-инфраструктуры столицы. Стороны договорились о совместных исследованиях в области современных и перспективных технологий связи, включая 5G и 6G, а также ИИ, интернета вещей и других технологий умного города.
НИУ ВШЭ представил результаты исследований на конференции по ИИ в Омане
В апреле 2026 года в Университете Низвы (Султанат Оман) состоялась Международная конференция по интеллектуальным системам и приложениям искусственного интеллекта (ISAA 2026). Высшая школа экономики выступила соорганизатором мероприятия совместно с Университетом Низвы и Университетом технологий и прикладных наук Ибри. Ученые НИУ ВШЭ также вошли в число ключевых спикеров конференции.
Роботы, хакатон и соревнования: в Вышке прошел фестиваль робототехники
IV Фестиваль робототехники факультета компьютерных наук НИУ ВШЭ объединил школьников, студентов и ведущих разработчиков — всего более 800 участников. В течение трех дней на площадке университета проходили соревнования, лекции и демонстрации технологий. Впервые состоялся хакатон по программированию роборуки и презентация антропоморфного робота.
Почему искусственный интеллект не способен поработить человечество
1 апреля на факультете математики НИУ ВШЭ встретили российского ученого, преподавателя и специалиста по информационной безопасности Андрея Масаловича, известного как КиберДед. Он представил студентам Вышки свои «Двадцать вопросов искусственному интеллекту» и поделился ответами, раскрывающими суть проблем в сфере развития ИИ, а также рассказал, почему тот никогда не сможет захватить человечество.
Тест «КардиоЖизнь» Вышки — в числе победителей премии Data Fusion Awards 2026
Разработка ученых Центра биомедицинских исследований и технологий Института ИИ и цифровых наук ФКН ВШЭ — генетический тест «КардиоЖизнь» — одержала победу в Общероссийской кросс-отраслевой премии в области технологий работы с данными и ИИ Data Fusion Awards. Проект занял первое место в номинации «Партнерство науки и бизнеса», показав успешную модель трансфера технологий из университетской науки в реальный сектор здравоохранения.


