фев

2026

Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве

Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.

Большие языковые модели, такие как ChatGPT и LLaMA, показывают впечатляющие результаты в генерации текста, переводе и других задачах, но их огромный размер делает их дорогими в использовании и хранении. Традиционные методы сжатия — уменьшение точности чисел, удаление лишних связей или упрощение структуры — часто требуют долгого дообучения модели и могут ухудшить ее работу. Ученые искали способ сократить объем модели быстро и без потери ее интеллекта.

Исследователи НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН факультета компьютерных наук НИУ ВШЭ предложили метод ProcrustesGPT, основанный на идее, что выходные данные модели не меняются, если применить к ее внутренним весам специальные ортогональные преобразования — своего рода математические повороты. Как объясняют ученые, это такое преобразование пространства, которое может как угодно повернуть или перевернуть картинку, но не может растянуть или сжать ни один объект. Например, если взять лист бумаги с нарисованным на нем треугольником, то можно перевернуть или повернуть его под любым углом — длины сторон и углы между ними останутся точно такими же. В математике такое преобразование и называется ортогональным. Эти преобразования подбираются так, чтобы веса модели лучше поддавались сжатию с помощью структурированных матриц — математических конструкций, которые занимают гораздо меньше памяти.

Екатерина Гришина

Екатерина Гришина, стажер-исследователь НУЛ матричных и тензорных методов в машинном обучении, объясняет: «В основе нашей работы лежит изящная математическая концепция — задача Прокруста. Как и мифический герой, подгонявший путников под свое ложе, этот метод помогает найти идеальное ортогональное преобразование, которое подгоняет веса модели под простую структуру без искажения ее сути. Именно эта идея дала имя нашему методу — ProcrustesGPT — и стала ключом к сжатию без значительной потери качества».

В рамках работы были опробованы два типа таких структур: суммы кронекеровских произведений и GS-матрицы. Метод не требует дообучения модели, работает быстро и может применяться к уже существующим моделям. Эксперименты проводились на открытых моделях OPT и LLaMA2.

Новый метод ProcrustesGPT демонстрирует эффективность: он позволяет уменьшить объем больших языковых моделей на треть, а точнее, на 25–36% от исходного размера, сохранив при этом их интеллектуальные способности. Сжатые модели показывают результаты, близкие к оригиналам: на генерации связного текста и решении логических задач они сохраняют от 90 до 95% своей первоначальной эффективности.

В сравнении с другими современными методами сжатия, например SliceGPT, который также не требует длительного дообучения, ProcrustesGPT в большинстве тестов оказался точнее. Особенно ярко это преимущество проявляется при работе с моделями семейства LLaMA2, на которых разработанный подход опережает аналог на 9–10%.

Максим Рахуба

Максим Рахуба, заведующий НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН НИУ ВШЭ, рассказывает: «Методы сжатия помогают ускорять внедрение больших языковых моделей в устройства с ограниченными ресурсами, такие как мобильные устройства и IoT-гаджеты, что делает ИИ более доступным и распространенным в повседневной жизни».

Дата

17 февраля

Рубрики

Наука

Темы

публикации исследования и аналитика Программа развития 2030 Вышка технологическая искусственный интеллект Приоритет 2030

В статье упомянуты

Институт искусственного интеллекта и цифровых наук, Научно-учебная лаборатория матричных и тензорных методов в машинном обучении, Факультет компьютерных наук

Персоны

Гришина Екатерина Романовна

Рахуба Максим Владимирович

Вам также может быть интересно:

июл

2026

В НИУ ВШЭ появится суперкомпьютер для работы с ИИ

Высшая школа экономики готовит к запуску второй суперкомпьютер. Новый кластер будет ориентирован прежде всего на задачи ИИ и дополнит уже действующий суперкомпьютер cHARISMa. Его запуск планируется на конец 2026 года.

20 июля

июл

2026

В НИУ ВШЭ создан Фонд науки и технологий

Фонд науки и технологий НИУ ВШЭ (ФНТ) будет финансировать перспективные научные инициативы, имеющие прикладную направленность и содействующие достижению технологического лидерства России. На поддержку могут рассчитывать проектные команды из всех кампусов университета. Заявку в ФНТ можно подать в любой момент. Рассматривать заявки будет созданный Совет по науке и технологиям НИУ ВШЭ.

15 июля

июл

2026

Нейросеть НИУ ВШЭ iFORA.LLM включена в Реестр российского программного обеспечения

Адаптированная большая языковая модель для сферы науки, технологий и инноваций (далее — iFORA.LLM, модель), разработанная экспертами Института статистических исследований и экономики знаний НИУ ВШЭ, включена в Реестр российского ПО. Модель создана для эффективного анализа массивов научно-технической информации — от поиска релевантных публикаций до оценки технологических трендов и формирования аналитических отчетов.

14 июля

июл

2026

Новый метод НИУ ВШЭ и Т-Технологий повышает качество работы ИИ

Ученые из лаборатории научных исследований «Т-Технологий» и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ разработали новый метод семплирования для моделей маскированной диффузии — G-Star+. Он помогает быстрее и качественнее исправлять ошибки во время генерации текста и кода за небольшое число шагов. Метод показал эффективность в задачах генерации текста и кода и может применяться там, где генеративным моделям нужно быстро и качественно создавать текст или код при ограниченных вычислительных ресурсах.

9 июля

июл

2026

Студенты МИЭМ ВШЭ разработают два спутника собственной конструкции для орбитальных экспериментов

Аппараты, созданные студенческими командами, проведут в условиях космоса исследования свойств перспективных солнечных элементов, бортовых систем накопления энергии и серийной электроники для студенческих спутников.

7 июля

июл

2026

В Вышке открыли проектно-учебную лабораторию совместно с Группой «Т-Технологии»

Группа «Т-Технологии» (головная структура Т-Банка) открыла проектно-учебную лабораторию на базе факультета компьютерных наук НИУ ВШЭ (ФКН НИУ ВШЭ). Проектно-учебная лаборатория Группы «Т-Технологии» в НИУ ВШЭ сосредоточится на проектах и задачах в области искусственного интеллекта, распределенных вычислений, анализа больших данных и информационной безопасности в финансовом секторе. Лабораторию возглавит Алексей Теплов, кандидат физико-математических наук.

3 июля

июн

2026

«Защищать конкуренцию от ИИ нам придется с помощью самого искусственного интеллекта»

В НИУ ВШЭ прошел двухдневный семинар «Искусственный интеллект и конкурентная политика в странах БРИКС». Его участники обсудили две ключевые для конкурентной политики темы: трансформация конкуренции и рынков под влиянием технологий ИИ и усилени е регуляторного потенциала антимонопольных органов за счет технологий искусственного интеллекта.

26 июня

июн

2026

В НИУ ВШЭ создали базу данных по производственным цепочкам мирового ВПК

Институт мировой военной экономики и стратегии (ИМВЭС) НИУ ВШЭ разработал новый аналитический инструмент для изучения оборонной промышленности зарубежных стран. База данных «Производственные цепочки мирового ВПК» показывает взаимосвязи между производителями на разных уровнях — от конечных систем до комплектующих.

22 июня

июн

2026

Институт робототехнических систем ВШЭ запустил научно-технический семинар

Институт робототехнических систем (ИРС) ВШЭ запустил новый ежемесячный формат — Научно-технический семинар. Он объединяет сотрудников института, приглашенных экспертов, студентов, исследователей и представителей других подразделений НИУ ВШЭ для обсуждения актуальных задач мехатроники, робототехники и киберфизических систем.

15 июня

июн

2026

В НИУ ВШЭ разработали сервис обезличивания табличных данных для безопасного использования в ИИ-системах

Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал сервис обезличивания табличных данных, предназначенный для подготовки корпоративных данных к использованию в аналитических и ИИ-сервисах. Решение позволяет выявлять персональные данные в структурированных наборах, применять к ним воспроизводимые правила обезличивания и формировать артефакты, необходимые для контроля качества, аудита и последующего использования данных в защищенных контурах.

15 июня