• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве

Ученые НИУ ВШЭ научились сжимать большие языковые модели без потерь в качестве

© iStock

Исследователи из Института искусственного интеллекта и цифровых наук (Институт ИИиЦН) ФКН НИУ ВШЭ разработали новый метод сжатия больших языковых моделей, таких как GPT и LLaMA, который позволяет уменьшить их объем на 25–36% без дополнительного обучения и значительной потери в точности. Это первый подход, который использует математические преобразования — вращения весов модели, — чтобы сделать модели более удобными для сжатия с помощью структурированных матриц. Результаты исследования опубликованы в ACL Findings 2025. Код метода доступен на GitHub.

Большие языковые модели, такие как ChatGPT и LLaMA, показывают впечатляющие результаты в генерации текста, переводе и других задачах, но их огромный размер делает их дорогими в использовании и хранении. Традиционные методы сжатия — уменьшение точности чисел, удаление лишних связей или упрощение структуры — часто требуют долгого дообучения модели и могут ухудшить ее работу. Ученые искали способ сократить объем модели быстро и без потери ее интеллекта.

Исследователи НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН факультета компьютерных наук НИУ ВШЭ предложили метод ProcrustesGPT, основанный на идее, что выходные данные модели не меняются, если применить к ее внутренним весам специальные ортогональные преобразования — своего рода математические повороты. Как объясняют ученые, это такое преобразование пространства, которое может как угодно повернуть или перевернуть картинку, но не может растянуть или сжать ни один объект. Например, если взять лист бумаги с нарисованным на нем треугольником, то можно перевернуть или повернуть его под любым углом — длины сторон и углы между ними останутся точно такими же. В математике такое преобразование и называется ортогональным. Эти преобразования подбираются так, чтобы веса модели лучше поддавались сжатию с помощью структурированных матриц — математических конструкций, которые занимают гораздо меньше памяти.  

Екатерина Гришина

Екатерина Гришина, стажер-исследователь НУЛ матричных и тензорных методов в машинном обучении, объясняет: «В основе нашей работы лежит изящная математическая концепция — задача Прокруста. Как и мифический герой, подгонявший путников под свое ложе, этот метод помогает найти идеальное ортогональное преобразование, которое подгоняет веса модели под простую структуру без искажения ее сути. Именно эта идея дала имя нашему методу — ProcrustesGPT — и стала ключом к сжатию без значительной потери качества».

В рамках работы были опробованы два типа таких структур: суммы кронекеровских произведений и GS-матрицы. Метод не требует дообучения модели, работает быстро и может применяться к уже существующим моделям. Эксперименты проводились на открытых моделях OPT и LLaMA2.

Новый метод ProcrustesGPT демонстрирует эффективность: он позволяет уменьшить объем больших языковых моделей на треть, а точнее, на 25–36% от исходного размера, сохранив при этом их интеллектуальные способности. Сжатые модели показывают результаты, близкие к оригиналам: на генерации связного текста и решении логических задач они сохраняют от 90 до 95% своей первоначальной эффективности.

В сравнении с другими современными методами сжатия, например SliceGPT, который также не требует длительного дообучения, ProcrustesGPT в большинстве тестов оказался точнее. Особенно ярко это преимущество проявляется при работе с моделями семейства LLaMA2, на которых разработанный подход опережает аналог на 9–10%.

Максим Рахуба

Максим Рахуба, заведующий НУЛ матричных и тензорных методов в машинном обучении Института ИИиЦН НИУ ВШЭ, рассказывает: «Методы сжатия помогают ускорять внедрение больших языковых моделей в устройства с ограниченными ресурсами, такие как мобильные устройства и IoT-гаджеты, что делает ИИ более доступным и распространенным в повседневной жизни». 

Вам также может быть интересно:

Технодень МИЭМ ВШЭ: праздник технологий и старт новых партнерств

В атриуме на Покровке прошел масштабный фестиваль технологических решений инженерных проектных команд Московского института электроники и математики ВШЭ, где были представлены лучшие студенческие разработки и совместные мастерские МИЭМ и партнеров. Кроме того, в рамках события прошел круглый стол, посвященный вопросам инженерного образования, и были подписаны новые соглашения о сотрудничестве с компаниями – технологическими лидерами в своих отраслях деятельности.

Высшая школа экономики и «Ростелеком» поддержат ИИ-стартапы для госсектора

НИУ ВШЭ и «Ростелеком» подписали на ПМЭФ-2026 соглашение о сотрудничестве в рамках реализации акселератора ИИ-решений для государственного сектора. Совместная работа позволит объединить технологическую экспертизу крупнейшего цифрового партнера государства и академический потенциал ведущего исследовательского университета страны.

Проблемы этики: как и где использовать ИИ

За последние годы этика в сфере искусственного интеллекта превратилась из философско-теоретической в прикладную дисциплину. Эксперты в НИУ ВШЭ обсудили, какие этические проблемы возникают в связи со стремительным развитием цифровизации и какие их инженерные решения могут быть предложены.

НИУ ВШЭ второй год подряд на первом месте рейтинга вузов Альянса в сфере ИИ

Альянс в сфере искусственного интеллекта опубликовал рейтинг российских высших учебных заведений по качеству подготовки кадров для работы с ИИ. Высшая школа экономики второй год занимает первую строчку рейтинга, оставаясь единственным университетом в категории A++.

Институт искусственного интеллекта и цифровых наук ВШЭ представил платформу предиктивной аналитики для бизнеса

Институт искусственного интеллекта и цифровых наук ФКН ВШЭ разработал Predict Core — унифицированное алгоритмическое ядро предиктивной аналитики. Платформа переводит работу с данными из режима отчетности постфактум в управленческую привычку с прогнозами, интерпретацией и понятным следом, показывающим, как была получена эта цифра.

НИУ ВШЭ и МТС договорились об обмене ИИ-компетенциями при подготовке инженерных кадров для телекома

НИУ ВШЭ и ПАО «МТС» заключили соглашение о стратегическом партнерстве, которое предполагает подготовку кадров с ИИ-компетенциями для телекоммуникационной отрасли по программам высшего и дополнительного профессионального образования. Соглашение направлено на повышение качества образования, обмен экспертизой и компетенциями при подготовке инженеров, владеющих технологиями ИИ и машинного обучения.

Студенты ФКН НИУ ВШЭ разработали ИИ-решения для прогнозирования и маркетинга

24 мая в Вышке состоялись защиты и церемония награждения хакатона по машинному обучению для ретейла, организованного MAGNIT TECH и факультетом компьютерных наук НИУ ВШЭ. В течение четырех дней команды работали над индустриальными кейсами технологичного драйвера крупнейшего ретейлера страны — компании «Магнит». Участники анализировали данные, обучали модели, проверяли гипотезы и защищали свои решения перед экспертами компании, чтобы в итоге не только добиться высокого качества моделей, но и предложить подходы для использования в реальном бизнесе.

Образовательный марафон для учителей: как ФКН ВШЭ выстраивает диалог с педагогами

В рамках фестиваля «Дни компьютерных наук» ФКН НИУ ВШЭ на базе учебного центра «Вороново» прошел первый Образовательный марафон для учителей информатики и математики. Всего в мероприятии приняли участие 76 педагогов, представлявших разные регионы России, а также участники из Витебска (Беларусь) и Вьентьяна (Лаос).

Точка входа в ИИ: на ЦИПР обсудили влияние технологий на будущее

Участники ЦИПР-2026 обсудили, как офисные приложения могут стать точкой массового доступа к ИИ и снизить барьеры использования. Эксперты сошлись во мнении, что будущее — за адаптивными моделями и экосистемным подходом к корпоративным данным. В экспертных дискуссиях приняли участие представители НИУ ВШЭ.

«Входить в сферу робототехники сейчас — значит расти вместе с направлением»

Беспилотный транспорт, роботы-курьеры и умные колонки стремительно становятся частью нашей жизни. В 2026 году факультет компьютерных наук НИУ ВШЭ открывает новый бакалавриат«Проектирование интеллектуальных робототехнических систем» (ПИРС). Здесь будут готовить специалистов на стыке ИТ, искусственного интеллекта и робототехники. О том, как устроена учеба и почему выпускников программы «точно возьмут в будущее», рассказывает академический руководитель ПИРС Вадим Моргачёв.