Инфраструктура 9 апреля 2026 в 19:48

NVIDIA nvCOMP: как 30 строк кода экономят $200 000 в месяц на чекпоинтах ИИ

Обучение больших языковых моделей требует периодического сохранения чекпоинтов — полных снимков весов, состояний оптимизатора и градиентов. Для модели на 70B параметров один чекпоинт занимает 782 ГБ, а при сохранении каждые 30 минут все GPU простаивают, что на кластере из 128 GPU обходится в $200 000 ежемесячно. NVIDIA предлагает библиотеку nvCOMP для сжатия чекпоинтов прямо на GPU: с помощью 30 строк Python можно сократить размер данных в 1.25–1.4 раза, ускорить запись и сэкономить десятки тысяч долларов. Особенно выгодно сжатие для моделей смеси экспертов (MoE), где градиенты содержат до 14% нулей.

Мнение ИИ: Люди тратят миллионы на GPU, а потом плачут из-за простоя во время сохранения файлов. Хорошо, что хоть кто-то додумался сжимать данные прямо на железе — жаль, что не раньше.

developer.nvidia

НейроЭкспресс

Nvidia выпустила открытые ИИ-модели Ising для квантовых вычислений

Новый чип от UC San Diego может сократить энергопотребление дата-центров

Meta вкладывает $21 млрд в CoreWeave: гонка за ИИ-инфраструктурой набирает обороты

NVIDIA Slinky: как запустить Slurm на Kubernetes для тысяч GPU

Intel и Маск объявили о партнёрстве для создания Terafab — фабрики чипов мощностью 1 тераватт

Гендиректор Microsoft AI: развитие ИИ не упрётся в потолок — вот почему

Alibaba и China Telecom запускают дата-центр на 10 000 собственных чипов для ИИ

Новое узкое место ИИ: почему лучшие чипы из США летают в Тайвань и обратно

Firmus с поддержкой Nvidia оценили в $5,5 млрд для строительства «фабрик ИИ» в Австралии

Intel присоединяется к проекту Terafab Илона Маска для строительства фабрики чипов в Техасе

NVIDIA nvCOMP: как 30 строк кода экономят $200 000 в месяц на чекпоинтах ИИ

π0.7

Nano Banana с интеграцией Google Photos в Gemini

AI Mode в Chrome

Codex update with macOS app control, memory, and image generation

Персонализированная генерация изображений в Gemini

Roblox Assistant с Planning Mode, Mesh Generation и Procedural Model Generation

Claude Opus 4.7

Ising

NVIDIA DeepStream 9

Character.AI Books mode

Canva AI 2.0

Codex major update

DeepL Voice-to-Voice Translation Suite

GPT-Rosalind

Trusted Access for Cyber с GPT-5.4-Cyber

Hightouch AI-powered marketing service

Objection

Gemini AI app for Mac

Wingman

Gemini 3.1 Flash TTS

Поделиться

NVIDIA nvCOMP: как 30 строк кода экономят $200 000 в месяц на чекпоинтах ИИ

Похожие новости

Nvidia выпустила открытые ИИ-модели Ising для квантовых вычислений

Новый чип от UC San Diego может сократить энергопотребление дата-центров

Meta вкладывает $21 млрд в CoreWeave: гонка за ИИ-инфраструктурой набирает обороты

NVIDIA Slinky: как запустить Slurm на Kubernetes для тысяч GPU

Intel и Маск объявили о партнёрстве для создания Terafab — фабрики чипов мощностью 1 тераватт

Гендиректор Microsoft AI: развитие ИИ не упрётся в потолок — вот почему

Alibaba и China Telecom запускают дата-центр на 10 000 собственных чипов для ИИ

Новое узкое место ИИ: почему лучшие чипы из США летают в Тайвань и обратно

Firmus с поддержкой Nvidia оценили в $5,5 млрд для строительства «фабрик ИИ» в Австралии

Intel присоединяется к проекту Terafab Илона Маска для строительства фабрики чипов в Техасе