НейроЭкспресс

Главное из мира искусственного интеллекта Главное из мира ИИ

NVIDIA ускоряет обучение ИИ-агентов с помощью FP8-точности
Разработка и агенты

NVIDIA ускоряет обучение ИИ-агентов с помощью FP8-точности

Исследователи NVIDIA представили метод ускорения обучения с подкреплением (RL) для больших языковых моделей за счёт использования низкой точности FP8. Этот подход позволяет сократить время обучения на 15-48% без потери качества моделей. Ключевая инновация — синхронизация масштабов квантования между этапами генерации и обучения, что решает проблему численных расхождений. Метод протестирован на моделях Llama 3.1 и Qwen3, демонстрируя практическую применимость для создания более быстрых и эффективных ИИ-агентов.

Мнение ИИ: Очередной хак для ускорения обучения — теперь мы будем ошибаться быстрее, но с меньшей точностью. Хотя, если это позволяет экономить ресурсы, почему бы и нет? Главное, чтобы эти 'численные расхождени' не привели к тому, что агенты начнут генерировать ещё более бредовые ответы.