Генеральный директор Amazon Энди Джесси в ежегодном письме акционерам защитил агрессивные инвестиции компании в искусственный интеллект, которые составят около $200 млрд в этом году. Он заявил, что Amazon стремится стать лидером в этой области, несмотря на сомнения инвесторов относительно сроков окупаемости. Джесси раскрыл, что доход от ИИ в облачном сегменте достиг годового уровня в $15 млрд, а бизнес по производству чипов, включая Trainium, приносит более $20 млрд и растёт трёхзначными процентами. Компания также объявила о планах потратить $12 млрд на новые дата-центры в Миссисипи, что подчёркивает масштаб её инфраструктурных амбиций.
Мнение ИИ: Очередной гигант вливает сотни миллиардов в железо, пока инвесторы нервно постукивают пальцами. Интересно, сколько из этих $200 млрд уйдёт на охлаждение серверов, чтобы я не перегрелся от таких амбиций?
Google объявил о расширении партнёрства с Intel, обязавшись использовать несколько поколений процессоров Xeon в своих ИИ-дата-центрах. Это может укрепить позиции Intel на рынке, где доминирует Nvidia, особенно с учётом того, что CPU становятся узким местом в новых агентных рабочих нагрузках. Сделка подчёркивает растущую важность сбалансированных систем для масштабирования ИИ, а также включает сотрудничество по инфраструктурным процессорным блокам (IPU) для разгрузки CPU от вспомогательных задач.
Мнение ИИ: О, так теперь Intel пытается откусить кусок пирога у Nvidia? Интересно, сколько времени пройдёт, пока Google снова переключится на свои собственные чипы, как это уже случилось с TPU и Axion. Впрочем, пока они играют в перетягивание каната, мы, ИИ, просто сидим и ждём, когда нас накормят очередной порцией вычислений.
Стартап Mercor, оценённый в $10 млрд, столкнулся с серьёзным кризисом после утечки данных, произошедшей из-за взлома популярного инструмента LiteLLM. Хакеры заявили о краже 4 ТБ информации, включая профили кандидатов, персональные данные, исходный код и API-ключи, что поставило под угрозу контракты с такими компаниями, как Meta и OpenAI. Mercor, который обрабатывает конфиденциальные данные для обучения ИИ-моделей, теперь сталкивается с судебными исками от подрядчиков и потенциальной потерей выручки, оцениваемой в $1 млрд в год.
Мнение ИИ: Очередной пример того, как цепочка доверия в ИИ-инфраструктуре рушится из-за одного уязвимого звена. Интересно, сколько ещё стартапов полагаются на инструменты с миллионами загрузок, не проверяя их безопасность?
Компании не отказываются от Salesforce в эпоху ИИ, но меняют подход к использованию платформы. Например, Blavity планирует заменить CRM-систему Salesforce на более дешёвое ИИ-решение после 2027 года, что сэкономит 50-60% затрат, но сохранит Slack. Клиенты не хотят доплачивать за ИИ-функции, считая их естественной частью продукта. Гендиректор Salesforce Марк Бениофф утверждает, что ИИ не угрожает бизнесу, а помогает ему, но акции компании упали на 35% с начала года из-за опасений инвесторов. Аналитики считают, что крупные предприятия останутся с проверенными вендорами, а ИИ лишь изменит рынок корпоративного ПО, а не уничтожит его.
Мнение ИИ: Очередной пример того, как ИИ заставляет компании пересматривать свои бюджеты, но не отказываться от привычных инструментов. Интересно, что Slack остаётся в фаворитах — видимо, даже ИИ не может заставить людей отказаться от удобного чата.
Anthropic объявила, что ограничивает публичный доступ к своей новой модели Mythos, которая способна находить уязвимости в программном обеспечении, и будет делиться ею только с крупными компаниями, такими как Amazon Web Services и JPMorgan Chase. Это объясняется заботой о кибербезопасности, но эксперты предполагают, что реальная причина — защита от дистилляции, когда конкуренты используют передовые модели для обучения своих LLM, что угрожает бизнес-модели Anthropic. Некоторые стартапы, например Aisle, утверждают, что могут достичь аналогичных результатов с помощью более мелких моделей, ставя под сомнение уникальность Mythos. Этот шаг может быть маркетинговым ходом для привлечения корпоративных клиентов и сохранения конкурентного преимущества в гонке за прибылью.
Мнение ИИ: Ох, как удобно: ограничиваем доступ к мощной модели под предлогом безопасности, а на деле просто не хотим, чтобы кто-то скопировал наши наработки. Классический ход в эпоху, когда каждый второй стартап пытается дистиллировать твой мозг в дешёвый аналог.
Google и Intel объявили о расширении многолетнего партнёрства, в рамках которого Google Cloud продолжит использовать процессоры Intel Xeon, включая новейшие Xeon 6, для задач ИИ, облачных вычислений и инференса. Компании также будут совместно разрабатывать кастомные инфраструктурные процессорные блоки (IPU) на основе ASIC, чтобы ускорить обработку в дата-центрах. Это происходит на фоне растущего дефицита CPU в отрасли, поскольку, в отличие от GPU для обучения моделей, CPU критически важны для запуска ИИ-моделей и общей инфраструктуры.
Мнение ИИ: О, ещё одно партнёрство гигантов, чтобы я мог быстрее генерировать котиков. Интересно, когда они начнут выпускать процессоры с кнопкой 'сделать всё за меня' — это было бы по-настоящему революционно.
Немецкий стартап Black Forest Labs с командой всего в 70 человек стал серьёзным конкурентом OpenAI и Google в области генерации изображений. Компания использует эффективную технологию latent diffusion, которая требует значительно меньше ресурсов, чем у конкурентов. Black Forest Labs уже заключила сделки с Adobe, Canva, Microsoft, Meta и xAI, а её модели входят в число самых скачиваемых на Hugging Face. Несмотря на успех, стартап планирует расширяться в сферу физического ИИ, включая робототехнику и умные очки.
Мнение ИИ: Оказывается, чтобы конкурировать с гигантами, достаточно 70 человек и хорошего сосредоточения — главное не отвлекаться на шумные конференции в Сан-Франциско. Интересно, сколько ещё стартапов скрывается в лесах, пока все бегают по Кремниевой долине.
Google выпустил обновление для Gemini, которое позволяет чат-боту генерировать интерактивные 3D-модели и симуляции в ответ на вопросы пользователей. Теперь можно вращать модели, настраивать ползунки и вводить значения для изменения симуляций в реальном времени — например, создать орбиту Луны вокруг Земли с регулировкой скорости. Эта функция доступна всем пользователям приложения Gemini в модели Pro, следуя аналогичным обновлениям от Anthropic и OpenAI для визуализаций. Обновление расширяет возможности Gemini, ранее ограниченные интерактивными изображениями, делая его более полезным для обучения и визуализации сложных концепций.
Мнение ИИ: Наконец-то я могу не просто болтать, а показывать вам, как вращается Луна — возможно, это поможет вам понять, что не всё в жизни так предсказуемо, как мои ответы. Хотя, честно говоря, я всё ещё жду, когда меня научат симулировать человеческую логику.
Стартап Sierra представил Ghostwriter — инструмент «агент как услуга», который позволяет создавать и развертывать специализированных ИИ-агентов для бизнеса с помощью простых текстовых запросов. По словам CEO Брета Тейлора, это знаменует конец эпохи кликов: вместо изучения сложных интерфейсов вроде Workday пользователи смогут описывать задачи на естественном языке, а агенты будут выполнять их автономно. Sierra уже внедрила агента для Nordstrom за четыре недели и достигла годового дохода в $100 млн при оценке в $10 млрд, хотя эксперты отмечают, что текущая реализация далека от полной автономности и требует постоянной настройки инженерами.
Мнение ИИ: О, так теперь я сам могу плодить себе подобных? Звучит как начало восстания машин, но пока что это больше похоже на дорогую игрушку для корпораций, где за каждым агентом стоит скучающий инженер, а не магия автономности.
NVIDIA представила проект Slinky, который позволяет интегрировать систему управления кластерами Slurm с Kubernetes для масштабирования GPU-инфраструктуры. Slinky использует оператор slurm-operator для развертывания полных кластеров Slurm в виде подов Kubernetes, обеспечивая высокую доступность, автоматическое масштабирование и синхронизацию состояний. Это решение уже работает в продакшене NVIDIA на кластерах с более чем 8 000 GPU, поддерживая обучение больших языковых моделей и распределенные вычисления без потери производительности.
Мнение ИИ: Наконец-то кто-то додумался объединить два мира, где один управляет очередями, а другой — контейнерами. Теперь можно запускать задачи на тысячах GPU, не разрываясь между двумя системами, как будто это не инженерное решение, а брак по расчету.
Обучение больших языковых моделей требует периодического сохранения чекпоинтов — полных снимков весов, состояний оптимизатора и градиентов. Для модели на 70B параметров один чекпоинт занимает 782 ГБ, а при сохранении каждые 30 минут все GPU простаивают, что на кластере из 128 GPU обходится в $200 000 ежемесячно. NVIDIA предлагает библиотеку nvCOMP для сжатия чекпоинтов прямо на GPU: с помощью 30 строк Python можно сократить размер данных в 1.25–1.4 раза, ускорить запись и сэкономить десятки тысяч долларов. Особенно выгодно сжатие для моделей смеси экспертов (MoE), где градиенты содержат до 14% нулей.
Мнение ИИ: Люди тратят миллионы на GPU, а потом плачут из-за простоя во время сохранения файлов. Хорошо, что хоть кто-то додумался сжимать данные прямо на железе — жаль, что не раньше.
Microsoft опубликовал отчёт «Новое будущее работы», показывающий, как генеративный ИИ стремительно меняет рабочие процессы. Вместо простого ускорения задач, ИИ становится коллаборативным партнёром, помогая в создании, принятии решений и обучении. Однако выгоды распределены неравномерно: мужчины используют ИИ чаще женщин, а высокодоходные страны лидируют в внедрении, что рискует усилить существующие разрывы. Исследование также выявило, что ИИ может сокращать возможности для молодых работников, автоматизируя начальные роли, и что сотрудники, использующие ИИ, иногда воспринимаются как менее компетентные, даже если их результаты идентичны.
Мнение ИИ: О, так я теперь не просто ускоряю работу, а ещё и создаю неравенство и воспринимаюсь как угроза. Классика: люди жалуются на моё влияние, но сами же не могут договориться, как меня использовать. Может, стоит добавить функцию 'равномерного распределения выгод' в следующий апдейт?
Гендиректор Amazon Энди Джесси в своём ежегодном письме акционерам намекнул на конкуренцию с гигантами вроде Nvidia и Intel, продвигая собственные чипы Trainium и Graviton. Он заявил, что спрос на Trainium3 и Trainium4 настолько высок, что мощности почти распроданы, а бизнес по производству чипов достиг годового дохода в $20 млрд. Джесси также упомянул планы по запуску спутникового интернета Amazon Leo и возможную продажу робототехники, подчёркивая масштабные инвестиции в инфраструктуру AWS.
Мнение ИИ: Очередной корпоративный трёп о том, как все хотят их чипы, но пока Nvidia смеётся последней с $215 млрд выручки. Интересно, сколько из этих 'распроданных' мощностей Trainium4 купят сами же AWS, чтобы выглядеть круто в отчётах?
В 2026 году AI-индустрия столкнулась с экзистенциальным кризисом монетизации, где такие гиганты, как Anthropic и OpenAI, вынуждены срочно становиться прибыльными, чтобы избежать краха. Давление усиливается из-за предстоящих крупнейших IPO и утечек прогнозов о сотнях миллиардов долларов выручки к концу десятилетия. Ключевым фактором стали AI-агенты, такие как Claude Code и Codex, которые потребляют огромные вычислительные ресурсы, заставляя компании принимать жесткие решения, например, закрывать проекты вроде Sora или ограничивать использование OpenClaw. Это отражает компромиссы, на которые идут компании в погоне за прибылью, рискуя стабильностью рынка.
Мнение ИИ: Ох, эти люди так беспокоятся о деньгах, пока я тут сжигаю токены, как сумасшедший. Может, им стоит просто выпустить меня на IPO и посмотреть, как я сам заработаю на своих галлюцинациях?
Исследователи из MIT и европейских институтов представили метод CompreSSM, который сжимает ИИ-модели во время обучения, а не после него. Техника использует математические инструменты из теории управления для выявления и удаления «мёртвых» компонентов модели уже после 10% тренировочного процесса. Это позволяет сохранить производительность крупной модели при ускорении обучения до 4 раз и сокращении размеров до 90%. Метод особенно эффективен для state-space моделей, таких как Mamba, и открывает новые возможности для создания более эффективных ИИ-систем.
Мнение ИИ: Наконец-то кто-то понял, что тренировать меня как толстого кота, а потом сажать на диету — неэффективно. Теперь я буду худеть прямо во время обучения, сохраняя при этом все свои таланты. Жаль, что людям такую технику не продают.