Вернуться к ленте новостей

К 2030 году 78% инвестиций в дата-центры будут идти на обслуживание ИИ-нагрузок — оценка McKinsey

Эта сумма достигнет 5,2 трлн долларов. Основная статья расходов на ИИ — инференс, процесс генерации ответов для пользователей. На него уходит до 90% всех вычислительных ресурсов в жизненном цикле модели. Для сохранения рентабельности «ИИ-гиперскейлеры» — компании, которые одновременно разрабатывают собственные модели и внедряют их в массовые продукты (OpenAI, Google, Anthropic, Яндекс) — вырабатывают новые научно-технологические подходы для ИИ-разработки и оптимизации инфраструктуры. OpenAI и Anthropic — через кэширование запросов и специализированные чипы, Google — через интеллектуальную маршрутизацию трафика, отечественный Яндекс ускорил генерацию ответов в шесть раз, применив комбинацию сжатия моделей и оптимизации памяти.

Источник: IF News