Вернуться к ленте новостей

Google (о новом алгоритме ИИ):

Сейчас большие модели (типа Gemini) тратят огромную часть памяти на хранение промежуточных данных (KV-cache). Из-за этого даже мощные сервера быстро упираются в лимит ОЗУ, что сильно тормозит работу и повышает стоимость. TurboQuant — новый алгоритм сжатия памяти для ИИ. Он сжимает эти данные в 68 раз без заметной потери качества модели. Найден способ, как убрать главное бутылочное горлышко современных больших ИИ — нехватку оперативной памяти. Это может существенно ускорить развитие и удешевить использование мощных моделей. research.google *headlines: акции производителей ОЗУ после релиза Google пошли вниз

Источник: headlines