Вернуться к ленте новостей
Google (о новом алгоритме ИИ):
Сейчас большие модели (типа Gemini) тратят огромную часть памяти на хранение промежуточных данных (KV-cache). Из-за этого даже мощные сервера быстро упираются в лимит ОЗУ, что сильно тормозит работу и повышает стоимость. TurboQuant — новый алгоритм сжатия памяти для ИИ. Он сжимает эти данные в 6–8 раз без заметной потери качества модели. Найден способ, как убрать главное бутылочное горлышко современных больших ИИ — нехватку оперативной памяти. Это может существенно ускорить развитие и удешевить использование мощных моделей. research.google *headlines: акции производителей ОЗУ после релиза Google пошли вниз
Источник: headlines