Прорыв Google в области искусственной памяти потрясает Micron и рынок памяти
Акции Micron Technology Inc. на этой неделе заметно упали, потеряв 7,5% своей стоимости в прошлый вторник, 14 мая, в результате реакции, которую аналитики частично объясняют недавним объявлением Google. Технический гигант представил новый алгоритм, предназначенный для значительного улучшения использования памяти в моделях искусственного интеллекта (ИИ), что вызвало неопределенность в секторе микросхем памяти, включая таких конкурентов, как Samsung Electronics и SK Hynix.
Хотя инновации Google обещают повышение эффективности для разработчиков ИИ, они бросают тень сомнения на растущий спрос на память с высокой пропускной способностью (HBM) и усовершенствованную DRAM, которые стали важными драйверами роста для таких производителей, как Micron. Ключевой вопрос для инвесторов и отраслевых обозревателей остается: действительно ли программная оптимизация памяти поглотит спрос на аппаратное обеспечение, который вызвал революцию в области искусственного интеллекта?
Алгоритм, который может изменить все
Алгоритм, о котором идет речь, получивший название Протокол эффективности разреженного внимания (SAEP), был представлен подразделением Google DeepMind во время внутреннего саммита по искусственному интеллекту, подробности которого стали известны широкому технологическому сообществу. SAEP фокусируется на оптимизации архитектуры преобразователя, основного компонента многих больших языковых моделей (LLM) и генеративных систем искусственного интеллекта. Традиционные модели-трансформеры часто хранят и обрабатывают огромные объемы избыточных или «разреженных» данных, что приводит к неэффективному распределению памяти.
SAEP Google стремится интеллектуально идентифицировать и расставлять приоритеты только для наиболее важных соединений и точек данных в рамках механизма внимания, эффективно сокращая объем памяти, необходимый как для обучения, так и для вывода. Согласно предварительным тестам, опубликованным Google, SAEP может добиться впечатляющего сокращения использования памяти «до 25-30%» для некоторых сложных LLM без ущерба для точности или производительности. Это означает потенциально меньшие требования к оборудованию для развертывания и запуска все более сложных приложений искусственного интеллекта.
Производители памяти сталкиваются с новой переменной
Для Micron, мирового лидера в области решений для памяти и хранения данных, последствия значительны. Компания вложила значительные средства в разработку передового HBM3E и будущих поколений DRAM, делая большую ставку на ненасытные потребности центров обработки данных AI. Сокращение объема памяти, необходимой для цикла вывода или обучения ИИ, может сдержать прогнозируемые темпы роста этих высокомаржинальных продуктов.
Доктор. Эвелин Рид, старший аналитик Argus Capital, прокомментировала ситуацию, заявив: «Это не является немедленным похоронным звоном для производителей памяти, но оно вводит важную новую переменную в уравнение спроса на память. В течение многих лет мантра звучала так: «Больше памяти всегда лучше для ИИ». SAEP от Google предполагает, что «более разумное использование памяти» может стать новым рубежом, потенциально позволяющим отделить размер необработанной модели от пропорционального потребления памяти».
Конкуренты Samsung Electronics и SK Hynix, также крупные игроки на рынке HBM, несомненно, внимательно наблюдают за этим. Хотя цены на их акции не пережили столь резкого однодневного падения, как у Micron, долгосрочные последствия для всего сектора памяти активно обсуждаются.
Как преодолеть неопределенность: взгляды аналитиков
Реакция рынка, хотя и немедленная, также чревата неопределенностью. Многие аналитики полагают, что влияние SAEP и подобных оптимизаций программного обеспечения может быть переоценено в краткосрочной перспективе или даже привести к неожиданным положительным результатам.
Марк Чен, старший аналитик TechInsight Advisors, предложил более детальную точку зрения. "Хотя SAEP предлагает впечатляющую эффективность, мы должны учитывать экспоненциальную траекторию роста самого ИИ. Модели не только становятся более эффективными, но также экспоненциально больше и сложнее. Сам масштаб будущих развертываний ИИ может легко поглотить этот прирост памяти или даже потребовать увеличения объема памяти в целом, поскольку модели становятся еще больше и выполняют более разнообразные задачи". Чен также подчеркнул, что такие алгоритмы не могут быть универсально применимы ко всем архитектурам и рабочим нагрузкам ИИ, особенно для специализированных ускорителей ИИ, которые в меньшей степени зависят от оптимизации памяти общего назначения.
Кроме того, повышение эффективности памяти может снизить барьер для входа в разработку и развертывание ИИ, потенциально ускоряя внедрение ИИ в большем количестве отраслей. Такое более широкое распространение систем искусственного интеллекта, даже если каждая из них будет более эффективно использовать память, все равно может привести к чистому увеличению общего спроса на память во всем мире.
За пределами Google: более широкая динамика рынка
Очень важно помнить, что на показатели акций Micron, как и на показатели любой крупной полупроводниковой компании, влияет множество факторов, помимо объявления одного алгоритма. Глобальные циклы полупроводников, восстановление рынков ПК и смартфонов, геополитическая напряженность, влияющая на цепочки поставок и доступ к рынкам (особенно технологические ограничения США и Китая), а также общее макроэкономическое здоровье — все это играет важную роль.
Хотя протокол Sparse Attention Efficiency Protocol от Google представляет собой убедительный аргумент в пользу программной оптимизации в области искусственного интеллекта, его окончательное влияние на спрос на оборудование еще предстоит выяснить. Производителям памяти, таким как Micron, придется продолжать внедрять инновации, адаптироваться к развивающимся архитектурам искусственного интеллекта и внимательно следить за реальным внедрением и эффективностью таких протоколов эффективности. Будущее спроса на память ИИ будет зависеть от динамичного взаимодействия усовершенствований аппаратного обеспечения, интеллектуального программного обеспечения и неустанного расширения приложений ИИ по всему миру.






