Спрос на альтернативные облачные решения никогда не был так высок.
Например, CoreWeave, поставщик инфраструктуры GPU, который начинал как операция по добыче криптовалют, на этой неделе привлек 1,1 миллиарда долларов нового финансирования от инвесторов, включая Coatue, Fidelity и Altimeter Capital. Этот раунд увеличил его оценочную стоимость до 19 миллиардов долларов после инвестиций, а общая сумма привлеченных средств достигла 5 миллиардов долларов в долгах и акциях — впечатляющая цифра для компании, которой меньше десяти лет.
И это не только CoreWeave. Lambda Labs, которая также предлагает массив облачных экземпляров GPU, в начале апреля обеспечила финансирование «специального назначения» на сумму до 500 миллионов долларов, через несколько месяцев после закрытия раунда серии C на 320 миллионов долларов. Благотворительная организация Voltage Park, поддерживаемая крипто-миллиардером Джедом Маккалебом, в октябре прошлого года объявила, что инвестирует 500 миллионов долларов в центры обработки данных на базе GPU. А Together AI, хостинг облачных GPU, который также занимается исследованиями в области генеративного ИИ, в марте привлек 106 миллионов долларов в раунде, возглавляемом Salesforce.
Откуда такой энтузиазм и поток инвестиций в сферу альтернативных облаков?
Ответ, как вы могли ожидать, заключается в генеративном ИИ.
По мере продолжения бума генеративного ИИ, продолжает расти и спрос на аппаратное обеспечение для работы и обучения моделей генеративного ИИ в масштабе. GPU архитектурно являются логичным выбором для обучения, тонкой настройки и работы моделей, поскольку они содержат тысячи ядер, которые могут работать параллельно для выполнения уравнений линейной алгебры, составляющих генеративные модели.
Но установка GPU дорогостоящая, поэтому большинство разработчиков и организаций обращаются к облаку.
Доминирующие компании в области облачных вычислений — Amazon Web Services (AWS), Google Cloud и Microsoft Azure — предлагают множество экземпляров GPU и специализированного оборудования, оптимизированных для рабочих нагрузок генеративного ИИ. Но по крайней мере для некоторых моделей и проектов альтернативные облака могут оказаться дешевле — и обеспечивать лучшую доступность.
На платформе CoreWeave аренда Nvidia A100 40GB — популярного выбора для обучения моделей и их использования — стоит 2,39 доллара в час, что составляет 1200 долларов в месяц. На Azure та же GPU стоит 3,40 доллара в час, или 2482 доллара в месяц; на Google Cloud — 3,67 доллара в час, или 2682 доллара в месяц.
Решение растущего спроса
Учитывая, что рабочие нагрузки генеративного ИИ обычно выполняются на кластерах GPU, разница в стоимости быстро увеличивается.
«Компании вроде CoreWeave участвуют на рынке, который мы называем специализированными облачными провайдерами ‘GPU как услуга’», — говорит Сид Наг, вице-президент по облачным сервисам и технологиям в Gartner. «Учитывая высокий спрос на GPU, они предлагают альтернативу гиперскалерам, где они использовали GPU Nvidia и предоставили другой путь на рынок и доступ к этим GPU».
Наг отмечает, что даже некоторые крупные технологические компании начали опираться на альтернативных облачных провайдеров, сталкиваясь с проблемами вычислительных мощностей.
В прошлом июне CNBC сообщило, что Microsoft заключила многомиллиардную сделку с CoreWeave, чтобы обеспечить OpenAI, создателя ChatGPT и тесного партнера Microsoft, достаточной вычислительной мощностью для обучения его моделей генеративного ИИ. Nvidia, поставщик большей части чипов для CoreWeave, видит это как желательную тенденцию, возможно, по причинам влияния; говорится, что она предоставила некоторым альтернативным облачным провайдерам преференциальный доступ к своим GPU.
Ли Сустар, главный аналитик Forrester, считает, что облачные провайдеры вроде CoreWeave добиваются успеха частично потому, что у них нет «багажа» инфраструктуры, с которым приходится сталкиваться текущим поставщикам.
«Учитывая доминирование гиперскалеров на рынке общедоступных облаков, требующих огромных инвестиций в инфраструктуру и широкий спектр услуг, приносящих мало или вообще не приносящих доход, претенденты вроде CoreWeave имеют возможность добиться успеха, сосредоточив внимание на премиум-услугах ИИ без необходимости инвестиций на уровне гиперскалеров в целом», — сказал он.
Но является ли этот рост устойчивым?
У Сустара есть сомнения. Он полагает, что расширение альтернативных облачных провайдеров будет зависеть от того, смогут ли они продолжать наращивать объемы доступных GPU и предлагать их по конкурентоспособным низким ценам.
Конкуренция в ценообразовании может стать сложной в будущем, поскольку такие крупные игроки, как Google, Microsoft и AWS, наращивают инвестиции в специализированное оборудование для работы и обучения моделей. Google предлагает свои TPU; Microsoft недавно представила два специализированных чипа, Azure Maia и Azure Cobalt; а у AWS есть Trainium, Inferentia и Graviton.