Nvidia захватила рынок чипов для ИИ, адаптировав полупроводники, изначально созданные для видеоигр. Теперь небольшой стартап Groq, основанный восемь лет назад, собирается бросить вызов одной из самых дорогих компаний в мире, выпустив новый чип, разработанный с нуля специально для нейросетей.
В феврале 2024 года, выступая перед аудиторией в Осло, Джонатан Росс, 42-летний генеральный директор стартапа Groq, заметил нечто странное. Он показывал членам норвежского парламента и руководителям технологических компаний демоверсию своего продукта, надеясь, что это поможет его компании, занимающейся производством чипов для нейросетей, выбраться из затяжного спада. Groq создала чат-бота, который может отвечать на вопросы почти мгновенно, даже быстрее, чем человек читает. Однако во время демонстрации чат-бот немного замедлялся. Это сильно нервировало Росса, который рассчитывал получить поддержку для своего проекта по созданию в Европе дата-центра на базе Groq, чтобы продемонстрировать все преимущества специализированных чипов, позволяющих нейросетям работать на таких высоких скоростях. «Я постоянно проверял показатели, – вспоминает он. – А люди на презентации никак не могли понять, почему я так часто отвлекаюсь».
Причиной замедленной реакции демонстрационной версии бота стал неожиданный приток новых пользователей. За день до презентации Росса в Осло один из основателей успешного стартапа в своем твите восторженно отозвался о «сверхбыстром ИИ-помощнике». В результате на страницу с демоверсией пришло так много нового трафика, что серверы компании не справились с нагрузкой. Это была проблема, но такая, с которой приятно иметь дело.
Росс основал Groq восемь лет назад с целью разработки чипов, специально предназначенных для того, что в индустрии называют «инференцией» – способностью искусственного интеллекта имитировать человеческое мышление через обучение и применение полученных знаний к новым ситуациям. Именно инференция позволяет вашему смартфону распознавать на впервые загруженном фото вашу собаку породы корги, а генератору изображений – создать реалистичный образ папы римского в плаще от Balenciaga. Это значительно отличается от другой, также требующей больших вычислительных мощностей задачи ИИ – обучения моделей на больших массивах данных.
Однако до того, как OpenAI в конце 2022 года выпустила ChatGPT и тем самым вызвала во всем мире резкий рост интереса к нейросетям, спрос на сверхбыструю инференцию был ограничен, и стартап Росса едва выживал. «Groq много раз находилась на грани краха, – говорит Росс во время интервью, проходящего в его лаборатории полупроводников в Сан-Хосе, Калифорния. Он вспоминает момент в 2019 году, когда у компании оставалось денег меньше, чем на месяц: – Возможно, мы начали с Groq слишком рано».
Но сейчас, когда спрос на вычислительные мощности для создания и обеспечения работы нейросетей таков, что способствует глобальному энергетическому кризису, время Groq, похоже, пришло – либо как потенциального нового лидера рынка, либо как цели для поглощения крупными игроками.
Потребность настолько велика, что рыночная капитализация Nvidia возросла до $3 трлн по сравнению с $60,9 млрд в 2023 году. В то время как Groq пока еще совсем малыш с доходом на уровне $2 млн, по оценкам источников, знакомых с финансовым положением компании. Эти же источники сообщают, что с таким резким ростом интереса к чипам компания прогнозирует выйти на оптимистичные $100 млн продаж уже в этом году. «Вычислительные мощности – это новая нефть», – говорит Росс.
Разработчики продуктов на базе ИИ занимают 16 позиций в нашем девятом ежегодном рейтинге Cloud 100, который включает лучшие в мире частные компании в сфере облачных технологий. В прошлом году их было всего восемь, а пять лет назад и вовсе ни одной. Учитывая, что рынок чипов для ИИ, как ожидается, вырастет до $1,1 трлн к 2027 году, Росс видит возможность заполучить часть доли Nvidia, которая в настоящее время контролирует невероятные 80 % рынка. Groq сосредоточена исключительно на разработках для инференции. По оценкам исследовательской компании IDC, эта часть рынка в текущем году вырастет до $39 млрд, а в течение следующих четырех лет – до $60,7 млрд.
Стартапы, такие как Groq, настроены оптимистично, поскольку чипы Nvidia изначально даже не предназначались для ИИ. Когда генеральный директор Дженсен Хуанг в 1999 году впервые представил графические процессоры (GPU), это был продукт, разработанный для видеоигр с насыщенной графикой. То, что они оказались наиболее подходящими процессорами для обучения ИИ, стало счастливым совпадением. Однако Groq, как и другие новые стартапы по производству чипов следующего поколения, включая Cerebras (оценка $4 млрд) и SambaNova (оценка $5,1 млрд), видят здесь огромные возможности. «Если бы мы начинали работать с ИИ сейчас, то никому бы в голову не пришло использовать GPU для работы с нейросетями», – утверждает Эндрю Фельдман, генеральный директор Cerebras.
Сместить Nvidia с лидерских позиций мечтают не только стартапы. Amazon и Microsoft разрабатывают собственные процессоры для нейросетей. Но чипы Groq – так называемые языковые процессоры (Language Processing Units, LPUs) – отличаются настолько впечатляющей скоростью, что у компании есть все шансы на успех. В выпущенной в этом году презентации для инвесторов компания заявляет, что при использовании для инференции ее чипы в 4 раза быстрее, в 5 раз дешевле и в 3 раза энергоэффективнее, чем GPU Nvidia. В настоящее время стартап объявил о привлечении новых инвестиций в раунде серии D, в котором основным инвестором выступает фонд BlackRock. Groq стремится привлечь как минимум $350 млн при оценке стоимости компании не менее $2 млрд, как сообщают источники, знакомые с процессом. «Скорость их чипов для инференции явно превосходит все остальные продукты на рынке», – говорит Эмиш Шах, соучредитель фонда General Global Capital, участвовавшего в нескольких раундах финансирования Groq.
Groq вывела свои чипы на рынок два года назад, и сейчас среди ее клиентов находится Аргоннская национальная лаборатория. Это государственный исследовательский центр, основанный по следам «Проекта Манхэттен», использующий чипы Groq для изучения термоядерного синтеза – типа энергии, производимого солнцем. Соглашение о применении процессоров Groq также заключено с Aramco Digital – технологическим подразделением саудовской нефтяной компании.
В марте Groq запустил сервис GroqCloud, позволяющий арендовать доступ к процессорам через онлайн-интерфейс. Чтобы продемонстрировать преимущества продукта разработчикам, Groq сделала доступ к облачному сервису бесплатным. За первый месяц на сайте зарегистрировались 70 000 пользователей. Теперь их уже 280 000, и рост продолжается. 30 июня компания запустила платные подписки и совсем недавно пригласила бывшего сотрудника Intel Стюарта Панна на должность операционного директора, чтобы увеличить доходы и масштабировать операции. У Панна есть все основания смотреть в будущее с оптимизмом: 40 процентов запросов от пользователей GroqCloud – это заявки на оплату дополнительных мощностей.
«Чип Groq действительно попал в цель», – говорит Янн Лекун, главный научный сотрудник Meta по искусственному интеллекту, который когда-то преподавал Россу информатику в Нью-Йоркском университете. Недавно он присоединился к Groq в качестве технического консультанта. Росс начал свою карьеру в Google, где работал в команде, создавшей тензорные процессоры, оптимизированные для машинного обучения. Он ушел в 2016 году, чтобы основать Groq вместе с коллегой из Google Дугом Уайтманом, который стал первым генеральным директором стартапа. В первый же год стартап привлек $10 млн в рамках раунда, где основным