Хотя значительная часть успеха NVIDIA в области серверов за последнее десятилетие, конечно же, была достигнута благодаря их опытным графическим процессорам, в наши дни компания NVIDIA представляет собой гораздо больше, чем просто создатель графических процессоров. Поскольку в штате больше инженеров-программистов, чем инженеров по аппаратному обеспечению, именно программное обеспечение и экосистемные решения действительно укрепили позицию NVIDIA как ведущего производителя графических процессоров и создали более широкий рынок для их графических процессоров. В то же время именно эти экосистемные игры позволили NVIDIA создать прибыльную печатную машину, не ограничиваясь продажей графических процессоров и перейдя на системы, программное обеспечение, поддержку и другие направления.

С этой целью NVIDIA сегодня утром официально запускает новую экосистему, нацеленную на высокопроизводительные серверы глубокого обучения, которые компания позиционирует как Системы, сертифицированные NVIDIA. Софт был запущен еще осенью, а сегодня компания более подробно знакомит с программой, подробно описывает программу и объявляет некоторых партнеров. Согласно плану NVIDIA, в дальнейшем клиенты могут выбрать покупку сертифицированных NVIDIA систем, если им нужна дополнительная гарантия производительности и надежности системы, а также подписаться на контракты на поддержку, чтобы получить доступ к прямой, полной технической поддержке от NVIDIA.

Концептуально программа сертификации довольно проста, во многом из-за требований к оборудованию. Системы сначала должны использовать ускорители NVIDIA A100, а также адаптеры Mellanox Ethernet и DPU. Или, другими словами, серверы уже должны использовать кремний NVIDIA, где это возможно. OEM-производители могут затем представить системы, отвечающие этим требованиям к оборудованию, в NVIDIA, которая протестирует системы по нескольким показателям, включая производительность DL с несколькими GPU и несколькими узлами, производительность сети, производительность хранилища и безопасность (безопасная загрузка / корень доверия). Системы, прошедшие эти тесты, могут быть помечены как сертифицированные NVIDIA.

Читайте также:
RoboHon: необычный робот от Sharp

Эти сертифицированные системы, в свою очередь, имеют право на дополнительную полную техническую поддержку через NVIDIA и OEM. Клиенты могут приобрести многолетние контракты на поддержку, которые дают им право получать поддержку через OEM и NVIDIA. По сути, NVIDIA берет на себя ответственность за поддержку всего программного обеспечения, помимо ОС, включая драйверы оборудования, CUDA, широкий набор фреймворков и библиотек и даже основные библиотеки с открытым исходным кодом, такие как TensorFlow. Последнее — то, что делает предложение поддержки NVIDIA особенно ценным, поскольку они, по сути, стремятся помочь клиентам с любыми проблемами с графическим процессором или программным обеспечением, связанным с глубоким обучением.

Конечно, эта поддержка не будет бесплатной: именно здесь NVIDIA будет зарабатывать деньги. Хотя NVIDIA не взимает плату с OEM-производителей за сертификацию (поэтому в оборудование не входит дополнительный налог на сертификацию), контракты на поддержку оцениваются в зависимости от количества графических процессоров. В одном примере NVIDIA заявила, что трехлетний контракт на поддержку системы с двумя A100 будет составлять 4299 долларов, или около 715 долларов в год на каждый графический процессор для поддержки. Таким образом, можно представить, как быстро это усиливается для более крупных систем A100 с 4 и 8 путями, а затем снова для нескольких узлов.

Для NVIDIA и ее OEM-партнеров создание программы сертификации — простой способ попытаться и дальше расширять рынок серверов глубокого обучения, особенно для среднего бизнеса. Рынок оборудования для искусственного интеллекта переживает бум, и NVIDIA хочет сохранить его таким образом, облегчая потенциальным клиентам использование их оборудования. У NVIDIA уже есть верхний сегмент рынка, охваченный в этом отношении своими прямыми отношениями с гипермасштабирующими компаниями — и расширением их клиентов облачных вычислений с небольшой капитализацией — поэтому программа сертификации оборудования заполняет средний уровень для организаций, которые собираются запускать собственные серверы, но не собираетесь быть крупным клиентом, которому уделяется индивидуальное внимание.

Читайте также:
Samsung удвоил производительность батареи

Что касается этих клиентов, программы сертификации и поддержки серверов NVIDIA предназначены для устранения (или, по крайней мере, снижения) рисков, связанных с существенными инвестициями в оборудование NVIDIA. Это означает возможность купить систему, в которой поставщик (в данном случае дуэт NVIDIA и OEM) может поручиться за производительность системы, а также гарантировать, что она сможет правильно запускать различные пакеты AI, такие как NVIDIA. Каталог NGC оптимизированного для графических процессоров и контейнерного ПО.

В общей сложности NVIDIA выпускает 14 сертифицированных систем с обещанием, что в будущем появится еще больше сертифицированных систем. Для первой волны систем участвующие OEM-производители включают Dell, Gigabyte, HPE, Inspur и Supermicro, которые часто участвуют в новых инициативах NVIDIA по серверам.

При всем вышесказанном, программа сертификации серверов NVIDIA вряд ли существенно изменит работу большинства клиентов компании; но это программа, которая, кажется, ориентирована на определенную нишу для NVIDIA и ее OEM-партнеров. Для компаний, которые заинтересованы в вычислениях на GPU, но ищут большую степень поддержки и уверенности, это может удовлетворить эти потребности. Что, чтобы завершить кругозор, именно удовлетворяя такие потребности с помощью экосистемных игр, таких как сертификация серверов, NVIDIA добилась такого успеха на рынке серверных графических процессоров за последнее десятилетие.