GTC Nvidia создала пару небольших графических процессоров, удобных для центров обработки данных, потому что не думает, что клиенты получат ускорение ИИ, если они не смогут использовать серверы, с которыми они уже работают.

Для новых моделей — A10 и A30 — требуется один и два слота PCIe полной высоты и полной длины соответственно. Оба используют архитектуру Ampere, которую Nvidia использует на других своих графических процессорах. Но оба они намного меньше, чем другие графические процессоры компании, и это имеет значение в контексте недавно выпущенного пакета AI Enterprise, который Nvidia упаковывает исключительно в vSphere VMware.

До того, как VMware заинтересовалась частными и гибридными облаками, она была сосредоточена на консолидации серверов: превращение парка серверов в логический пул ресурсов вместо того, чтобы жестко связывать серверы с конкретными приложениями.

Манувир Дас, глава подразделения корпоративных вычислений Nvidia, рассказал Реестр что Nvidia выяснила, что на практике большие горячие графические процессоры заканчиваются выделенным оборудованием, которое более или менее тесно связывает ИИ с выделенными серверами. Das и Nvidia предпочли бы, чтобы вы запускали AI Enterprise на оборудовании, которое у вас уже есть, и / или оборудовании, которое вы покупаете большую часть, а именно на серверах 1U и 2U.

Отсюда потребность в графических процессорах меньшего размера, как для установки в обычные серверы, так и в знак признания того, что локальные центры обработки данных вынуждены быть плотно упакованными. Большинство крупных производителей серверов (Dell, Lenovo, H3C, Inspur, QCT и Supermicro) работают с A10 и A30, и Nvidia клянется, что ее контейнерная платформа машинного обучения EGX будет как дома в этой среде.

Графический процессор Nvidia A10

Читайте также:
Графические процессоры для игр и серверы центров обработки данных продолжают увеличивать доходы Nvidia, несмотря на повсеместную нехватку микросхем • The Register

Графический процессор A10. нажмите, чтобы увеличить

Дас сказал, что новые графические процессоры добавят 2 000 или 3 000 долларов к стоимости сервера за 12 000 долларов. Nvidia предложила следующие спецификации для A10:

  • TDP: 150 Вт
  • FP32: 31,2 терафлопс
  • BFLOAT16 Тензорное ядро: 125 терафлопс | 250 терафлопс *
  • FP16 Тензорное ядро: 125 терафлопс | 250 терафлопс *
  • Тензорное ядро ​​INT8: 250 TOPS | 500 ТОПС *
  • Пропускная способность графического процессора: 600 ГБ / с
  • Память графического процессора: 24 ГБ GDDR6

Вот спецификации для A30:

  • TDP: 165 Вт.
  • FP32: 10,3 терафлопс
  • BFLOAT16 Тензорное ядро: 165 терафлопс | 330 терафлопс *
  • FP16 Тензорное ядро: 165 терафлопс | 330 терафлопс *
  • Тензорное ядро ​​INT8: 330 TOPS | 661 ТОПС *
  • Пропускная способность графического процессора: 933 ГБ / с
  • Память графического процессора: 24 ГБ HBM2 (на кристалле)

* С разреженностью

Nvidia заявила, что A10 будет доступен в этом месяце, а A30 — в конце этого года; имейте в виду, что продукты Nvidia часто трудно найти в этой продолжающейся глобальной кремниевой засухе. ®

В других новостях GTC … Сегодня начинается конференция Nvidia по технологиям графических процессоров 2021 года, и поэтому у нее есть шквал о вещах, которые нужно объявить помимо A10 и A30. Вот пара основных моментов:

  • Nvidia имеет разработан Процессор серверного уровня на базе Arm под названием Grace, который будет использовать набор будущих ядер ЦП Arm Neoverse. Он нацелен на суперкомпьютеры и массовые рабочие нагрузки ИИ.
  • Он также рассказал о своих BlueField 3 DPU который разработан для так называемых интеллектуальных сетевых адаптеров, которые ускоряют программно-определяемые сетевые функции, функции хранения и обеспечения безопасности на оборудовании вдали от хост-процессоров машины.
Читайте также:
Microsoft делает ставку на Pivot и признает, что извлечение сенсорного управления из набора инструментов WinUI 3 «было явно неверным решением» °