Сегодня Xilinx объявляет о расширении своего семейства Versal, ориентированном на маломощные и периферийные устройства. Xilinx Versal — это сочетание множества различных процессорных технологий: программируемые логические вентили (FPGA), ядра Arm, быстрая память, AI-движки, программируемые DSP, усиленные контроллеры памяти и ввод-вывод — преимущества всех этих технологий означают, что Versal может масштабирование от премиум-класса высшего класса (запущено в 2020 году) до устройств пограничного класса, построенных на 7-нм техпроцессах TSMC. Новые процессоры Versal AI Edge от Xilinx начинаются с мощности от 6 Вт до 75 Вт.

Яндекс

Переход на ACAP

Пару лет назад в Xilinx изменились требования клиентов: несмотря на то, что они были поставщиком FPGA, клиенты хотели чего-то более похожего на обычный процессор, но с гибкостью FPGA. В 2018 году компания представила концепцию ACAP, платформы адаптивного ускорения вычислений, которая предлагала усиленные вычислительные ресурсы, память и ввод-вывод, как традиционный процессор, но также существенную программируемую логику и механизмы ускорения от FPGA. Первые высокопроизводительные процессоры ACAP, построенные на TSMC N7, были продемонстрированы в 2020 году и включали в себя крупные микросхемы премиум-класса, некоторые с HBM, для высокопроизводительных рабочих нагрузок.

Таким образом, вместо того, чтобы иметь дизайн, который был 100% FPGA, путем передачи части этой площади кристалла на усиленную логику, такую ​​как ядра процессора или память, дизайн ACAP Xilinx позволяет использовать полный спектр специализированных стандартизованных IP-блоков с меньшей мощностью и меньшей площадью кристалла, в то время как все еще сохраняя значительную часть микросхемы для FPGA, позволяя клиентам развертывать собственные логические решения. Это было важно для развития ИИ, поскольку алгоритмы развиваются, формируются новые структуры или разные вычислительные сети требуют разного баланса ресурсов. Наличие ПЛИС на кристалле в сочетании со стандартным усиленным IP позволяет установить один продукт в течение многих лет, поскольку алгоритмы перебалансируются и обновляются.

Читайте также:
В Boeing 787 обнаружена смертельная неисправность

Xilinx Versal AI Edge: новое поколение

Что касается последнего пункта о наличии установленного продукта на десять лет и необходимости обновлять алгоритмы, нет ничего более верного, чем в случае с традиционными «периферийными» устройствами. На «грани» мы говорим о датчиках, камерах, промышленных системах, коммерческих системах — оборудовании, которое должно работать в течение длительного срока службы с любым оборудованием, которое оно имеет. Сегодня существуют периферийные системы, построенные на оборудовании, выпущенном до 2000 года, чтобы вы могли охватить этот рынок. В результате всегда есть стремление сделать периферийное оборудование более гибким по мере изменения потребностей и вариантов использования. Это то, на что Xilinx нацелена в своем новом портфеле Versal AI Edge — возможность постоянно обновлять «умные» функции в оборудовании, таком как камеры, робототехника, автоматизация, медицина и другие рынки.

Традиционное устройство Versal от Xilinx содержит ряд скалярных механизмов (ядра Arm A72 для приложений, ядро ​​Arm R5 для реального времени), интеллектуальные механизмы (блоки AI, DSP), адаптируемые механизмы (FPGA) и IO (PCIe, DDR, Ethernet, МИПИ). Для самых крупных продуктов Versal они большие и мощные, чему способствует программируемая сеть на кристалле. Для платформы Versal AI Edge добавлены две новые функции.

Во-первых, это использование ускорителя SRAM, расположенного очень близко к скалярным двигателям. Вместо традиционных кешей это специализированная настраиваемая блокнотная память с плотной SRAM, к которой движки могут обращаться с малой задержкой, а не перемещаться по шине памяти. Традиционные кеши используют алгоритмы прогнозирования для извлечения данных из основной памяти, но если программист знает рабочую нагрузку, они могут гарантировать, что данные, необходимые в критических точках с наибольшей задержкой, уже могут быть размещены рядом с процессором до того, как предикторы узнают, что делать. Этот блок размером 4 МБ имеет детерминированную задержку, что позволяет подключиться к R5 в реальном времени и предлагает R5 пропускную способность 12,8 ГБ / с. Он также имеет пропускную способность 35 ГБ / с для движков ИИ для данных, которые необходимо обрабатывать в этом направлении.

Читайте также:
FlyBag защитит самолеты от террористов

Другое обновление касается самих движков AI. Оригинальное оборудование Xilinx Versal позволяло использовать оба типа машинного обучения: обучение и логический вывод. У этих двух рабочих нагрузок разные точки оптимизации для вычислений и памяти, и хотя на больших чипах было важно поддерживать и то, и другое, эти пограничные процессоры почти всегда будут использоваться для логических выводов. В результате Xilinx изменил конфигурацию ядра и назвал эти новые движки «AIE-ML».

Самая простая конфигурация AIE-ML на процессоре 6 Вт имеет 8 ядер AIE-ML, в то время как самая большая — 304. Их отличает от обычных механизмов двойное увеличение локального кэша данных на каждый механизм, дополнительные плитки памяти для глобальной SRAM. доступ и встроенная поддержка для определенных типов данных вывода, таких как INT4 и BF16. Помимо этого, множители также удваиваются, что позволяет удвоить производительность INT8.

Комбинация этих двух функций означает, что Xilinx заявляет о 4-кратной производительности на ватт по сравнению с традиционными решениями с графическим процессором (по сравнению с AGX Xavier), 10-кратном увеличении плотности вычислений (по сравнению с Zynq Ultrascale) и большей адаптируемости при изменении рабочих нагрузок ИИ. Вместе с этим будет проводиться дополнительная проверка с поддержкой нескольких стандартов безопасности во многих отраслях промышленности.

Во время нашего брифинга с Xilinx я особо выделил один комментарий в свете текущего глобального спроса на полупроводники. Все сводится к одному слайду, на котором Xilinx сравнивает свои собственные текущие автомобильные решения для вождения уровня 3 со своим новым решением.

Читайте также:
Компания Apple работает над новым устройством

В этой ситуации, чтобы включить управление Уровнем 3, текущее решение использует три процессора общей площадью 1259 мм2 кремния, а затем сверх этой памяти для каждого процессора и тому подобного. Новое решение Versal AI Edge заменяет все три ПЛИС Zynq, сокращая количество процессоров с 3 до 1, уменьшая до 529 мм2 кремния при той же мощности, но также с 4-кратным увеличением вычислительных возможностей. Даже если производитель автомобилей удвоил резервы, новое решение все равно имеет меньшую площадь кристалла, чем предыдущее.

По мере продвижения вперед это будет ключевой особенностью процессорных решений — сколько кремния необходимо, чтобы платформа действительно заработала. Меньшее количество кремния обычно означает меньшие затраты и меньшую нагрузку на цепочку поставок полупроводников, что позволяет обрабатывать больше единиц за фиксированный промежуток времени. Компромисс заключается в том, что большой кремний может не подойти или это может быть не оптимальная конфигурация технологических узлов с точки зрения мощности (и стоимости в этом отношении), однако, если отрасль в конечном итоге будет ограничена производительностью кремния и упаковкой, это соображение, которое стоит принять во внимание.

Однако, как это обычно бывает в мире ПЛИС (или ACAP), объявления происходят раньше, и прогресс идет немного медленнее. Сегодняшнее объявление Xilinx соответствует только тому факту, что документация доступна уже сегодня, а образцы микросхем будут доступны в первой половине 2022 года. Полный комплект для тестирования и оценки появится во второй половине 2022 года. Xilinx предлагает клиентам, заинтересованным в AI Edge платформа может начать прототипирование сегодня с Versal AI ACAP VCK190 Eval Kit и мигрировать.

Читайте также:
Netgear запускает точку доступа WAX630 AX6000 Wi-Fi 6 для малого и среднего бизнеса

Полные характеристики процессоров AI Edge представлены на слайде ниже. Новый ускоритель SRAM находится на первых четырех процессорах, а AIE-ML — на всех компонентах серии 2000. Xilinx указала, что все процессоры AI Edge будут построены на процессе TSMC N7 +.

Связанное чтение