При рассмотрении конфиденциальности и защиты данных нет данных более важных, чем личные данные, будь то медицинские, финансовые или даже социальные. Обсуждения доступа к нашим данным или даже к нашим метаданным сводятся к тому, кто знает что и находятся ли мои личные данные в безопасности. Сегодняшнее объявление Intel, Microsoft и DARPA — это программа, разработанная для обеспечения безопасности и шифрования информации, но с использованием этих данных для построения более совершенных моделей или обеспечения лучшего статистического анализа без раскрытия фактических данных. Это называется полностью гомоморфным шифрованием, но оно настолько интенсивно с точки зрения вычислений, что на практике эта концепция почти бесполезна. Эта программа между тремя компаниями является драйвером для предоставления IP и микросхем для ускорения вычислений и создания более безопасной среды для совместного анализа данных.

Следите за своими данными

Защита данных — один из важнейших аспектов будущего вычислительной техники. Объем персональных данных постоянно растет, равно как и ценность этих данных, а также количество необходимых мер правовой защиты. Это усложняет любую обработку личных, частных и конфиденциальных данных, что часто приводит к выделенным разрозненным хранилищам данных, поскольку любая обработка требует передачи данных в сочетании с шифрованием / дешифрованием, что не всегда возможно. Все, что нужно, — это потерять или просочиться один ключ в цепочке, и набор данных будет скомпрометирован.

Есть способ обойти это, известный как полностью гомоморфное шифрование (FHE). FHE дает возможность принимать зашифрованные данные, передавать их туда, где они должны быть, выполнять с ними вычисления и получать результаты, даже не зная точного базового набора данных.

Возьмем, к примеру, анализ записей медицинских данных: если исследователю необходимо обработать определенный набор данных для некоторого анализа, традиционным методом будет шифрование данных, отправка данных, расшифровка данных и их обработка, но с предоставлением исследователю доступ к деталям в записях может быть незаконным или сталкиваться с нормативными проблемами. С помощью FHE этот исследователь может взять зашифрованные данные, провести анализ и получить результат, даже не зная каких-либо особенностей набора данных. Это может включать комбинированный статистический анализ совокупности по нескольким зашифрованным наборам данных или использование этих зашифрованных наборов данных в качестве дополнительных входных данных для обучения алгоритмов машинного обучения, повышая точность за счет большего количества данных. Конечно, исследователь должен верить в полноту и достоверность предоставленных данных, однако это, возможно, другая тема, чем включение вычислений на зашифрованных данных.

Читайте также:
Snapdragon 820 можно будет разогнать до 3 Ггц

Одна из проблем, почему это имеет значение, заключается в том, что лучшее понимание данных происходит из самых больших наборов данных. Это включает в себя возможность обучать нейронную сеть, и лучшие нейронные сети сталкиваются с проблемами нехватки данных или сталкиваются с нормативными препятствиями, когда дело доходит до конфиденциального характера этих данных. Вот почему важно полностью гомоморфное шифрование, способность анализировать данные, не зная их содержимого.

Полностью гомоморфное шифрование как концепция существует уже несколько десятилетий, однако концепция была реализована только в последние 20 лет или около того. В этот начальный период времени был представлен ряд частичных гомоморфных схем шифрования, и с 2010 года было разработано несколько проектов PHE / FHE, способных обрабатывать основные операции с зашифрованными данными или шифротекстами, с рядом библиотек, разработанных в соответствии с отраслевыми стандартами. Некоторые из них имеют открытый исходный код. Многие из этих методов являются сложными в вычислительном отношении по очевидным причинам из-за работы с зашифрованными данными, хотя прилагаются усилия с использованием SIMD-подобной упаковки и других функций для ускорения обработки. Несмотря на то, что схемы FHE ускоряются, это не то же самое, что дешифрование, потому что математика не расшифровывает данные — поскольку данные всегда находятся в зашифрованном состоянии, они могут (возможно) использоваться ненадежными третьими сторонами в качестве основная информация никогда не раскрывается. (Можно возразить, что достаточный набор данных может раскрыть больше, чем предполагалось, несмотря на то, что он зашифрован.)

Сегодняшнее объявление: специальный кремний для FHE

При измерении производительности вычислений FHE результат сравнивается с результатами того же анализа с текстовой версией данных. Из-за вычислительной сложности вычислений FHE текущие методы вычислений существенно медленнее. Методы шифрования для включения FHE могут увеличить размер данных в 100–1000 раз, а затем вычислить эти данные в 10000–1 миллион раз медленнее, чем при обычных вычислениях. Это означает, что одна секунда вычислений с необработанными данными может занять от 3 часов до 12 дней.

Читайте также:
Для поклонников "Звёздных войн" создали музыкальную колонку R2-D2

Таким образом, означает ли это объединение медицинских записей в больницах по штатам или настройку персонального сервиса с использованием личных метаданных, собранных на смартфоне пользователя, FHE в таком масштабе больше не является жизнеспособным решением. Войдите в программу DARPA DPRIVE.

  • DARPA: Агентство перспективных оборонных исследовательских проектов
  • DPRIVE: защита данных в виртуальных средах

Intel объявила, что в рамках программы DPRIVE она подписала соглашение с DARPA о разработке настраиваемого IP-адреса, ведущего к микросхеме, чтобы обеспечить более быстрый FHE в облаке, в частности с Microsoft в облаке Azure и JEDI, первоначально с правительством США. В рамках этого многолетнего проекта специалисты Intel Labs, Intel Design Engineering и Intel Data Platforms Group соберутся вместе, чтобы создать специализированную ASIC для снижения вычислительных затрат на FHE по сравнению с существующими методами на базе ЦП. В пресс-релизе говорится, что цель — сократить время обработки на пять порядков по сравнению с текущими методами, сократив время вычислений с дней до минут.

Intel уже вмешалась, когда дело доходит до FHE, имея исследовательскую группу в Intel Labs, занимающуюся этой проблемой. В первую очередь это было связано с программным обеспечением, стандартами и нормативными препятствиями, но теперь оно также перейдет в проектирование оборудования, облачные стеки программного обеспечения и совместное развертывание в Azure и облаке JEDI для правительства США. Другие выделенные целевые рынки включают здравоохранение, страхование и финансы.

Читайте также:
Обзор материнской платы GIGABYTE Z490 Aorus Master: победа на соревнованиях

Во время дня Intel Labs в декабре 2020 года Intel подробно рассказала о некоторых направлениях, в которых она уже идет в этой работе, а также о стандартах и ​​разработке параллельного традиционного шифрования, но в международном масштабе с учетом дополнительных нормативных препятствий. Microsoft теперь станет частью этого обсуждения с программой DPRIVE, наряду с продолжающимися инвестициями Intel на академическом уровне.

Помимо элемента «пяти порядков величины», сегодняшнее объявление не выходит за рамки этого в постановке окончательных целей и не указывает временные рамки, а вместо этого заявляет, что это «многолетнее» соглашение. Будет интересно посмотреть, как много Intel или их академические организации обсуждают не только сегодняшнюю тему, но и стандартизацию работы.

Связанное чтение