Google обещает собирать журналы данных из Oracle и других локальных систем данных SQL для мониторинга, интеграции данных и конвейеров машинного обучения.

Среди последних разработок шоколадной фабрики — Поток данных, разработанная как новая бессерверная служба для отслеживания изменений данных и репликации данных там, где это необходимо.

Геррит Казмайер, генеральный менеджер и вице-президент по базам данных, аналитике данных и Смотритель в Google сказали Реестр система работает «напрямую с логическими журналами базы данных», чтобы понимать состояние данных, вставки, удаления и обновления.

«Это не вызывает никаких накладных расходов на исходную систему, потому что мы не проверяем ее на предмет изменений; мы понимаем изменения в собственном формате. Кроме того, безсерверная инфраструктура означает, что нет бремени по управлению системами », — сказал он.

По словам Казмайера, организации могут захотеть сделать это для анализа изменений данных с помощью одного из инструментов Google, или репликации данных, или введения триггеров для репликации данных для конвейеров данных машинного обучения.

Он доступен на предварительный просмотр для Oracle и MySQL, в облаке или локально. У Google есть «дорожная карта» по внедрению этой услуги в большинство других основных СУБД в этом году.

«Google говорит: если вы сделаете по-нашему, мы сделаем это как можно проще»

Мишель Гетц, вице-президент и главный аналитик Forrester, сказал, что обещание DataStream заключалось в том, что он сокращает вычислительные ресурсы, батарею, задержку и сетевые узкие места за счет сокращения объема данных до того, что необходимо для аналитической модели или события, а не проталкивания всего набор данных и сложный запрос.

Читайте также:
Приложение для передачи файлов с шифрованием через червоточину перезагружает Firefox Send после того, как Mozilla сбежала • Реестр

«Существующее хранилище данных может оставаться на месте и постепенно обновляется. Для стратегий, которые поддерживают локальные компоненты из-за стоимости и безопасности, эти системы сохраняют свой срок службы. Но они также становятся более ценными благодаря DataStream, который создает мост между традиционными системами и современными интеллектуальными операционными средами и сценариями использования », — сказала она.

Google также представляет Dataplex как «интеллектуальную структуру данных» для управления системами данных и Analytics Hub, предназначенную для вырезания и вставки аналитических моделей, созданных с помощью инструментов Google Looker.

По поводу последнего Казмайер сказал: «Вы не только обмениваетесь необработанными наборами данных, но и обмениваетесь моделями Looker и блоками Looker, непосредственно связанными с набором данных. Так что, когда кто-то получает это, они не начинают снова с необработанных данных, они могут использовать всю семантику и анализ, который вы построили ».

Филип Карнелли, младший вице-президент по исследованию программного обеспечения в IDC Europe, сказал, что есть преимущества в обеспечении видимости, управления и интеграции активов данных на единой облачной платформе, но пользователям придется подчиняться «способу работы Google» ».

«Вы, вероятно, собираетесь использовать BigQuery, например, вместо Snowflake, но все это можно заставить работать вместе. Возможно, он немного менее открыт, чем Amazon. Google говорит: «Если вы сделаете это по-нашему, мы сделаем это как можно проще». Это их философия, в то время как Amazon — это скорее набор инструментов », — сказал аналитик. ®

Читайте также:
Google за ненадобностью убрала из Chrome центр уведомлений