Зажигать Microsoft выпустила Azure Synapse Link для Cosmos DB в общую доступность, чтобы приблизить свою транзакционную базу данных NoSQL к хранилищу данных «рабочей лошадки» аналитики.

Яндекс

Дразнил в Май прошлого годаMicrosoft заявила, что связь будет состоять из двух основных компонентов.

Во-первых, Cosmos DB будет содержать аналитическое хранилище, ориентированное на столбцы, внутри контейнеров в дополнение к существующему хранилищу транзакций, ориентированному на строки. «Аналитическое хранилище полностью изолировано от транзакционного хранилища, так что запросы к аналитическому хранилищу не влияют на ваши транзакционные рабочие нагрузки», — заявили разработчики Рамнандан Кришнамурти и Шри Чинтала. сообщение в блоге прошедший год.

Sql - концептуальная иллюстрация озера

Databricks: Ух, вы только посмотрите на эту грязную среду озера данных. Прищуривает. Вы знаете … мы могли бы разобраться с этим с помощью сладкого кадра SQL

ПРОЧИТАЙТЕ БОЛЬШЕ

Во-вторых, Azure Synapse Analytics будет предлагать поддержку времени выполнения, то есть «встроенную интеграцию» аналитического хранилища Azure Cosmos DB с различными средами выполнения аналитики, поддерживаемыми Azure Synapse Analytics, такими как Apache Spark и Synapse SQL Serverless.

Идея анализа данных о транзакциях в реальном времени отнюдь не нова. В мире реляционных баз данных лишь несколько примеров включают подход MariaDB, включающий хранение столбчатых данных в хранилище объектов в базе данных, и Oracle Платформа облачной обработки данных, которая выполняет аналитику непосредственно в своих базах данных бизнес-приложений.

Читайте также:
Вы предпочитаете изучать теорию, инструменты или и то, и другое? Continuous Lifecycle Online помещает все это на ваш рабочий стол °

Тем не менее, ссылка Synapase для Azure CosmosDb, позволяющая игрокам напрямую подключаться к своим контейнерам Azure Cosmos DB из Azure Synapse Analytics и получать доступ к аналитическому хранилищу без отдельных соединителей, была важной вехой для Microsoft, сказал Ноэль Юханна, ветеран и главный аналитик Forrester. .

«Мы обнаруживаем растущий спрос на аналитику в режиме, близком к реальному времени, во многих вертикальных отраслях, включая финансовые услуги, розничную торговлю и здравоохранение. Однако задержка в перемещении и обработке данных из транзакционных систем часто замедляет эту инициативу».

Обсуждая связь между системами OLTP (транзакционная) и OLAP (аналитическая), он добавил: «Связь с Azure Synapse для Azure CosmosDB сближает OLTP и OLAP, что поможет организациям поддерживать аналитику в реальном времени с минимальными усилиями», — сказал он. .

Решение Microsoft по внедрению еще одного источника Azure в среду Synapse понравится клиентам, использующим CosmosDB для крупномасштабных и распределенных приложений, а дополнительный API MongoDB сделает CosmosDB более привлекательной для тех, кто знаком с базой данных Document NoSQL, сказал Дуг Хеншен, вице-президент. и главный аналитик Constellation Research.

«Интеграция между CosmosDB и Synapse упростит использование данных в CosmosDB в контексте обработки данных, инженерии данных и аналитики SQL, поддерживаемых Synapse», — сказал он.

Дополнительные настройки Cosmos

Microsoft также объявила об общедоступности поддержки сервера Mongo v4.0 в API Azure Cosmos DB для службы Mongo DB, призванной упростить разработчикам использование базы данных для обработки ошибок с поддержкой многодокументных транзакций и «повторной» записи.

Читайте также:
Реагируйте везде, Jest, Webpack на подъеме ... если бы только у него была статическая типизация, вздыхают разработчики • Регистр

В предварительной версии доступны непрерывное резервное копирование и резервное копирование на определенный момент времени в Azure Cosmos DB, предназначенное для восстановления данных с любой точки в течение последних 30 дней. Управление доступом на основе ролей Cosmos DB также доступно в предварительной версии.

Что касается хранилищ данных, Microsoft запускает Azure Synapse Pathway, функцию, предназначенную для упрощения перехода от устаревшего или облачного хранилища данных к Azure.

Хеншен из Constellation Research заявил, что разработка обещает «перенести в Synapse популярные сторонние источники данных, такие как Teradata, Snowflake, IBM Netezza, AWS Redshift, SQL Server и Google BigQuery».

Synapse сравнивается с другими облачными хранилищами данных, включая Redshift, BigQuery и — с его взрывным IPO на 33 млрд долларов Привлечение внимания к рынку — Снежинка.

Хотя для Synapse это только начало, «многие компании и заказчики, по крайней мере, уже давно устали», — сказал Хеншен, хотя добавил, что «неясно, сколько из этих развертываний можно охарактеризовать как полностью готовое».

По его словам, Synapse также выделяется благодаря использованию возможностей озера данных на базе Spark и среды хранилища на основе SQL, работающей с совместно используемыми и последовательно защищенными и управляемыми данными.

«Это не то же самое, что службы баз данных BigQuery, Snowflake и Redshift, но они представляют собой конкуренцию в том смысле, что это облачный вариант для крупномасштабного хранилища SQL и аналитики.

Читайте также:
Можно ли обмануть ваш код AI с помощью вандализма или умных формулировок? Microsoft открыла исходный код инструмента для проверки этого • Регистр

«На данный момент Synapse только начинается, и я пока не вижу большого количества прямых конкурентных оценок. Synapse, несомненно, будет вариантом, который рассмотрит любой клиент, ориентированный на Azure», — отметил Хеншен.

Подойдя к проблеме с другой стороны, Databricks в прошлом году перешла на внедрение SQL в среду озера данных с запуск своей SQL Analytics чтобы обратиться к BI в своем Spark-based Delta Lake. ®