La mise à jour de Collibra cible la qualité, la lignée et la découverte des données
MaisonMaison > Blog > La mise à jour de Collibra cible la qualité, la lignée et la découverte des données

La mise à jour de Collibra cible la qualité, la lignée et la découverte des données

Jun 24, 2023

Getty Images/iStockphoto

Collibra a mis à jour mardi son Data Intelligence Cloud avec des flux de travail prédéfinis visant à rendre les données plus visibles sur plusieurs sources et de nouvelles fonctionnalités conçues pour améliorer la qualité des données.

En outre, le fournisseur de gestion de données a dévoilé une série d'intégrations nouvelles et améliorées pour accroître la connectivité avec ses partenaires technologiques.

Basé à New York et à Bruxelles, Collibra est un fournisseur basé sur le cloud dont le Data Intelligence Cloud permet aux clients d'automatiser le processus de préparation des données. Parmi ses fonctionnalités figurent la notation des données, qui mesure la qualité des données pour montrer si les données peuvent être fiables et utilisées pour l'analyse, et les capacités de gouvernance des données qui aident à se conformer aux réglementations.

Les concurrents incluent d'autres fournisseurs indépendants de gestion de données, tels qu'Alation et Informatica.

Les mises à jour récentes de Collibra incluent une intégration avec Snowflake et le lancement d'un nouvel outil pour mesurer la maturité des données d'une organisation par rapport à ses pairs.

En outre, le fournisseur a révélé le mois dernier que son Data Intelligence Cloud était devenu une application approuvée sur le SAP Store dans le cadre du partenariat des fournisseurs qui a commencé avec le lancement par SAP de son Datasphere en mars.

L'amélioration de la qualité des données et de l'observabilité sont désormais des domaines prioritaires pour Collibra, selon Laura Sellers, chef de produit du fournisseur.

En conséquence, la dernière mise à jour Data Intelligence Cloud de Collibra inclut de nouvelles intégrations conçues pour augmenter la connectivité et permettre aux clients de mieux gérer leurs données.

Parmi eux se trouvent de nouvelles intégrations avec les éléments suivants :

De plus, la mise à jour inclut de nouvelles intégrations avec les plateformes d'analyse MicroStrategy, Power BI et Tableau.

Selon Stephen Catanzano, analyste au sein du groupe de stratégie d'entreprise de TechTarget, chacune des intégrations est importante car elle offre aux utilisateurs de Collibra une meilleure visibilité sur leurs différents systèmes de données, ce qui peut entraîner des économies de coûts.

"L'intelligence pour [les utilisateurs] est la visibilité pour améliorer l'efficacité et réduire les coûts", a-t-il déclaré. "Ces nouvelles fonctionnalités élargissent les systèmes auxquels ils peuvent se connecter. L'intégration avec Google Cloud Storage les fait entrer dans la structure Google, ce qui est important. Les intégrations avec les outils de BI sont également passionnantes car elles sont intensives en données et en traitement et les domaines où les économies de coûts peuvent être grand."

Les vendeurs, quant à eux, ont noté que les consommateurs de données utilisent les outils d'une myriade de fournisseurs. Pour répondre à leurs besoins, Collibra - et d'autres fournisseurs - développent des partenariats pour créer des écosystèmes pour la gestion et l'analyse des données.

"Les partenariats sont essentiels pour nous", a déclaré Sellers. "Il n'y a pas une seule entreprise que j'ai vue qui ait ses données dans un seul cloud. Ils traitent de sources hybrides, de plusieurs clouds et de logiciels sur site. Cette version concerne donc tout ce qui concerne les partenariats pour nous."

Au-delà des nouvelles intégrations, de nouveaux outils visant à améliorer la qualité des données incluent la disponibilité générale de Data Quality Pushdown pour Snowflake et les tests bêta publics de Data Quality pour Databricks.

Grâce à ces outils, les clients communs de Collibra et de Snowflake ou Databricks peuvent traiter les données directement dans leurs référentiels de stockage de données cloud, éliminant ainsi le besoin de déplacer les données de Snowflake ou Databricks vers Collibra pour la préparation, puis de les renvoyer vers Snowflake ou Databricks.

Cela permet d'économiser du temps, des efforts et du coût de sortie des données, tout en augmentant la sécurité en réduisant le mouvement des données. De plus, les versions Data Quality Pushdown incluent des capacités de détection automatisée des anomalies, ce qui améliore encore l'efficacité.

En fin de compte, cependant, le principal avantage des Data Quality Pushdowns est l'augmentation du délai de rentabilisation, selon les vendeurs.

"Il s'agit de pouvoir … traiter les données en toute sécurité directement là où elles se trouvent. Il n'y a pas de mouvement de données, donc pas besoin de sortie de données", a-t-elle déclaré.

Les vendeurs ont ajouté que bien que Data Quality Pushdown pour Snowflake soit généralement disponible et que Data Quality Pushdown pour Databricks soit en test bêta public, Collibra prévoit d'ajouter des outils similaires de Data Quality Pushdown pour d'autres référentiels de stockage de données cloud, notamment Amazon Redshift, Google BigQuery et Microsoft Azure.

"Pour ces acteurs du cloud, nous voulons aller aussi loin que possible afin de pouvoir prendre en charge tous ceux qui se trouvent dans ces écosystèmes avec toute l'étendue des fonctionnalités qui existent au sein de notre plate-forme", a-t-elle déclaré.

Les nouveaux flux de travail prédéfinis qui traitent du lignage des données et de la découverte des données sont également d'une importance potentielle pour les utilisateurs de Collibra.

Les flux de travail font partie de Workflow Designer, qui est maintenant en test bêta public. Les utilisateurs peuvent simplement cliquer sur un bouton "déploiement du flux de travail" pour déployer.

La configuration du lignage des données permet un accès rapide aux informations de lignage des données et comprend des intégrations prédéfinies. Le Collibra Data Marketplace, quant à lui, est livré avec une interface en libre-service qui permet aux utilisateurs de découvrir facilement les données, selon le fournisseur.

Bien que la dernière mise à jour de Collibra ajoute de la visibilité sur plusieurs sources et cible la qualité des données, elle n'ajoute pas de capacités d'IA génératives.

Au cours des sept mois qui ont suivi le lancement d'OpenAI ChatGPT, qui a marqué une avancée significative dans les capacités des grands modèles de langage, de nombreux fournisseurs de gestion et d'analyse de données ont dévoilé des plans pour infuser l'IA générative sur leurs plates-formes.

L'espoir de nombreux fournisseurs est que l'IA générative puisse rendre les outils de gestion et d'analyse des données utilisables par plus que de simples experts en données au sein des organisations. Cela permettrait d'accomplir cela en éliminant le besoin de connaître le code et en réduisant le niveau de littératie des données actuellement requis pour travailler avec des données.

Cependant, avec des inquiétudes persistantes concernant la sécurité des plates-formes d'IA générative et l'exactitude de leurs données, même les fournisseurs qui ont dévoilé des plans pour intégrer l'IA générative n'ont pas encore mis à disposition générale des capacités axées sur l'IA générative.

Collibra, quant à lui, prévoit d'intégrer l'IA générative une fois qu'il pourra le faire en toute sécurité, selon les vendeurs.

"L'IA générative est un énorme perturbateur et est vraiment excitante", a-t-elle déclaré. "Je crois vraiment, vraiment que cela va changer l'expérience utilisateur dans tous les logiciels. Mais ce n'est pas un domaine dans lequel nous étions prêts à publier quoi que ce soit avec cette mise à jour. Nous cherchons définitivement à en tirer parti dans le produit pour offrir une meilleure expérience et une automatisation plus intelligente."

Au-delà de l'IA générative et d'autres refoulements de la qualité des données, les vendeurs ont ajouté que la feuille de route de Collibra est essentiellement axée sur la simplification de la gestion des données pour les utilisateurs.

Catanzano, quant à lui, a déclaré qu'il aimerait voir Collibra et d'autres fournisseurs aider les organisations à surveiller le coût du traitement de l'IA. La plupart des traitements de l'IA sont effectués dans le cloud, et de nombreuses organisations ont du mal à maîtriser les coûts du cloud computing.

"J'aimerais davantage me concentrer sur la réduction des coûts de l'IA", a déclaré Catanzano. "Le traitement de l'IA coûte une fortune. Si [Collibra] peut surveiller et gérer les coûts là-bas, ce serait passionnant."

Eric Avidon est rédacteur senior pour TechTarget Editorial et journaliste avec plus de 25 ans d'expérience. Il couvre l'analyse et la gestion des données.

Stephen Catanzano