Soda dévoile un magasin de mesure de la santé des données

5 min de lecture

BRUXELLES, 10 décembre 2021 /PRNewswire/ — Soda, fournisseur d’outils Open Source de fiabilité des données et de plateforme d’observabilité des données dans le cloud, vient de lancer Cloud Metrics Store, qui offre des fonctionnalités avancées de test en tant que code pour permettre aux équipes chargées des données d’anticiper les problèmes liés aux données d’une manière plus sophistiquée que jamais. Disponible pour tous les utilisateurs des outils Open Source (OSS) de Soda, Cloud Metrics Store recueille des informations historiques sur la santé des données afin de soutenir les tests intelligents de données dans toutes les charges de travail.

Recevez des notifications avec des nouvelles, des articles et bien plus encore!

Sans une stratégie claire de surveillance des données permettant de détecter les problèmes de qualité, de nombreuses organisations ne parviennent pas à détecter les problèmes qui peuvent compromettre leurs systèmes et entraîner de graves problèmes en aval. Inspirée par les principes modernes de l’ingénierie logicielle, Soda dote les équipes chargées des données des outils nécessaires pour créer une culture et une communauté de bonnes pratiques en matière de données, grâce à la combinaison de la plateforme d’observabilité des données Soda Cloud et de ses outils de fiabilité des données OSS, construits par et pour les ingénieurs en données. La communauté mondiale des données de Soda compte déjà Disney, HelloFresh et Udemy parmi les principaux contributeurs à avoir déployé les outils de fiabilité des données de Soda.

Avec cette dernière version OSS, Cloud Metrics Store donne aux ingénieurs en données et en analyse la possibilité de tester et de valider la santé des données en se basant sur les valeurs précédentes. Ces mesures historiques permettent aux tests de données d’utiliser une compréhension de base de ce à quoi les bonnes données ressemblent, toute mauvaise donnée étant efficacement mise en quarantaine pour examen avant qu’elle n’ait un impact sur les produits de données ou les consommateurs en aval. Les alertes sont envoyées via des outils d’appel populaires ou Slack, de sorte que les équipes chargées des données sont les premières à être informées des problèmes liés aux données et peuvent les résoudre rapidement.

Les outils de fiabilité des données de Soda fonctionnent tout au long du cycle de vie des produits de données. Ainsi, il est facile pour les ingénieurs de données de tester les données lors de l’ingestion à l’aide de Soda, et pour les gestionnaires de produits de données de valider les données avant leur consommation dans des outils tels que Snowflake. Toutes les vérifications peuvent être écrites « en tant que code » dans un langage de configuration facile à apprendre. Les fichiers de configuration sont contrôlés par version et utilisés pour déterminer les tests à exécuter chaque fois que de nouvelles données arrivent dans une plateforme de données. Soda prend en charge toutes les charges de travail liées aux données, y compris l’infrastructure, la science, l’analyse de données et les charges de travail de streaming, aussi bien sur site que dans le cloud.

« Il est avantageux que les équipes de données s’unifient autour d’un langage commun qui leur permet de déterminer à quoi ressemblent de bonnes données tout au long de la chaîne de valeur des données, de l’ingestion à la consommation, indépendamment des rôles, des compétences ou de l’expertise en la matière. Aujourd’hui, la plupart des équipes chargées des données sont organisées par domaine et, lorsqu’elles créent des produits de données, elles dépendent souvent les unes des autres pour disposer de données opportunes, précises et complètes », explique Maarten Masschelein, PDG de Soda. « C’est pourquoi nous sommes ravis de lancer Soda Cloud Metrics Store pour tous les utilisateurs de nos outils OSS, car il représente une autre étape importante dans notre mission de rapprocher tout le monde des données fiables. Cloud Metrics Store aide les équipes chargées des données à être explicites sur les caractéristiques des bonnes données, ce qui permet de conclure des accords entre les équipes de domaine qui peuvent être facilement surveillés et suivis. Les équipes chargées des produits de données ont ainsi la liberté de travailler sur la prochaine grande innovation. »

À partir d’aujourd’hui, tous les utilisateurs de Soda SQL peuvent accéder à Cloud Metrics Store. Vous trouverez plus d’informations sur la façon de démarrer avec Cloud Metrics Store ici.

À propos de Soda

Soda est la société de fiabilité des données qui fournit des outils Open Source (OSS) et SaaS permettant aux équipes chargées des données de découvrir, de hiérarchiser et de résoudre les problèmes liés aux données. La mission de Soda est de rapprocher tout le monde des données, ce qui permet d’obtenir des produits de données et des analyses auxquels tout le monde peut faire confiance. Soda a été citée dans le rapport Gartner® Cool Vendors™ 2021 pour la gestion des données [1], ce qui est une reconnaissance et une approbation de notre approche pour relever le défi numéro un de la gestion des données auquel sont confrontées les organisations modernes : garantir la disponibilité de données de haute qualité et fiables pour permettre une prise de décision en toute confiance, servir et ravir les clients, et améliorer les processus. Pour plus d’informations, consultez le site soda.io.

 [1] Gartner « Cool Vendors in Data Management », Philip Russom, Ehtisham Zaidi, Jason Medd, Eric Thoo, Robert Thanaraj, 1er juin 2021 – ID G00746797