Par Thibaut De Vylder, CEO de dFakto

Nous avons vu les origines et les limites des approches ayant donné naissance au data-vaulting.

Le data-vaulting est une technique, une méthodologie et approche : les 3 ensemble. C’est bien plus qu’un simple outil : il représente un courant dans la modélisation des données de l’organisation, privée ou publique.

Inventé et continuellement mis à jour par Dan Linsted, le data-vaulting connait aujourd’hui un accroissement de son champ d’application. Initialement imaginé pour interconnecter des datawarehouses lourds et indépendants, dFakto a pu démontrer que le potentiel d’application dépasse largement ces grandes applications en l’utilisant depuis plus de 10 ans pour des missions de plus petites envergure pour y combiner des sources hétérogènes.

different data models and architectures

Prenons, pour chaque modèle de datawarehouse (Entreprise DW, Dimensional Design et Data-Vaulting), ue représentation dans lequel les espaces de stockage et/ou traitement des données sont représentés par des barrettes noires, pour construire un datawarehouse alimenté par 3 sources et fournissant les informations à 3 groupes d’utilisateurs:

 

Entreprise Data Warehouse

Dimensional Design

Data Vaulting

2 processus liés: centralisation et restitution Une série de processuss ETL basés sur les mêmes données et interdépendants (ex: mêmes enrichissements dans 2 ETL. Quid quand il faut mettre à jour un enrichissement?) 3 familles de processus indépendants
  • Stockage dans le Data Vault
  • Enrichissement dans le Business Vault
  • Restitution via data-marts
  Mise en route longue

  Mise en route rapide

  Maintenance lourde

  Cohérence à long terme

  Mise en route rapide

  Maintenance légère

  Obligation d’utiliser la même équipe pour les 2 processus   Complexité des ETL

  Resources limitées

  3 processus indépendants
  Les équipes peuvent travailler en parallèle (voire ne pas se connaître!)
  Formations et expertise disponibles sur le marché   Pas besoin de connaissance préliminaire des concepts. Chacun peut programmer un ETL de base!   Compréhension nécessaire des concepts Data Vaulting
  Evolutivité   Evolutivité   Conçu pour évoluer
  Le modèle respecte la 3è forme normale, utilisée en IT   Pas de modèle et donc pas de contraintes   Modèle qui a tendance à ajouter des tables dans lesquelles les données sont stockées et enrichies, ce qui donne une apparence de complexité.

En résumé, le DV prend le meilleur des deux mondes mais nécessite un respect sans failles de règles simples. Il est parfois tentant de prendre la tangente et de ne pas respecter les règles de base. L’expérience d’implémentation de Data Vaulting depuis 10 ans de dFakto nous a appris que dans tous les cas où nous n’avons pas respecté les règles, nous l’avons payé a posteriori et avons dû réaligner l’installation avec les principes de base.

data-faulting

Dans la même logique, certains clients et prospects rencontrés au cours de ces 10 dernières années nous ont montré des implémentations de Data Vault qui … n’en étaient pas. Plus que la théorie, je recommande de travailler – surtout pour les premières implémentations – avec des conseillers qui (1) parleront votre langage business, (2) ont déjà implémenté des data-vault et peuvent vous montrer une implémentation réelle de solution basée sur le Data Vaulting, réellement utilisée par des clients qui pourront témoigner de leur expérience et (3) avec lesquels vous vous sentez à l’aise.

Pin It