Door Thibaut De Vylder, CEO van dFakto

We hebben de oorsprong en de beperkingen gezien van de benaderingen waaruit data-vaulting is voortgekomen.

Data-vaulting is een techniek, een methodologie en een aanpak: de 3 samen. Het is veel meer dan een eenvoudige tool: het vertegenwoordigt een trend in de gegevensmodellering van een organisatie, particulier of openbaar.

Uitgevonden en voortdurend bijgewerkt door Dan Linsted, breidt data-vaulting nu zijn toepassingsgebied uit. Aanvankelijk bedoeld om zware en onafhankelijke datawarehouses met elkaar te verbinden, heeft Dfakto kunnen aantonen dat het toepassingspotentieel veel verder gaat dan deze grote toepassingen door het al meer dan 10 jaar te gebruiken voor kleinere opdrachten om heterogene bronnen met elkaar te verbinden.

different data models and architectures

Laten we voor elk datawarehouse-model (Enterprise DW, Dimensional Design en Data-Vaulting) een voorstelling maken waarin de verwerkingsruimten en/of gegevensopslag worden voorgesteld door zwarte balkjes, om een datawarehouse te bouwen dat wordt gevoed door 3 bronnen en informatie verschaft aan 3 groepen gebruikers:

 

Entreprise Data Warehouse

Dimensional Design

Data Vaulting

2 gekoppelde processen: centralisatie en restitutie Een reeks ETL-processen die gebaseerd zijn op dezelfde gegevens en onderling afhankelijk zijn (voorbeeld: dezelfde verrijkingen in 2 ETL’s. Wat gebeurt er wanneer een verrijking moet worden bijgewerkt?) 3 families van onafhankelijke processen
  • Opslag in de Data Vault
  • Verrijking in de Business Vault
  • Restitutie via data-marts
  Lange opstarttijd   Snelle opstart

  Zwaar onderhoud

  Langetermijnconsistentie

  Snelle opstart

  Licht onderhoud

  De verplichting om hetzelfde team in te zetten voor beide processen   Complexiteit van de ETL

  Beperkte middelen

  3 onafhankelijke processen
  Teams kunnen parallel werken (of elkaar zelfs niet eens kennen!)
  Opleiding en expertise beschikbaar op de markt   Voorkennis van de concepten is niet vereist. Iedereen kan een basis-ETL programmeren!   Noodzakelijk begrip van Data-vaulting-concepten
  Schaalbaarheid   Schaalbaarheid   Ontworpen om te evolueren
  Het model respecteert de 3e normale vorm, gebruikt in de IT   Geen model en dus geen beperkingen   Een model dat de neiging heeft tabellen toe te voegen waarin gegevens worden opgeslagen en verrijkt, waardoor de schijn van complexiteit wordt gewekt.

feilloze naleving van eenvoudige regels.

Soms is het verleidelijk om een kortere weg te kiezen en de basisregels naast zich neer te leggen Uit dFakto’s 10 jaar ervaring met het implementeren van Data-Vaulting hebben we geleerd dat in elk geval waar we de regels niet hebben gevolgd, we er achteraf voor hebben betaald en de installatie opnieuw hebben moeten afstemmen op de basisprincipes.

data-faulting

Ook hebben sommige klanten en prospects die we de afgelopen 10 jaar hebben ontmoet, ons implementaties van data-vaulting laten zien… die er geen waren. Naast de theorie raad ik aan – vooral voor de eerste implementaties – om te werken met consultants die (1) uw bedrijfstaal spreken, (2) data-vaulting al hebben geïmplementeerd en u een echte implementatie kunnen tonen van een op data-vaulting gebaseerde oplossing die daadwerkelijk wordt gebruikt door klanten die kunnen getuigen van hun ervaring en (3) bij wie u zich op uw gemak voelt.

Pin It