V predchdzajcom člnku som psal o vhodu zaoberajce sa zmenami v jednom rozmere pomocou Slowly Changing dimenzie typu 2 Kimball princp, ktor vytvra nov riadok v rmci dimenzie. To vysvetľuje vhody tejto metdy, a ako to funguje. Niie je popsan vhody pouitia T-SQL skriptov pred ETL nstroj pre aktualizciu rozmer.
Čo vm ovldanie?
Aktualizcia rozmer je nuda. Devť z desiatich koľkokrt ste to ist trik znova. Budete mať dtov tok zo zdroja systmu a dtovho toku z jednho rozmeru. Ponechajte si spolu a potom sa uistite sa, e budete mať vdy tri veci:
- Existuj nejak zmeny, ku ktorm dolo;
- S odstrni;
- Existuj logick zmae.
Zmenou je prechod z poľa v zdroji systmu, ktor m vplyv na atribtu v rmci rozmer, naprklad priezvisko zkaznka zmenilo, pretoe on bol enat. Vymazať zznam, ktor u nie je fyzicky prtomn v source systme a logick vymazať zznam s ochrannou znmkou, ktor je označen ako zmazan.
Nstroj alebo SQL?
Ak chcete overiť tieto tri vlastnosti s odlin metdy. Mete ETL nstroj, ako s SQL Server Integration Services, alebo si mete postaviť sami skript / generovať tto kontrolu za vs. Vdy som bol v prospech nstrojov. Nstroje s self-dokumentovať a pri veľa prce. Teraz robm projekt, v ktorom je veľa akci manipulovať bez SQL nradia, vidm viac a viac vhod nstrojov ignorovať.
Vhody:
- Zabraňuje problmom s prechodom verzie
- Vytvoriť Baar
- Vdy prce
- Ovldateľnosť
Nevhody:
- Komplexn a menej organizovanch
- Viac počiatočn vvojov prce
ETL nstroje s self-documentered. Pomocou nstrojov ako je Data Flow lohy alebo odvoden stĺpci mete vidieť, čo sa stalo. Nstroje s tie rchlejie k pochopeniu ako kd zplaty. Napokon, stavebn vlastn ETL samozrejme oveľa viac prce. Napriek tomu tu Myslm si, e si vybral dlhodobej prospech. Ak vae rieenie dtovho skladu, akonhle je klovateľn a ovldateľnej. Take mj nzor na pouvanie SQL vs TOOLS.






















Tagy 