Cos'è un Data Warehouse e come utilizzarlo per il digital marketing?

Home | Blog | Cos'è un Data Warehouse e come utilizzarlo per il digital marketing?

Per le aziende è oggigiorno di vitale importanza affidarsi a sistemi di business intelligence per ridurre i costi, migliorare l’efficienza delle proprie attività e monitorare l’efficacia dei servizi offerti, individuando quelli a maggiore redditività o addirittura individuarne di nuovi anticipando le esigenze di mercato.

L’analisi dei dati quindi è un fattore fondamentale che permette di anticipare i possibili problemi, prevedendo comportamenti ed esigenze dei clienti. Le aziende che basano i loro processi decisionali sui dati risultano infatti più produttive e capaci di raggiungere maggiori profitti rispetto ai competitor. L’ausilio di strumenti informatici per la raccolta e analisi dei dati a supporto dei sistemi di gestione dei processi aziendali sono fondamentali per il business odierno.

Perché usare un Data Warehouse?

I dati sono di vitale importanza per un’azienda, anche se ricavarne informazioni utili per il proprio business non è affatto semplice, infatti spesso si presentano in maniera caotica, con una struttura eterogenea dipendente dai sistemi sorgenti di provenienza, talvolta inoltre sono invalidati da una serie di errori di archiviazione con elementi duplicati, inseriti in modo non corretto, che influiscono sulla qualità finale  del dato da analizzare con possibili conseguenze sull’analisi finale.

Per questi motivi è necessario ricorrere alla definizione di un’architettura con cui vengono definiti gli elementi base di un data warehouse, ovvero uno o più schemi logici (schema dimensionale), algoritmi di integrazione e trasformazione dei dati (ETL) ed infine il sistema di archiviazione adeguato per offrire buone performance rispetto analisi OLAP (On-Line Analytical Processing) necessarie .

Che cos’è un Data Warehouse?

Per Per William H. Inmon, che ne ha proposto una definizione, il data warehouse è una raccolta di dati che si caratterizza per essere:

  • integrata: poiché vi confluiscono dati provenienti da più sistemi transazionali (OLTP) e da fonti esterne.
  • orientata al soggetto: nel data warehouse i dati sono organizzati per soggetto anziché per applicazione.
  • variabile nel tempo: i dati archiviati all'interno di un data warehouse coprono un orizzonte temporale molto più esteso rispetto a quelli archiviati in un sistema operazionale.
  • non volatile: i dati custoditi nel data warehouse non sono modificabili, per questo gli accessi sono consentiti per la sola lettura (read-only).

Con Data Warehousing ci si riferisce al processo volto ad immagazzinare e organizzare le informazioni, ottimizzandone la struttura per un facile accesso e per supportare al meglio il processo decisionale aziendale. In questo processo i dati vengono estratti dalle varie fonti interne o esterne all’azienda, elaborati e ristrutturati all’interno dell’architettura logica del data warehouse per poterne estrarre le informazioni utili per il business aziendale.

Popolamento di un Data Warehouse

Un data warehouse viene quindi popolato tramite un processo ETL (Extraction Transformation and Load) in cui tutti i dati operazionali, esterni ed interni rispetto ai sistemi informatici aziendali, vengono:

  • Estratti
    Attraverso opportuni connettori verso i sistemi di origine i dati vengono interrogati ed estratti per essere inseriti nel DWH;
  • Trasformati
    è la fase principale del processo ETL, i dati devono essere prima filtrati e “puliti” rispetto a criteri di affidabilità e qualità, rimuovendo inconsistenze, errori di estrazione o archiviazione, ed infine “normalizzati” rispetto allo schema logico definito in fase di progettazione;
  • Caricati
    la fase finale in cui i dati vengono caricati nel data sistema di archiviazione scelto, orientato all’ottimizzazione dei processi di lettura (es. Google BigQuery, Sistemi noSQL, etc…).

Modello multidimensionale di un Data Warehouse

È alla base della rappresentazione e l’interrogazione di dati nel data warehouse. A partire dalla definizione delle KPI (Key Performance Indicator), ovvero indicatori sintetici per esprimere in modo sintetico l’andamento di un processo aziendale, vengono identificate le metriche di composizione delle stesse e le possibili dimensioni di visualizzazione.

Le dimensioni definiscono quindi la prospettiva da cui visualizzare una determinata metrica, le metriche invece costituiscono il valore da misurare, sono quindi un valore numerico (es. fatturato, numero di vendite, importo venduto, etc…).

Il nome modello dimensionale deriva quindi dalla definizione di n-dimensioni di analisi della metrica di interesse, rappresentabili tramite un ipercubo, dove il singolo elemento costituisce il fatto (es. vendita di un prodotto) mentre la prospettiva è come visualizzarlo (es. quando, dove, cosa, chi, etc...).

Utilizzo di un Data Warehouse - Data Visualization

Una volta progettato e popolato il data warehouse la fase finale consiste nel progettare dashboard utili al management per visualizzare nel modo più efficace possibile le informazioni raccolte.

In particolare è possibile visualizzare i dati in:

  • Reportistica statica, ovvero estrazioni schedulate dei dati eleborati;
  • Reportistica dinamica (OLAP), analisi dinamiche attraverso strumenti grafici che permettono la “navigazione” del dato raccolto, offrendo funzioni di drill-down, drill-up, drill-through, scomponendo la metrica per le varie dimensioni di analisi;
  • Dashboards che tramite visualizzazioni grafiche (diagrammi, tabelle, etc…) facilitano la lettura del dato.

In conclusione l'era dei big data ha segnato una trasformazione senza precedenti per le imprese, costringendole a confrontarsi con una sfida evolutiva che le ha portate ad adattarsi ai più recenti strumenti di raccolta, integrazione e analisi dei dati, alle nuove ricerche di mercato, ai nuovissimi modelli di web marketing, nonchè ad un inedito rapporto con la clientela.

Strumenti come il data mining, il data warehousing e la data visualization e tutto ciò che compone il complesso mondo della Business Intelligence, sono diventati, nel corso di pochissimi anni, elementi chiave per le aziende che vogliano risultare efficaci nel mercato odierno e in grado di sfidare al meglio la concorrenza.


Stai cercando un'agenzia per approfondire gli argomenti di questo articolo?
Clicca qui per andare alla nostra pagina contatti.

Avatar

Claudio Ponziani

Anno 1981. Laureato in Ingegneria Informatica, dal 2007 ho avuto le prime esperienze lavorative prima come Analista/Sviluppatore per progetti di software gestionali per varie aziende nel settore dei servizi per poi proseguire nel dirigere e coordinare team di sviluppo per software gestionali per PMI nel settore manifatturiero. Dal 2017 ricopro il ruolo di CTO in ByTek Marketing, dove entro in contatto con il mondo del Digital Marketing e della Digital Analytics. Passione, curiosità, innovazione sono costanti sia nel mio lavoro che nel tempo libero che riempio con viaggi (specialmente negli USA), esperimenti in cucina e tanto sport.

Parlaci del tuo Progetto
Condividi con noi i tuoi obiettivi e la tua idea di business