Architettura
Funzionale
Unificata
HOLOS
HOLOS adotta un Data Lake unificato con paradigma Lakehouse per ospitare dati strutturati, semi-strutturati e non strutturati in formato nativo (schema-on-read), organizzati in zone Raw, Cleansed e Curated.
Una pipeline di qualità cura profilazione, validazione, normalizzazione e deduplicazione, mentre un’ontologia basata su RDF/OWL unifica i significati e abilita inferenze e Linked Data. Tutti gli eventi sono indicizzati temporalmente su un TSDB con policy di retention e downsampling.
L’accesso è governato da RBAC, principio del Least Privilege e misure GDPR by design (cifratura, pseudonimizzazione, IDAM).
Lo strato di persistenza di HOLOS adotta un modello Lakehouse che integra dati strutturati, semi-strutturati e non strutturati. Le zone Raw, Cleansed e Curated assicurano una gestione progressiva e tracciabile dei dataset, mentre la logica schema-on-read consente analisi e machine learning direttamente sullo stesso repository.
Una pipeline automatizzata cura la profilazione, la validazione e la normalizzazione dei flussi, riducendo errori e ridondanze. L’ontologia basata su RDF e OWL fornisce un linguaggio comune tra domini diversi, consentendo inferenze, mapping dinamici e l’interoperabilità semantica dei dati.
Tutti i dati sono indicizzati temporalmente all’interno di un database time-series che garantisce interrogazioni rapide e affidabili anche su grandi volumi. Meccanismi di downsampling e retention policy ottimizzano la conservazione degli storici e migliorano le performance analitiche.
L’accesso ai dati è regolato da ruoli e livelli di privilegio differenziati secondo il principio del minimo necessario. Tutte le componenti applicano criteri di cifratura in transito e a riposo, pseudonimizzazione delle informazioni sensibili e aderenza ai principi di protezione dei dati fin dalla progettazione.
I flussi di integrazione e validazione sono coordinati da un layer di orchestrazione che sincronizza le diverse zone del Lake, gestisce la propagazione dei metadati e la distribuzione dei dataset verso gli ambienti analitici e applicativi. In questo modo viene garantita coerenza, tracciabilità e continuità operativa su tutto il ciclo del dato.
Il modulo di pubblicazione di HOLOS accompagna l’intero processo di apertura: preparazione, anonimizzazione, licenza e diffusione.
Lo schema sottostante illustra i cinque livelli del modello a stelle e come la piattaforma li abilita.
Formati esempio: PDF, immagine
Il portale di pubblicazione associa una licenza aperta al dataset
Formato esempio: Excel
Esportazione in formati tabellari strutturati
a partire dai dataset interni
Formati esempio: CSV, JSON
Il modulo di export genera formati aperti e standard
Formato esempio: RDF
L’ontologia assegna URI persistenti alle entità
Formato esempio: RDF con link esterni
Il motore semantico mappa gli URI interni a sorgenti esterne creando un grafo connesso