Torna a Eventi FPA

Programma Congressuale

Torna alla home

  da 10:30 a 11:00

RE.L.A.IS.: una soluzione open source per integrare diverse fonti dati. [ lab.83a ]

RELAIS è un progetto open source avente come obiettivo la definizione di un toolkit per risolvere problemi di record linkage (RL). La finalità del RL è quella di individuare stesse unità in fonti dati diverse, anche in assenza di un identificativo univoco. L'obiettivo di risolvere problemi di RL in generale è ambizioso perché le soluzioni finora studiate in letteratura o adottate nella pratica si sono dimostrate efficaci ed efficienti per la risoluzione di specifiche problematiche ma perdono affidabilità in altri contesti. D'altronde i problemi di RL sono fortemente caratterizzati dalla natura dei dati da abbinare e sembra improbabile che un' unica metodologia si riveli indicata in generale. Questa constatazione è alla base della filosofia di RELAIS che non propone un'unica metodologia ma scompone l'intero problema individuandone le fasi costituenti e rende disponibili una collezione di tecniche per affrontare ogni singola fase nelle varie caratterizzazioni possibili. La scelta di approcci opportuni nelle singole fasi permette così di affrontare adeguatamente il problema qualsiasi sia la natura dei dati. L'ambiente tecnologico scelto per lo sviluppo di RELAIS rispecchia la diversa natura delle necessità tecniche avvalendosi di diverse componenti: Java (linguaggio object-oriented) per i moduli orientati alla gestione dei dati, R (linguaggio funzionale) per i moduli orientati al calcolo e Mysql per la memorizzazione dei dati. La scelta open source del progetto apre a tutti l'implementazione di nuove tecniche.

Programma dei lavori

Torna alla home