martedì 23 ottobre 2012

Un articolo scientifico di un team di ricercatori del Politecnico di Bari premiato in Austria

Tommaso Di Noia
Accesso all’informazione sul Web personalizzato, intelligente e aggiornato, sono i contenuti di un articolo scientifico, premiato con il “Best Scientific Paper Award” (Premio come Miglior Contributo Scientifico) alla 8th International Conference on Semantic Systems a Graz in Austria. 
La ricerca, dal titolo “Linked Open Data to support Content-based Recommender Systems”, è stata scritta da un team di ricerca afferente al Politecnico di Bari composto dai ricercatori: Tommaso Di Noia (coordinatore), Roberto Mirizzi, Vito Claudio Ostuni, Davide Romito e da Markus Zanker dell'Università di Klagenfurt (Austria). Il contributo di ricerca propone di sfruttare in maniera innovativa le informazioni codificate nella cosiddetta nuvola di “Linked Open Data”. Infatti, il World Wide Web (WWW), sta evolvendo da un Web composto da ipertesti ad un Web composto da “iperdati”. “Per questo motivi si parla sempre di più di Web dei dati – dice Tommaso Di Noia, ricercatore presso la Facoltà di Ingegneria di Bari - in contrapposizione al classico Web dei documenti. Grazie alla diffusione del Web Semantico e alla più recente iniziativa dei Linked Open Data, una vasta mole di dati codificati in linguaggio RDF, sistematizzati in collezioni, è liberamente raggiungibile sul Web. L'idea alla base del Web Semantico (proposta per la prima volta in un articolo del 2001 dall'inventore del Web, Tim Berners-Lee) – continua - è quella di far evolvere il modo in cui viene rappresentata l'informazione disponibile su Internet così che possa essere compresa ed elaborata in maniera automatica da degli agenti software. Questa evoluzione passa attraverso la codifica dei dati attraverso un linguaggio che renda possibile rappresentare non solo i dati “per se” ma anche il loro significato. Il linguaggio principe per tale codifica è RDF (Resource Description Framework). Cerchiamo di spiegare il concetto con l'ausilio di un esempio. Se leggiamo su una pagina Web la parola “Roma”, la associamo subito alla corrispondente città e a tutte le informazioni che abbiamo su di essa. In altri termini, come esseri umani, siamo in grado di associare un significato (semantica) alle parole collegandole alle entità corrispondenti. Grazie a questa associazione possiamo aggregare informazioni e dati e operare dei processi di ragionamento su di essi. Dall'altro lato, per un agente software che processa l'informazione (testuale) contenuta nella stessa pagina, la parola “Roma” è soltanto una sequenza di quattro caratteri. L'agente non è in grado, da solo, di dare un significato alla sequenza di caratteri e di operare alcuni dei processi inferenziali di cui siamo capaci. Ed è in questo passaggio che interviene RDF. Grazie ad esso è possibile associare una semantica esplicita alla parola Roma e di conseguenza collegarla alla entità corrispondente. Se poi si hanno a disposizione ulteriori dati codificati in RDF su questa entità, l'agente può sfruttarli per “ragionare” su di essi. In altre parole, il dato si trasforma in conoscenza. 
Al giorno d'oggi, esistono intere collezioni di dati (anche note come dataset) in RDF relativi a diversi domini di conoscenza. Abbiamo dataset relativi ai film, altri relativi ad informazioni geografiche. È inoltre disponibile una versione RDF della ben nota enciclopedia on-line Wikipedia. I dati contenuti nelle collezioni sono molto spesso liberamente fruibili e aperti, ecco perché ci si riferisce ad essi come Open Data (dati aperti). Se tutte queste collezioni di dati fossero tra loro isolate, sarebbe difficile aggregare informazioni rilevanti tra di loro appartenenti a domini di conoscenza differenti. Al fine di evitare tutto questo, l'iniziativa Linked Open Data (dati aperti e collegati) favorisce l'interconnessione tra dataset disponibili online. Data la loro natura interconnessa, ci si riferisce ad essi come alla “nuvola dei Linked Open Data”. 
Nonostante esista una immensa quantità di dati in formato RDF disponibile sul Web – conclude -attualmente sono disponibili solo un esiguo numero di applicazioni che ne sfruttino completamente il loro potenziale”. 
Nell'articolo scientifico presentato e premiato, gli autori mostrano come gli Open Data possano essere sfruttati con successo per sviluppare un sistema di accesso personalizzato all'informazione che si basi esclusivamente sui dati e sulla conoscenza codificata nella nuvola dei Linked Open Data. Come prototipo per validare i risultati ottenuti è stato sviluppato un sistema di raccomandazione (nel senso anglosassone del termine) per suggerire ad un utente nuovi film da vedere. Un approccio alla raccomandazione basato su Linked Open Data permette di superare due grossi problemi tipici di tali sistemi: la freschezza dell'informazione e la sua completezza. Grazie al continuo aggiornamento dei dataset presenti on-line, l'informazione disponibile è sempre aggiornata. Inoltre, data la vastità dei dati presenti e la loro forte interconnessione è possibile sfruttare molta più conoscenza rispetto a quella utilizzata da sistemi analoghi che si basano sull'analisi del testo. 
A seguito della comunicazione del premio, viva soddisfazione hanno espresso al dott. Di Noia il Rettore del Politecnico, prof. Nicola Costantino, e il prof. Eugenio Di Sciascio, coordinatore del laboratorio di ricerca in Sistemi Informativi del Politecnico di Bari nell’ambito del quale il dott. Di Noia opera.
di Eliona Cela

Nessun commento:

Posta un commento