slides

LOD 2014
LINKED DATA
Come esportare il catalogo di una
biblioteca nel web
POSTER FLASH PRESENTATION
Vittore Casarosa, ISTI-CNR, Pisa
Roma 20 Febbraio 2014
Punto di partenza
 Biblioteca Comunale “G. Puccini” di Torre del Lago.
 Biblioteca inizialmente gestita (contenuti e servizi) attraverso un file Excel
– Biblioteca piccola (circa 7000 volumi)
– Mancanza personale con competenze informatiche
– Mancanza supporto da parte del servizio centrale
 Migrazione a interfaccia grafica (basata su MySQL) per supportare
–
–
–
–
Ricerca libri
Acquisizione nuovi libri
Prestito e restituzione libri
Registrazione nuovi utenti
 Il contenuto del data base (e quindi il catalogo della biblioteca) non e’
visibile ai motori di ricerca, e pertanto il contenuto della biblioteca non e’
accessibile tramite una normale ricerca sul Web
 Opportunita’ di pubblicare il catalogo della biblioteca come Linked Data e
collegarlo a Linked Open Data già presenti nel Web
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
2
Home page
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
3
Risultati di una ricerca
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
4
Amministratore
Gestione libri
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
5
Amministratore
Gestione prestiti
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
6
Da RDB a RDF
 Estrazione del catalogo dal data base, in formato CSV
 Da CSV a RDF con Google Refine (ora OpenRefine)
– Mapping da “campi” CSV a “predicati” RDF
– Definizione delle URI di base delle risorse
 Esportazione grafo RDF in RDF/XML
 Validazione del risultato intermedio con RDF Validator del W3C
 Uso della funzione reconcile di Google Refine per collegare i nomi degli
autori nel data base di partenza con i nomi di persone (sperabilmente di
autori) contenuti in DBpedia.
– Definizione di un nodo intermedio
– Definizione dei campi da riconciliare
– Definizione di predicati aggiuntivi
 Nuovo grafo RDF con link a risorse di Dbpedia
 Validazione del nuovo risultato con RDF Validator
Ljubljana, 18th February 2014
Giuseppe Amato – ISTI-CNR, Pisa, Italy
7
File CSV in OpenRefine
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
8
Mapping a Dublin Core
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
9
Esportazione triple RDF
in RDF/XML
10
Grafo RDF
W3C Validator
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
11
Uso di “reconcile”
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
12
Link a DBpedia
1. Si associano al campo creator
le risorse di Dbpedia, con la
funzione reconcile
2. Il campo della tabella che
era stato selezionato e’
ora collegato alle risorse
di DBpedia
13
Grafo RDF
W3C Validator
14
Conclusioni
 Trasformazione da catalogo tradizionale a Linked Data possibile
anche per piccole entità, con strumenti Open Source
 Possibilità di offrire migliori servizi agli utenti della biblioteca
(quando browsers, crawlers, e motori di ricerca per Linked Data
saranno maggiormente disponibili)
 Limitazioni del lavoro/Sviluppi futuri
– (Meta)dati di partenza molto poveri
– Mapping da campi del data base a elementi di Dublin Core molto
essenziale
– Mancanza di validazione (come autori) dei nomi di DBpedia
 Possibilità di definire link anche con altri Linked Data
 Pubblicazione effettiva dei Linked Data come pagina web con
contenuto RDF/XML o (meglio ancora) come triple store con
SPARQL end point.
 Biblioteca di Torre del Lago non in Internet
Roma, 20 Febbraio 2014
Vittore Casarosa – ISTI-CNR, Pisa
15