Enoncé du projet GMIN332 (soutenance prévue le 16

Enonc´e du projet GMIN332 (soutenance pr´evue le 16 d´ecembre)
1. Probl´
ematique
Il s’agit de mettre en pratique, de la m´ediation de donn´ees, `a partir de sources de donn´ees maintenues par des serveurs h´et´erog`enes. Les syst`emes sous-jacents sont soit des SGBD relationnels, soit
des syst`emes NOSQL (HBase, Neo4J, CouchDB, triplestores natifs (TDB)).
RDF est le mod`ele pivot choisi, pour faciliter l’int´egration des donn´ees h´et´erog`enes. De mani`ere
compl´ementaire, SPARQL est le langage de requˆetage `a exploiter.
Le domaine d’application pr´econis´e, porte sur les entit´es administratives fran¸caises. Cependant rien
n’est oblig´e, et d’autres choix de th´ematique ou de pays seront accept´es.
2. Contenu de la restitution
1. un rapport ´ecrit d’environ 10 pages, dans lequel figurent un sch´ema informel de l’architecture
g´en´erale de l’application et un mod`ele de donn´ees int´egr´e. De mˆeme, vous expliquerez vos choix
en fonction de la probl´ematique impos´ee et vous donnerez les mod`eles de vos sch´emas locaux et
des exemples de requˆetes trait´ees mettant en œuvre l’int´egration de donn´ees h´et´erog`enes.
2. une archive contenant le code de votre travail ou le lien vers un site de d´epˆ
ot
3. une soutenance orale de 20 minutes (avec une d´emonstration comprise)
3. Autres consignes
Le travail (´ecrit, code) peut ˆetre rendu le matin du 16 d´ecembre. Un groupe de projet doit ˆetre
constitu´e de un `
a trois ´etudiants. Un groupe de deux ou trois ´etudiants a pour obligation de fournir
un diagramme des activit´es realis´ees par chacun des ´etudiants du groupe.
4. Travail facultatif
Vous pouvez, si vous souhaitez finaliser votre projet, rendre disponible votre syst`eme int´egr´e au
travers d’un point d’acc`es SPARQL et l’associer `a une couche de visualisation (possiblement en Javascript et avec des librairies comme OpenLayers ou Map4RDF). Ces aspects n’ont pas ´et´e couverts
par l’enseignement du module et restent donc `a votre libre appr´eciation.
1
M2 GMIN332 2014-2015
2
5. Exemples sur les donn´
ees administratives
Un exemple d’int´egration serait d’associer des donn´ees provenant de l’Insee, d’OpenStreetMap,
de Geonames ou encore du site des impˆ
ots. Vous pouvez ainsi disposer pour chaque commune de
ses coordonn´ees g´eographiques, de ses communes voisines, de ses ´equipements (salles de spectacle,
cin´emas, mus´ees, terrains de sport, . . .). Vous pouvez ´egalement vous int´eresser aux populations de ces
communes (donn´ees issues de recensements) : nombre d’habitants, ´evolution de la population au travers
du temps en terme de pyramides des ˆ
ages, de revenus moyens, de cat´egories socio-professionnelles . . ..
6. Liens utiles
6.1
Donn´ees publiques ouvertes
– INSEE (Institut National des Statistiques et des Etudes Economiques) et d´emographie :
http://rdf.insee.fr/demo/index.html
– INSEE et code officiel g´eographique : http://rdf.insee.fr/geo/index.html
– Donn´ees publiques institutionnelles : https://www.data.gouv.fr/fr/
– Impˆot Sur la Fortune (ISF) : https://www.data.gouv.fr/fr/search/ ?q=isf
– Site de Open Data : http://opendatafrance.net/
– Donn´ees publiques de Montpellier : http://opendata.montpelliernumerique.fr/
– Cartographie collaborative (OpenStreetMap) : http://www.openstreetmap.org
– Jeux de donn´ees ouverts : http://www.nosdonnees.fr/dataset
– Donn´ees ouvertes de l’UE (Union Europ´eenne) : https://open-data.europa.eu/fr/data/
– IGN (Institut G´eographique National) : http://www.ign.fr/institut/activites/lign-lopen-data
– M´et´eo France : https://donneespubliques.meteofrance.f
6.2
–
–
–
–
Librairies logicielles
Java et Fuseki (Sparql endpoint) http://jena.apache.org/documentation/serving data/
Librairie Javascript : http ://oeg-dev.dia.fi.upm.es/map4rdf/
Librairie Javascript : http ://openlayers.org/
Librairie Javascript : http ://dev.data2000.no/sgvizler/