Enonc´e du projet GMIN332 (soutenance pr´evue le 16 d´ecembre) 1. Probl´ ematique Il s’agit de mettre en pratique, de la m´ediation de donn´ees, `a partir de sources de donn´ees maintenues par des serveurs h´et´erog`enes. Les syst`emes sous-jacents sont soit des SGBD relationnels, soit des syst`emes NOSQL (HBase, Neo4J, CouchDB, triplestores natifs (TDB)). RDF est le mod`ele pivot choisi, pour faciliter l’int´egration des donn´ees h´et´erog`enes. De mani`ere compl´ementaire, SPARQL est le langage de requˆetage `a exploiter. Le domaine d’application pr´econis´e, porte sur les entit´es administratives fran¸caises. Cependant rien n’est oblig´e, et d’autres choix de th´ematique ou de pays seront accept´es. 2. Contenu de la restitution 1. un rapport ´ecrit d’environ 10 pages, dans lequel figurent un sch´ema informel de l’architecture g´en´erale de l’application et un mod`ele de donn´ees int´egr´e. De mˆeme, vous expliquerez vos choix en fonction de la probl´ematique impos´ee et vous donnerez les mod`eles de vos sch´emas locaux et des exemples de requˆetes trait´ees mettant en œuvre l’int´egration de donn´ees h´et´erog`enes. 2. une archive contenant le code de votre travail ou le lien vers un site de d´epˆ ot 3. une soutenance orale de 20 minutes (avec une d´emonstration comprise) 3. Autres consignes Le travail (´ecrit, code) peut ˆetre rendu le matin du 16 d´ecembre. Un groupe de projet doit ˆetre constitu´e de un ` a trois ´etudiants. Un groupe de deux ou trois ´etudiants a pour obligation de fournir un diagramme des activit´es realis´ees par chacun des ´etudiants du groupe. 4. Travail facultatif Vous pouvez, si vous souhaitez finaliser votre projet, rendre disponible votre syst`eme int´egr´e au travers d’un point d’acc`es SPARQL et l’associer `a une couche de visualisation (possiblement en Javascript et avec des librairies comme OpenLayers ou Map4RDF). Ces aspects n’ont pas ´et´e couverts par l’enseignement du module et restent donc `a votre libre appr´eciation. 1 M2 GMIN332 2014-2015 2 5. Exemples sur les donn´ ees administratives Un exemple d’int´egration serait d’associer des donn´ees provenant de l’Insee, d’OpenStreetMap, de Geonames ou encore du site des impˆ ots. Vous pouvez ainsi disposer pour chaque commune de ses coordonn´ees g´eographiques, de ses communes voisines, de ses ´equipements (salles de spectacle, cin´emas, mus´ees, terrains de sport, . . .). Vous pouvez ´egalement vous int´eresser aux populations de ces communes (donn´ees issues de recensements) : nombre d’habitants, ´evolution de la population au travers du temps en terme de pyramides des ˆ ages, de revenus moyens, de cat´egories socio-professionnelles . . .. 6. Liens utiles 6.1 Donn´ees publiques ouvertes – INSEE (Institut National des Statistiques et des Etudes Economiques) et d´emographie : http://rdf.insee.fr/demo/index.html – INSEE et code officiel g´eographique : http://rdf.insee.fr/geo/index.html – Donn´ees publiques institutionnelles : https://www.data.gouv.fr/fr/ – Impˆot Sur la Fortune (ISF) : https://www.data.gouv.fr/fr/search/ ?q=isf – Site de Open Data : http://opendatafrance.net/ – Donn´ees publiques de Montpellier : http://opendata.montpelliernumerique.fr/ – Cartographie collaborative (OpenStreetMap) : http://www.openstreetmap.org – Jeux de donn´ees ouverts : http://www.nosdonnees.fr/dataset – Donn´ees ouvertes de l’UE (Union Europ´eenne) : https://open-data.europa.eu/fr/data/ – IGN (Institut G´eographique National) : http://www.ign.fr/institut/activites/lign-lopen-data – M´et´eo France : https://donneespubliques.meteofrance.f 6.2 – – – – Librairies logicielles Java et Fuseki (Sparql endpoint) http://jena.apache.org/documentation/serving data/ Librairie Javascript : http ://oeg-dev.dia.fi.upm.es/map4rdf/ Librairie Javascript : http ://openlayers.org/ Librairie Javascript : http ://dev.data2000.no/sgvizler/
© Copyright 2024 ExpyDoc