L3 Info – L3 MIAGE Traitement de l’Information sur le Web TD 4 : Calcul du PageRank L’objectif de ce TD est de cr´eer une m´ethode Java de calcul it´eratif du PageRank, dont la formule a ´et´e vue en cours. Le graphe des liens ne sera pas construit ` a partir des pages Web, mais sera fourni dans un fichier texte ayant le format suivant : a b c d e f g h i j k d -> a d -> b b -> c c -> b ... o` u la premi`ere ligne donne la liste des nœuds du graphe et les suivantes donnent les liens. La classe WebGraph.java fournie (sur le site du module) permet de : – Lire le fichier texte repr´esentant le graphe – Construire une liste de nœuds (String[]) et la liste des liens entrants et sortants, pour chaque nœud (deux objets de type HashMap<String, ArrayList<String>>). – Initialiser les PageRanks de chaque nœud `a 1. Les PageRanks sont stock´es dans un objet de type HashMap<String, Double>. D’autre part, un fichier exemple graphe.txt repr´esente le graphe suivant : A C B D F G E K H I J 1. Terminer la m´ethode getPageRanks de la classe WebGraph pour calculer le PageRank de chaque page. 2. Tester cette m´ethode avec diff´erentes configurations de graphe. Vous pourrez v´erifier les valeurs obtenues avec le site http://www.webworkshop.net/pagerank_calculator.php?pgs=11 3. Faites varier le seuil d’arrˆet des it´erations (constante EPSILON). Quel est l’impact de ce seuil sur le nombre d’it´erations ? 1
© Copyright 2025 ExpyDoc