TD 4 : Calcul du PageRank

L3 Info – L3 MIAGE
Traitement de l’Information
sur le Web
TD 4 : Calcul du PageRank
L’objectif de ce TD est de cr´eer une m´ethode Java de calcul it´eratif du PageRank, dont la formule a ´et´e
vue en cours.
Le graphe des liens ne sera pas construit `
a partir des pages Web, mais sera fourni dans un fichier texte
ayant le format suivant :
a b c d e f g h i j k
d -> a
d -> b
b -> c
c -> b
...
o`
u la premi`ere ligne donne la liste des nœuds du graphe et les suivantes donnent les liens.
La classe WebGraph.java fournie (sur le site du module) permet de :
– Lire le fichier texte repr´esentant le graphe
– Construire une liste de nœuds (String[]) et la liste des liens entrants et sortants, pour chaque nœud
(deux objets de type HashMap<String, ArrayList<String>>).
– Initialiser les PageRanks de chaque nœud `a 1. Les PageRanks sont stock´es dans un objet de type
HashMap<String, Double>.
D’autre part, un fichier exemple graphe.txt repr´esente le graphe suivant :
A
C
B
D
F
G
E
K
H
I
J
1. Terminer la m´ethode getPageRanks de la classe WebGraph pour calculer le PageRank de chaque
page.
2. Tester cette m´ethode avec diff´erentes configurations de graphe. Vous pourrez v´erifier les valeurs
obtenues avec le site http://www.webworkshop.net/pagerank_calculator.php?pgs=11
3. Faites varier le seuil d’arrˆet des it´erations (constante EPSILON). Quel est l’impact de ce seuil sur le
nombre d’it´erations ?
1