Kein Folientitel

LOGPAT
ein webbasiertes Tool zur Analyse von
Navigationsverläufen in Hypertexten
Stephan Noller, humanIT
Johannes Naumann, Universität zu Köln
Tobias Richter, Universität zu Köln
Gliederung
1.
2.
3.
4.
5.
6.
7.
Warum Logfile-Analyse?
Bedeutung für Hypertextforschung
Einsatzbereiche
Analysemöglichkeiten/Kennwerte
Vorstellung: LOGPAT
Anwendungsbeispiel live!
Lizenzmodell, Ausblick
Logfile-Analyse: Hintergrund
Logfiles: automatisch erstellte
Interaktionsprotokolle
• hohe Objektivität
• niedrige Reaktivität
• ökonomisch zu erheben
• leichte Weiterverarbeitung
• aber: Datenwüste!
Bedeutung für die Hypertextforschung
• Hypertexte: individuelle Sequenzierung
des Seitenabrufs
• verschiedene Strategien werden
unterschieden:
– zielgerichtete Suche
– zweckgebundenes Stöbern
– exploratives Stöbern
– tiefe vs. breite Exploration
Bedeutung für die Hypertextforschung
• In den Navigationsverläufen schlagen
sich psychologische Merkmale nieder:
– Verarbeitungsstrategien
– Vorwissen
– Interessen
• aber auch Merkmale des Materials:
– Charakteristika der Navigationshilfen
– Charakteristika des Hypertextes
Analysemöglichkeiten I
atomistische Kennwerte
• Anzahl bestimmter Seitentypen, z.B.
– Überblicks- vs. Inhaltsseiten
– wie oft wurden Suchseiten verwendet?
– gibt es inhaltliche Schwerpunkte, d.h.
werden bestimmte Bereiche verstärkt
aufgesucht?
Analysemöglichkeiten II
Sequenzanalyse
• welche Sequenzen tauchen besonders
häufig auf?
• Wie häufig wird mit der Back-Taste
gearbeitet?
• Wie häufig wird „durchgeblättert“?
• Gibt es typische Loops oder
Sackgassen?
Analysemöglichkeiten III
graphentheoretische Kennwerte
Grundgedanke: Logfile = Graph  wird in einer asymmetrischen
Distanzmatrix abgebildet
•
•
•
•
•
stratum: „Linearität“ des Pfades
compactness: „Vernetztheit“ des Pfades
Relative In-Centrality (RIC)
Relative Out-Centrality (ROC)
heuristische Analyse anhand der
Distanzmatrix
Graphentheorie: Hintergrund
Linearer Pfad
A B  C  D
Als Graph
A
B
Vernetzter Pfad
A B  A  C  D
Als Graph
A
B
C
C
D
Distanz von B  A: 
D
Distanz von B  A: 1
Warum ein neues Tool?
• es gibt kein Tool welches die
erwünschte Funktionalität anbietet
• Zusammenfassung der genannten
Analysemöglichkeiten unter einer
einheitlichen Oberfläche
• GPL-Programmierung  Möglichkeit
der Anpassung und Weiterentwicklung
nach eigener Fragestellung
LOGPAT
Programmiersprache, Umgebung, Anforderungen
• Logpat wurde mit der einfach zu
erlernenden Sprache PHP entwickelt
• es wird auf einem Webserver installiert
und beinhaltet eine Benutzerverwaltung
• mehrere Nutzer können gleichzeitig mit
dem Tool arbeiten
• keine zusätzliche Software-Installation
auf dem Clientsystem erforderlich
LOGPAT
Single File-Analyse
LOGPAT
Single File-Analyse: Output I
Sequenzen und
Kennwerte
Musteranalyse
mit Patternfile
LOGPAT
Single File-Analyse: Output II
Distanz-Matrix
LOGPAT
Multi File-Analyse
LOGPAT
Multi File-Analyse: Output
Input
• Logpat kann beliebige Textdateien
einlesen
• eingebaute Konvertierfunktion (frei
konfigurierbar)
• File-Archiv
• Analysemuster in Patternfile können
importiert werden (Regular
Expressions)
Output
• Als Output werden HTML-Tabellen
generiert
• Im Multi File-Plot werden Graphiken
generiert
• zusätzlich können die Ergebnisse bei
Multi File-Analyse als CSV- oder SPSSDatei heruntergeladen werden
Lizenz & Weiterentwicklung...
• Logpat wurde unter der GNU General
Public Licence freigegeben
• Unter www.log-pat.de ist eine DemoVersion verfügbar
• Der Source-Code steht zur
Weiterentwicklung zur Verfügung!