Qualität von OnpageTools Victoria Samarina & Daniel Wette Qualität von Onpage Crawlern Qualität von Onpage Crawlern Crawling Verarbeitung Auswertung Qualität von Onpage Crawlern Crawling Verarbeitung Qualitätsvergleich Auswertung Test-Projekt URL-Normalisierung ● Was ist URL-Normalisierung ● Wofür braucht man das? ○ Search engines ○ Web Crawler ○ Browser Arten von URL-Normalisierung ● Normalisierung, die normalerweise der Semantik vorauskommt: ○ Hinzufügen von trailling slashes <A href=’http://www.crawler-test.com/subdir-slash-test-1’> <A href=’http://www.crawler-test.com/subdir-slash-test-2/’> ● Entfernen von dot-segments <A href=’http://www.crawler-test.com/../a/b/../c/./test-1.html’> Arten von URL-Normalisierung ● Normalisierung mit Änderung der Semantik ○ Entfernen von Fragmenten <A href=’http://www.crawler-test.com/fragement-processing.html#jump1’> -> <A href=’http://www.crawler-test.com/fragement-processing.html’> ○ Entfernen von duplicate slashes <A href=’http://www.crawler-test.com/duplicate-slashes-path//test-2.html’> -> <A href=’http://www.crawler-test.com/duplicate-slashes-path/test-2.html’> ○ Sortierung von Query Parametern <A href=’http://www.crawler-test.com/uri-norm/test.php?a=1&b=2&c=3&d=4’> <A href=’http://www.crawler-test.com/uri-norm/test.php?b=2&a=1&c=3&d=4’> Durchgeführte Tests: URL-Normalisierung ● Percent-Encoding http://www.localseo.wiki/~subdir/url-normalization-test-1.html http://www.localseo.wiki/%7Esubdir/url-normalization-test-2.html http://www.localseo.wiki/%7esubdir/url-normalization-test-3.html ● Port 80 in URI Verlinkte URL: <a href=’http://www.crawler-test.com:80/port-80-url-normalization-test-1.html’> ● Duplicate Slashes <A href=’http://www.crawler-test.com/duplicate-slashes-path//test-2.html’> Durchgeführte Tests: Quotes ● Quotes <a href=http://www.localseo.wiki/linked-without-quotes.html>linked without quotes</a> <a href='http://www.localseo.wiki/linked-with-single-quotes.html'>linked with single quotes</a></p> <a href="http://www.localseo.wiki/linked-with-double-quotes.html">linked-with-double-quotes.html</a> Durchgeführte Tests: Relative Linking ● Relative Linking <a href=’/subdir-2-1/relative-linking-test-1.html’> <a href=’./subdir-1-3/relative-linking-test-2.html’> <a href=’../subdir-1-3/relative-linking-test-3.html’> <a href=’../../subdir-1-3/relative-linking-test-4.html’> <a href=’../../../../subdir-1-3/relative-linking-test-4.html’> <a href=’http://www.crawler-test.com/../a/b/../c/./test-1.html’> ● Base URL <a href="http://www.localseo.wiki/relative/linking/test/relative-linking-base-test.html"> Relative Verlinkungen Relative Verlinkungen Relative Verlinkungen Relative Verlinkungen Relative Verlinkungen Relative Verlinkungen Durchgeführte Tests: Redirect ● ● ● ● ● 301 Redirect 302 Redirect 303 Reditect Ketten gecrawlt // erkannt Loop erkannt Durchgeführte Tests: nofollow ● Nofollow Link interner nofollow Link von a auf b, interner follow Link von c auf b ● x-robots nofollow ● META Nofollow <meta name="robots" content="nofollow"> Durchgeführte Tests ● Framesets ● robots.txt User-agent: * Disallow: /disallowed-directory/ Disallow: /disallowed-file.html ● Javascript Durchgeführte Tests ● Whitespaces <A href= ‘http://www.crawler-test.com/whitespace-test-1.html’ > <A href = ‘http://www.crawler-test.com/whitespace-test-2.html’> <A href= ‘http://www.crawler-test.com/whitespace-test-3.html’> ● Mentions etc. <!--a link in a comment. <A href=’http://www.crawler-test.com/linked-in-comment-test-1.html’>--> <!--a mention in a comment. http://www.crawler-test.com/linked-in-comment-test-2.html--> <!--a mention in a comment. www.crawler-test.com/linked-in-comment-test-3.html--> Die Auswertung Die Gewinner 2 1 3
© Copyright 2025 ExpyDoc