Gewisse Terme in Web Analytics nimmt man mit der Zeit in den Sprachgebrauch auf, selbst wenn die Genaue Definition dahinter nicht unbedingt so bekannt ist. Hier drum aus der Reihe "Was ist eigentlich..." die Überlegungen zum User Agent.
Neben der IP-Adresse wir bei jeder Anfrage an einen Webserver auch übergeben, welcher Browser und welches Betriebssystem der anfragende Benutzer einsetzt. Diese Browser/Betriebssystem-Kombination sowie noch weitere dazugehörende Informationen wird als User Agent bezeichnet.
Ein Webserver muss diese Information kennen, da er allenfalls je nach User Agent andere Informationen ausliefern muss. So kann der Webserver zum Beispiel für einen Macintosh Rechner mit Safari Browser die gleiche Seite in einem anderen Format ausliefern als für einen Windows-Rechner mit einem Microsoft Internet Explorer als Browser. Während eine solche unterschiedliche Ausgabe für PC-Browser heute kaum mehr genutzt wird, hat es aber für Besucher für mobile Besucher je länger je mehr eine wichtige Bedeutung. Besucher welche den Browser ihres Handys verwenden um Websites aufzurufen sind aufgrund der verfügbaren Bildschirmgrösse ganz dankbar, wenn eine auf Handys optimierte Version einer Seite angeboten wird.
Die Einträge, welche zu einem User Agent in einem Logfile gespeichert werden, sehen beispielsweise folgendermassen aus:
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)
Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.12) Gecko/20080201 Firefox/2.0.0.12
Mozilla/5.0 (Macintosh; U; PPC Mac OS X; de-de) AppleWebKit/419.2 (KHTML, like Gecko) Safari/419.3
Der erste Beispieleintrag stammt von einem Benutzer mit einem Microsoft Internet Explorer der Version 7.0 (MSIE 7.0). Das verwendete Betriebssystem ist Microsoft Vista, welches sich aus der Versionsnummer Windows NT 6.0 ableiten lässt. Zusätzlich zu diesen Plattforminformationen werden in dem Fall noch weitere Informationen gesammelt wie die Version des installierten .NET-Frameworks oder des Microsoft Media Centers.
Der zweite Eintrag hinterliess ein Benutzer, der einen Firefox-Browser der Version 2.0 auf einer deutschsprachigen Installation (de) von Windows XP (d.h. Versionsnummer NT 5.1) einsetzte. Der letzte Eintrag stammt von einem deutschsprachigen Macintosh Benutzer mit einem Safari-Browser.
Neben solchen üblichen Besuchern sind auch spezielle Besucher anhand des User Agents identifizierbar. Eine Newsreader, welcher für die Darstellung von RSS-Feeds verwendet wird, hinterlässt genau so seine Einträge wie ein Seitenaufruf über ein Handy:
Windows-RSS-Platform/1.0 (MSIE 7.0; Windows NT 5.1)
Nokia6682/2.0 (3.01.1) SymbianOS/8.0 Series60/2.6 Profile/MIDP-2.0 configuration/CLDC-1.1 UP.Link/6.3.0.0.0
Ebenfalls häufige Besucher einer Website sind Suchmaschinen. Damit Suchmaschinen einem Suchenden überhaupt Resultate anzeigen können, durchgrasen sie tagtäglich das Web nach Inhalten. Aus Sicht eines Webservers sieht ein solcher Besuch eines Suchmaschinen-Crawlers oder -Robots – so heissen die automatischen Datensammler – ziemlich ähnlich aus wie derjenige eines menschlichen Besuchers. Gleich dem Browser einer Person fragt auch die Maschine einzelne Webseiten und Dateien an, welche der Web Server ausliefert. Einzig anhand des User Agents lassen sich Crawler von menschlichen Besuchern unterscheiden. Denn Suchmaschinenbetreiber zeichnen ihre Crawler anhand eines speziellen User Agents aus, so dass sie anschliessend im Logfile eines Web Servers erkenntlich sind. Bei den Crawlern von Google, MSN oder Yahoo! lauten die im Logfile registrierten User Agent-Einträge beispielsweise folgendermassen:
Mozilla/5.0 (compatible; Googlebot/2.1; http://www.google.com/bot.html)
msnbot-media/1.0 ( http://search.msn.com/msnbot.htm)
Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)