Site Map
GoTo:
NLP Home
 
Mindvisory Seminars Akazien Verlag   
 
Lesezeichen [ QR-Code ] Do 21 Nov 2024 10:30:55


 Aussagekraft der Zugriffsstatistik
--


Logfile-Analyse

13.1   Auslastungsstatistik

...

Aber bevor man eine Statistik des Access-Logs erstellt, sollte man erst einmal überprüfen, ob sie einem überhaupt die Antworten liefern kann, die man sucht.

13.1.1   Zugriffsstatistik

Kann die Statistik Aufschluß darüber geben, wie viele Leute welche Seiten abgerufen haben?

Nein, denn Proxy-Caches sind sehr weit verbreitet. Wenn Seiten nicht vom Web-Server selbst, sondern von einem Proxy-Cache an einen Client ausgeliefert werden, erfolgt keinerlei Zugriff auf den Web-Server. Außerdem verwenden die meisten Nutzer einen Web-Browser, der einen eigenen Cache anlegt. Auch hier ist oftmals keinerlei Zugriff auf den Web-Server zu beobachten.

Wenn auf eine Web-Seite beispielsweise - laut Access-Log - eintausend Zugriffe erfolgt sind und auf eine andere Seite zweitausend, so kann man nicht unbedingt davon ausgehen, daß letztere Seite häufiger von einem Client angefordert wurde. Es könnte z.B. sein, daß die Seite mit nur eintausend Zugriffen wesentlich beliebter ist als die andere Seite und deshalb schon in den meisten Proxy-Caches zwischengespeichert wurde. Somit treffen bei dem Web-Server selbst viel weniger Anfragen für die Seite ein.

Allenfalls bei Seiten bzw. Verzeichnissen, die sich bezüglich der Zugriffsanzahl deutlich hervorheben, kann man den Schluß ziehen, daß diese häufiger angefordert werden und vermutlich beliebter sind als andere.

13.1.2   Zugriffssequenz bestimmter Domains

Kann man durch die Statistik herausfinden, ob bestimmte Domains ein größeres Interese am Web-Server haben als andere?

Nein, denn auch hier machen einem Proxy-Caches einen Strich durch die Rechnung. Von einer Domain, deren Nutzer kaum Proxy-Caches verwenden, sieht man vielleicht mehr Zugriffe als von einer Domain, deren Nutzer ausschließlich über einen Proxy-Cache auf das World Wide Web zugreifen. Ob eine der beiden Domains nun ein größerers Interesse am eigenen Web-Server hat, läßt sich kaum feststellen.

Weiterhin gibt es Cache-Netzwerke, bei denen Proxy-Caches kaskadiert werden und sich teilweise über mehrere Top-Level Domains erstrecken. Dabei ist es durchaus nicht selten, daß z.B. ein Zugriff, der aus der Top-Level Domain de stammt von einem Nutzer initiiert wurde, der in Großbritannien, Domain uk, sitzt.

13.1.3   Minimale Leseranzahl

Läßt sich eine minimale Anzahl von Lesern einer Seite ermitteln?

Nein, wenn auf eine Seite z.B. 25 Zugriffe erfolgt sind, kann man allenfalls daraus schließen, daß mindestens eine Person die Seite gelesen hat. Allerdings stellt sich dann die Frage, ob es sich wirklich um eine Person gehandelt hat oder vielleicht nur um einen Web-Robot ( ... ).

13.1.4   Uncachebare Seiten

Wird die Statistik aussagekräftiger, wenn man alle Seiten uncachebar macht?

Prinzipiell ja, da nun die Seiten bei jedem Abruf neu vom Web-Server angefordert werden müssen. Allerdings wird es immer noch eine kleine Anzahl von Proxy-Caches geben, die auch solche Seiten für einen gewissen Zeitraum zwischenspeichern.

Wenn die Seiten so gestaltet werden, daß sie nicht mehr in einem Cache zwischengespeichert werden können respektive sollen, erweist man den Nutzern jedoch keinen Gefallen, denn dadurch, daß die Seiten immer wieder neu vom Web-Server übertragen werden müssen, erhöht sich in vielen Fällen die Wartezeit für die Nutzer. Eine Web-Site, bei der auf jede Seite lange gewartet werden muß, verläßt ein Nutzer meistens recht bald, und er kommt auch so schnell nicht wieder.

13.1.5   Warum dann überhaupt eine Statistik?

Eine Statistik kann den Administratoren des Rechners sehr dabei helfen, die Auslastung des Server-Rechners zu beurteilen. Deshalb heißt der Titel dieses Kapitels auch Auslastungsstatistik und nicht Zugriffsstatistik.

Wenn man einen Web-Server betreibt, auf dem mehrere lokale Nutzer ihre Web-Seiten ablegen, wird man eine Statistik auch noch aus einem anderen Grund anlegen müssen: Weil fast alle Nutzer solch eine Statistik haben möchten, auch wenn sie vielleicht wissen, daß die Aussagekraft sehr beschränkt ist.

Aber die Analyse des Access-Logs ist immer noch sinnvoller, als auf eine Seite einen Web-Counter zu bauen, dessen Aussagekraft gegen Null geht und der wohl das unsinnigste Element sein dürfte, das auf Web-Seiten zu finden ist. Bei graphischen Web-Countern ist das Problem z.B., daß die Graphik nicht geladen wird, wenn ein Client auf die Seite zugreift, aber das automatische Bilderladen deaktiviert wurde.

--

  Quelle
Eilebrecht, Lars: Apache Web-Server. International Thomson Publishing,
Bonn 1997, S. 337-339.


--
 [ Home | Top ]
Der Inhalt dieser Seite wurde am 31.08.2024 um 13.37 Uhr aktualisiert.
Navigation Who's Who Pinnwand Reminder Forum Chat nlp4all Bibliothek Research NLP Methode Seminare Psychotherapie ExpCom Medienversand Verbände Pressespiegel Impressum News Home
 
   NLP Community * nlp.eu | Datenschutz
© 1995, 2024 Franz-Josef Hücker. All Rights Reserved.
Contact Print Page nlp_eu folgen RSS Feeds & Podcasts