Gestione dei log e statistiche d'accesso
Files di Log
Tutti i server HTTP moderni possono registrare gli accessi che si sono
verificati alle loro pagine in files di log.
Il principale di tali file di log si chiama access_log
ed ha linee ciascuna costituente un record di registrazione di un
singolo accesso.
Ogni linea ha la struttura:
host rcf931 utente [data/ora] richiesta stato bytes
ove:
- host - e' la macchina remota da cui e' pervenuta
la richiesta, o come semplice indirizzo IP, o come nome di
dominio se il server HTTP e' configurato a compier ricerche DNS
a rovescio
- rfc931 - denota un campo destinato a dati scambiati tramite
il protocollo identd, che fornisce l'identita' dell'utente chiamante;
questo protocollo non e' ancora molto diffuso: se il campo e' vuoto
viene usato un '-' come segnaposto
- utente - e' l'identificativo utente fornito, p.es. in seguito
a certificazione di sicurezza per accesso a directory protette
- data/ora - sono tra parentesi quadre, in formato a
24 ore e relative all'ora locale
- richiesta - e' la prima linea inviata dal client Web, con la
richiesta d'accesso secondo uno dei metodi consentiti
- stato - e' il codice esprimente il successo o fallimento
della richiesta
- bytes - sono i bytes eventualmente trasferiti se la
richiesta e' stata soddisfatta
Un altro file di log molto comune e' il log degli errori, error_log:
[data/ora] messaggio-errore
Il formato del messaggio errore non e' uno standard, dipende dal server
usato.
Statistiche d'Accesso
Il successo del sito Web, e l'interesse che certe pagine ottengono
rispetto ad altre, puo' essere analizzato opportunamente con strumenti
che generano rapporti basati sui dati di access_log.
In particolare si possono compilare rapporti di:
- classifiche di hit di singole pagine
- distribuzione degli accessi sull'arco della giornata o della settimana
- distribuzione degli accessi sulla base del dominio da cui
provenivano le richieste
- trend di popolarita' di particolari pagine a tempi lunghi
Strumenti di generazione rapporti si trovano sia a dominio pubblico
che come offerte commerciali, queste ultime solitamente rivolte
a particolari server e piattaforme.
Esempi di utilities a dominio pubblico per UNIX sono:
- wwwstat - basata su Perl
- gwstat - estensioni grafiche a wwwstat, che usano il
pacchetto grafico xmgr
- wusage - meno potente ma di piu' facile uso