Il WWW e' stato sviluppato al laboratorio di fisica nucleare CERN di Ginevra ed e' basato sul protocollo detto HTTP (Hyper Text Transfer Protocol).
I documenti HTTP si chiamano "pagine", e possono contenere sia testo che immagini, filmati, suoni o altri elementi multimediali. Sono scritti in un linguaggio detto HTML (Hyper Text Markup Language).
La grossa proprieta' di pagine HTML e' che contengono dei link o riferimenti ipertestuali ad altre pagine HTML, le quali si possono trovare sullo stesso server o su un server completamente diverso di Internet.
L'utente puo' cosi' trasparentemente "navigare" o compiere il "surfing", tra molti siti anche remoti.
Il programma necessario per accedere al Web si chiama un Web Browser. Ne esistono svariati, sia di dominio pubblico che shareware e proprietari, per qualsiasi sistem operativo, e sia a caratteri (che non usa piu' nessuno) che con interfaccia grafica.
Alcuni principali sono:
I moderni browser WWW permettono la visualizzazione non solo di testo ma anche di immagini inline in vari formati, tra cui il piu' comune e' il formato GIF (Graphical Interchange Format) della Compuserve. Permettono inoltre l'aggancio a programmi esterni per la riproduzione o visuallizzazione di files sonori, filmati, postscript, ecc.
Con il Web si e' raggiunto lo scopo di diffondere la multimedialita' in Internet anche a persone non esperte.
Il WWW permette sia di ottenere pagine tramite il protocollo HTTP, che anche di interfacciarsi ad altri protocolli, quali FTP, posta elettronica, gopher, WAIS, NetNews, ecc. Tutto dipende dalle possibilita' del browser prescelto.
Un'estensione nuova e in via di continuo sviluppo e' il linguaggio VRML (Virtual Reality Modelling Language), con visuallizzatori appropriati. Questa estensione permette la generazione di documenti tridimensionali, di realta' virtuale non immersiva, nei quali si puo' muoversi ed interagire con oggetti solidi ed anche con altre persone presenti simultaneamente (quest'ultima possibilita' e' ancora in via di sviluppo).
L'indirizzo di una pagina, o infatti di una risorsa qualsiasi ottenibile tramite il Web, si esprime con un indirizzo chiamato URL (Uniform Resource Locator), del formato:
protocollo://indirizzo[:porto]/directory/pagina
ove
protocollo
http
, ftp
, telnet
, ecc.
indirizzo
porto
directory
pagina
Per esempio:
http://khan.qoknos.thl/courses/satan/doc/satan_overview.html
Se non e' specificato il nome file della pagina, esistono dei nomi di default, quale index.html
oppure home.html
.
Se non e' specificata la directory si intende una directory di default designata dal particolare server.
E pssibile anche accedere a directories di singole persone, se il server e' configurato opportunamente, p.es.:
http://www.gonzo.com/~joe/doc.html
Vi sono due principali server disponibili a dominio pubblico, del CERN e della NCSA. Quest'ultimo e'il piu' diffuso e facile da installare e gestire, mentre il primo ha piu' possibilita' di configurazione e offre una maggiore sicurezza da attacchi esterni.
I server sono disponibili per quasi tutte le piattaforma di sistema operativo, da UNIX a Windows NT, a MacIntosh e a Windows. Dato che il carico di lavoro di un server puo' essere notevole, e' meglio scegliere una piattaforma multitasking ottimizzata. La scelta piu' diffusa e' UNIX, specialmente nella versione Linux, che ha il vantaggio di essere completamente gratuita e a dominio pubblico.
Per quanto le pagine possano essere generate con un comune editor di testi, facendo molta attenzione alla sintassi HTML, sempre piu' si vanno diffondendo:
La CGI (Common Gateway Interface) e' una metodologia che permette non solo di inviare pagine dal server al cliente browser, ma anche di ottenere un feedback dal browser al server, e di configurare programmi o procedure che vengono eseguiti in conseguenza a questo feedback.
Applicazioni comuni sotto l'interfaccia CGI sono:
Si stanno diffondendo estensioni al WWW concernenti la sicurezza dei dati. Alcune sono: