[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [indice analitico] [volume] [parte]


Capitolo 44.   Ricerche nella rete

La rete è una biblioteca enorme, ma per poterla utilizzare, bisogna conoscere l'uso dei servizi principali di ricerca che sono disponibili. L'importanza dei servizi di indicizzazione delle informazioni sparse nella rete è tale da portare quasi a confondere la rete stessa con i portali di ricerca.

Nel momento in cui si aggiorna questo capitolo (anno 2006), i riferimenti più importanti in assoluto sono Google (<http://google.com>) e Internet Archive (<http://archive.org>).

44.1   Ricerche tra i documenti in linea

L'utilizzo comune dei servizi offerti da Google è costituito dalle ricerche di documenti pubblicati nella rete (di qualunque formato). La figura 44.1 mostra una parte della pagina introduttiva del servizio contenente il necessario per indicare un'espressione di ricerca.

Figura 44.1. Maschera per l'inserimento di un'espressione di ricerca attraverso il servizio offerto da Google.

Google

Supponendo di voler cercare documenti che contengono simultaneamente riferimenti a GNU/Linux e GNU/Hurd, si potrebbe indicare l'espressione GNU/Linux GNU/HURD, senza bisogno di operatori (simboli) particolari. La figura 44.2 mostra il risultato della ricerca.

Figura 44.2. Risultato di una ricerca.

Google

Per ridurre la ricerca all'ambito di un certo sito, si può usare un'espressione apposita. Per esempio, se si è interessati esclusivamente a quanto pubblicato a partire da linux.it, sottodomini inclusi, basta aggiungere site:linux.it; pertanto la stringa completa di ricerca diventa site:linux.it GNU/Linux GNU/HURD.

Figura 44.3. Risultato di una ricerca con il vincolo del sito.

Google

Naturalmente il vincolo del sito può essere più stretto, per esempio aggiungendo una parte del percorso in cui devono trovarsi i documenti cercati.

Figura 44.4. Risultato di una ricerca con il vincolo del sito e di una porzione del percorso.

Google

La tabella successiva mostra anche altre possibilità per la definizione di una ricerca efficace.

Tabella 44.5. Modelli di ricerca tipici di Google.

Modello Descrizione
parola [parola]...
Cerca un documento contenente tutte le parole indicate.
-parola
Il segno meno (-) davanti a una parola (preceduta da almeno uno spazio) serve a escludere quella parola dal contenuto del documento cercato.
"frase"
Un testo delimitato tra apici doppi permette di ricercare la corrispondenza con la stessa sequenza di parole contenute.
site:nome_di_dominio
Il prefisso site: serve a limitare la ricerca tra i documenti di un certo nome di dominio.
url:stringa
Il prefisso url: serve a limitare la ricerca tra i documenti ottenibili da un indirizzo che contiene la stringa indicata (anche se si tratta del percorso che segue il nome di dominio).
cache:indirizzo
Richiede di visualizzare l'indirizzo indicato, come memorizzato da Google.

Per creare i propri indici, il sistema di Google deve prelevare una copia dei dati, che così viene archiviata. Se un documento sparisce improvvisamente, magari perché l'elaboratore che lo ospita è temporaneamente fuori servizio, o comunque irraggiungibile, è possibile recuperarlo dalla memoria di Google. Per esempio, per fare riferimento alla pagina indice di <http://www.gnu.org>, basta indicare la stringa di ricerca cache:www.gnu.org.

Figura 44.6. Copia di Google della pagina che si ottiene dall'indirizzo <http://www.gnu.org>.

Google

Le stringhe di ricerca che non sono troppo complesse, possono essere tradotte facilmente in un indirizzo URI, trasformando alcuni caratteri con la forma %hh (dove hh rappresenta un numero esadecimale corrispondente al carattere da indicare) e usando il segno + per concatenare le parole della ricerca:

http://www.google.com/search?q=espressione_di_ricerca

Lo specchietto successivo mostra alcuni esempi:

44.2   Ricerche nel passato

Internet Archive è il più grande sistema di archiviazione di dati esistente, nato con l'intento di raccogliere tutto ciò che Internet offre.

Presso Internet Archive è possibile trovare una raccolta di ogni tipo di opera digitale, ma soprattutto è possibile accedere a un archivio storico di Internet, a partire dalla fondazione di tale archivio.

L'archivio storico gestito da Internet Archive è noto come Wayback Machine e vi si accede solo specificando l'indirizzo URI del sito o del documento originale, con l'aggiunta eventuale del periodo a cui si è interessati: <http://web.archive.org>.

Figura 44.8. Internet Archive con la maschera di inserimento per la ricerca.

Internet Archive

Evidentemente è sufficiente indicare l'indirizzo URI per ottenere un elenco di copie in vari momenti nel tempo. Per esempio, si potrebbe cercare l'indirizzo http://www.gnu.org/philosopy;(1) la figura successiva mostra cosa si potrebbe ottenere.

Figura 44.9. Archivio storico dell'indirizzo http://www.gnu.org/philosopy.

Internet Archive

Eventualmente, la ricerca può anche essere limitata a un certo periodo, oppure possono essere richieste anche delle opzioni interessanti, come la conversione del formato: <http://web.archive.org/collections/web/advanced.html>. Tuttavia, è forse più semplice definire la ricerca usando semplicemente un indirizzo URI, come si descrive dagli esempi successivi.

44.3   Ricerche geografiche

Google offre altri strumenti di ricerca, in particolare uno per le ricerche geografiche: <http://maps.google.com>. Fornendo un indirizzo, possibilmente completo di codice di avviamento postale e di nazione, si ottiene la mappa della zona.

Figura 44.10. Ricerca di un indirizzo.

Google

Figura 44.11. Ricerca di un itinerario.

Google

Figura 44.12. Visione aerea.

Google

44.4   Riferimenti

Appunti di informatica libera 2007.02 --- Copyright © 2000-2007 Daniele Giacomini -- <daniele (ad) swlibero·org>


1) La parola «philosopy» è errata di proposito e si scopre che l'indirizzo è stato usato effettivamente per un certo tempo.


Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome ricerche_nella_rete.htm

[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [indice analitico]

Valid ISO-HTML!

CSS validator!