Top

Come Recuperare Automaticamente le Pagine Web

Capita spesso di cercare pagine web visitate in precedenza e di non riuscire a ritrovarle rapidamente, e ancora più spesso può capitare di cercare pagine la cui posizione originale è stata cambiata.

Al posto della pagina che ci si aspetta di aprire veniamo accolti dal famoso errore 404, pagina web rimossa o spostata in posizione diversa. La ricerca di queste pagine può essere molto lunga e faticosa. Le si potrà ricercare tramite l’utilizzo di motori dei motori di ricerca o attraverso l’Internet Archive Wayback Machine, in cui sono custodite più di 10 miliardi di pagine web.

Decisamente più rapida sarà la ricerca se si decide di affidarsi allo strumento creato da Frank McCown, chiamato Warrick che permette di ritrovare qualsiasi sito o singola pagina web perduta in modo automatico.

Basta digitare l’URL del sito web e Warrick vi contatterà tramite e-mail una volta che il processo di recupero sarà finito. Si tratta essenzialmente di un crawler web, che analizza e raccoglie le pagine web mancanti da tutti e quattro i repository web (Internet Archive, Google, Live Search e Yahoo) . Se una pagina web è presente in più di un repository web, Warrick salva la pagina con la data più recente.

Il processo di recupero può richiedere del tempo per i grandi siti web, ma alla fine della ricerca e recupero delle pagine web verrà fornito file in formato zip contenente le informazioni desiderate.

Warrick è disponibile sia come servizio on-line oppure si può scaricare il file sorgente ed eseguirlo sul proprio computer.

[Via]

email
Related Posts Plugin for WordPress, Blogger...

Non perdere l'opportunità di ricevere il meglio di Ziogeek!


Commenti


Fatal error: Uncaught Exception: 12: REST API is deprecated for versions v2.1 and higher (12) thrown in /home/ziogeek/public_html/wp-content/plugins/seo-facebook-comments/facebook/base_facebook.php on line 1273