Questo sito contribuisce alla audience di Il Messaggero

Come risolvere errore 404

di

Di recente, hai tentato di accedere a un sito Internet che avevi salvato tempo addietro tra i preferiti, intenzionato a visitarlo con tutta calma e a prendere visione dei contenuti su di esso pubblicati. Il problema è che, per quanto tu abbia provato e riprovato ad accedervi, la risposta del browser è sempre stata la stessa: errore 404. Questo tipo di errore, in particolare, serve a notificare all’utente che la pagina da egli cercata non esiste più, per una serie di motivi che non dipendono dal suo comportamento: tanto per citare un paio di cause, il sito potrebbe essere stato disattivato, spostato altrove, oppure la risorsa cercata potrebbe essere stata eliminata.

Ad ogni modo, quel sito Internet avrebbe potuto esserti davvero utile, dunque ora sei alla disperata ricerca di un tutorial che ti spieghi per filo e per segno come risolvere errore 404 e come accedere, o almeno provare a farlo, alla pagina che genera questo tipo di problema. Ebbene, sono molto felice di dirti che hai finalmente trovato la soluzione che cercavi: di seguito, infatti, intendo insegnarti ad accedere alla copia “cache” di un sito Web, che rende possibile visionarne le vecchie versioni. Inoltre, sarà mia cura spiegarti come correggere l’errore 404, qualora il sito Web in questione fosse gestito proprio da te.

Dunque, cos’altro aspetti a iniziare? Ritaglia un po’ di tempo libero per te, mettiti bello comodo e leggi con estrema attenzione tutto quanto ho da spiegarti su questo tema: sono sicuro che, al termine di questa lettura, sarai perfettamente in grado di bypassare il problema, applicando la soluzione più consona al tuo caso. A questo punto, non mi resta che augurarti buona lettura e buon lavoro!

Indice

Errore 404: significato

Come risolvere errore 404

Come ti ho già accennato all’inizio, l’errore 404 (o 404 Not Found) viene generato all’interno del browser, dei crawler dei motori di ricerca (cioè dei robot automatici che analizzano i link all’interno delle varie pagine Web) e dai software analitici quando una pagina Web, un’immagine, un file multimediale o qualsiasi altro contenuto si tenti di visualizzare attraverso la navigazione in Rete, non esistono più. Dunque, questo tipo di errore può essere visualizzato quando si tenta di accedere a un sito Internet rimosso o spostato, quando si tenta di visualizzare un link “scaduto”, quando si cerca di scaricare un’immagine non più presente e così via.

Tecnicamente, il 404 fa parte dei codici di stato di HTTP (quest’ultimo è il protocollo che domina la navigazione in Internet): nello specifico, esso appartiene agli errori generati a causa del client (in gergo Client Error, o 4xx), che vengono mostrati nel momento in cui la richiesta effettuata da quest’ultimo non può essere soddisfatta, perché sintatticamente non corretta o, come in questo caso, perché fa capo a una risorsa non accessibile.

Per essere precisi, l’errore 404 si riferisce a un contenuto non disponibile ma che, per definizione, potrebbe esserlo in futuro; esiste comunque un altro codice d’errore HTTP inerente a una risorsa non trovata, il 410 (o 410 Gone), che viene generato quando invece un contenuto non è disponibile e non tornerà a esserlo mai più. All’atto pratico, l’errore 410 è estremamente più raro dell’errore 404.

Come bypassare l’errore 404

Come risolvere errore 404

Ora che sai perfettametne cos’è l’errore 404, è arrivato il momento di passare alla pratica e capire come bypassarlo. Il “trucchetto”, in questo caso, è quello di accedere a una vecchia versione della pagina Web che genera il summenzionato errore, in gergo conosciuta come copia cache: quasi tutte le pagine Web indicizzate dai motori di ricerca dispongono di almeno una copia cache, generata in modo del tutto automatico a intervalli di tempo più o meno regolari.

Di seguito intendo insegnarti ad accedere alla copia cache di un sito Internet avvalendoti della cache di Google o del portale Wayback Machine.

Cache di Google

Il primo strumento con cui voglio insegnarti a risolvere l’errore 404 è la cache di Google: se il sito o la risorsa in questione sono ancora indicizzati sul motore di ricerca di Mountain View, infatti, ci sono ottime probabiltà che essi dispongano di una copia relativa a una vecchia versione, che può essere visualizzata praticamente ogni volta che si desidera.

Prima di andare avanti, però, devo farti una doverosa precisazione: i contenuti visualizzabili all’interno della copia in cache di una pagina Web potrebbero non essere aggiornati. Di conseguenza, ti consiglio di non utilzzare questo metodo di navigazione se hai bisogno di risorse “fresche” e di rivolgerti, invece, al webmaster del sito in questione (te ne parlerò successivamente).

Ad ogni modo, accedere alla copia cache di un sito Web è estremamente semplice: per prima cosa, collegati alla pagina principale di Google, digita nella casella di ricerca il nome del sito che intendi visualizzare, oppure l’indirizzo Web della pagina “scomparsa”, e pigia il tasto Invio.

Compiuta questa operazione, dai un’occhiata ai risultati di ricerca e identifica quello più pertinente al tuo caso: osservandolo attentamente, dovresti notare la presenza di una piccola freccetta rivolta verso il basso in corrispondenza dell’URL della pagina mostrato nello snippet (cioè nel riquadro che, per ogni risultato di ricerca, mostra il link cliccabile alla pagina, il link testuale e la sua anteprima). Tutto ciò che devi fare, una volta localizzata, è cliccare sulla freccetta verso il basso e selezionare la voce Copia Cache tra le opzioni proposte: con un pizzico di fortuna, la pagina successiva ti mostrerà il contenuto che stavi disperatamente cercando. Facile, no?

In alternativa, puoi collegarti a Google, digitare il codice cache:[indirizzo pagina da visualizzare] (dove al posto di [indirizzo pagina da visualizzare] devi digitare l’indirizzo della pagina da visualizzare in cache, ad esempio cache:https://www.aranzulla.it/come-fare-video-online-928083.html per visualizzare la copia cache della pagina https://www.aranzulla.it/come-fare-video-online-928083.html) e dare Invio.

Wayback Machine

Se non hai avuto fortuna con la soluzione precedente, puoi dare un’opportunità a Wayback Machine: questo portale nasce infatti con il preciso intento di raccogliere e archiviare le vecchie versioni dei siti Internet, dando la possibilità a chi ne usufruisce di fare un vero e proprio salto indietro nel tempo.

In particolare, Wayback Machine permette di consultare anche più versioni (o “snapshot”) dello stesso sito Internet, scegliendole in base alla data di salvataggio: una manna dal cielo per risolvere errore 404 quando Google proprio non riesce!

Dunque, senza ulteriori convenevoli, è il momento di passare alla pratica: per prima cosa, collegati alla pagina principale di Wayback Machine, incolla l’indirizzo della pagina Web che genera l’errore 404 nella casella di testo e premi il pulsante Invio.

Qualche secondo dopo, ti verrà mostrato una specie di archivio temporale, tramite il quale è possibile accedere a uno degli snapshot del sito in questione: per farlo, clicca innanzitutto sull’anno a cui ti interessa ritornare selezionandolo dalla barra superiore, per poi scegliere con un clic il mese e il giorno avvalendoti del calendario collocato poco sotto… e il gioco è fatto! Dopo alcuni istanti, ti verrà mostrata la vecchia versione della risorsa a cui stavi tentando di accedere, esattamente come era nel giorno scelto.

Contattare il webmaster

Come risolvere errore 404 - Contattare il Webmaster

Non hai avuto fortuna con nessuna delle soluzioni che ti ho segnalato in precedenza? Non gettare ancora la spugna: come ultima spiaggia puoi provare a contattare il webmaster del sito Internet in questione e chiedergli se sia possibile ripristinare la pagina che stavi cercando o, quantomeno, darti una spiegazione su come accedervi (qualora fosse stata spostata).

Se non lo sapessi già, il webmaster di un sito Web è la figura professionale che se ne occupa, gestendo tutti gli aspetti implementativi a esso connessi (la struttura delle pagine, lo schema dei link, i plugin, il database e così via): in altre parole, il webmaster è colui che gestisce il funzionamento del sito e che, alcune volte, corrisponde al proprietario dello stesso.

Dunque, se intendi approcciare a questa soluzione, per prima cosa devi accedere alla pagina principale che contiene il link che genera l’errore 404 (ad es. aranzulla.it), cercare la voce Contatti tra i menu di navigazione annessi alle pagine del sito e utilizzare il form proposto, se presente, per metterti in comunicazione con un gestore; in alcuni casi, potresti dover utilizzare le voci Contatta il webmasterFeedback, collocate molto spesso nella parte inferiore del sito Web in questione.

Ad ogni modo, oltre a chiedere delucidazioni su come accedere alla risorsa perduta, abbi cura di specificare, a chi di dovere, sia l’indirizzo Web che scaturisce l’errore 404 sia un indirizzo (email, social, Skype e così via) presso cui contattarti: se tutto va per il verso giusto, dovresti ricevere risposta (e, si spera, soluzione) entro poco tempo.

Come correggere l’errore 404 nel proprio sito

Se sei arrivato fin qui, hai compreso perfettamente le modalità di accesso a tutte quelle pagine scomparse e generatrici di errori 404, tuttavia non hai tratto giovamento alcuno da quanto ti ho spiegato finora per un motivo molto semplice: sei proprio tu a gestire il sito Internet che genera gli errori 404, dunque sei alla ricerca di un metodo per trovarli e correggerli.

La soluzione, come sicuramente saprai già, è teoricamente semplice: tutto ciò che devi fare è stanare ed eliminare i riferimenti ai contenuti che non esistono più dalle pagine del tuo sito Web. Lo so, trovare tali riferimenti può non essere facilissimo (soprattutto nel caso in cui il sito in questione sia sufficientemente ricco di contenuti), tuttavia vorrei segnalarti qualche soluzione appropriata al caso e che potrebbe semplificare, non di poco, il tuo lavoro.

Google Search Console

Il primo metodo per rilevare e correggere errore 404 nel proprio sito Web è avvalersi di Google Search Console: nella fattispecie, si tratta di una serie di strumenti atti a monitorare lo stato del proprio sito Web avvalendosi del crawler di Google, cioè del robot in grado di analizzare le pagine e la loro struttura al fine di offrire l’indicizzazione all’interno del motore di ricerca.

Prima di continuare, però, assicurati che il file robots.txt del tuo sito Web permetta la scansione delle pagine da parte del robot di Google (in pratica, controlla che direttive disallow siano limitate allo stretto indispensabile): se necessiti di una mano in tal senso, ti invito a consultare la guida dedicata di Google.

Fatto ciò, puoi finalmente collegare Google Search Console al tuo sito Web: per prima cosa, accedi alla pagina principale del servizio offerto da Google, clicca sul pulsante Accedi collocato in alto a destra e inserisci le credenziali del tuo account Google (se non ne disponi, puoi crearne uno gratuitamente seguendo queste istruzioni).

Per associare un nuovo sito Internet, posiziona il menu a tendina proposto sull’opzione Sito Web, digita nella casella accanto l’indirizzo completo della pagina principale del tuo sito (ad es. https://www.aranzulla.it) e pigia infine sul pulsante Aggiungi una proprietà per avviare il processo.

A questo punto, dovresti essere in grado di visualizzare le istruzioni per validare la proprietà del sito: in linea generale, ciò che devi fare è scaricare il file di verificacaricarlo sul tuo sito Web (nella cartella che punta alla radice del dominio) e, una volta completata l’operazione, convalidare il tutto cliccando sulla casella Non sono un robot e pigiando sul pulsante Verifica collocata in basso.

Una volta convalidata la proprietà del sito, torna alla pagina principale di Search Console, clicca sulla proprietà appena aggiunta, seleziona le voci ScansioneSitemap dal menu di navigazione laterale della pagina proposta, pigia sul pulsante Aggiungi/Testa sitemap e segui le istruzioni per far “riconoscere” la mappa del sito alla console di Google.

Il grosso è praticamente fatto! In genere la scansione viene completata dopo alcuni giorni, trascorsi i quali potrai visualizzare, oltre che le statistiche su clic e contenuti, anche gli errori 404 generati dal sito: per farlo, dopo aver avuto accesso alla pagina principale della Search Console relativa al tuo sito Web, clicca sulle voci Scansione ed Errori di scansione e, infine, seleziona la scheda Non trovato per visualizzare la lista completa dei 404 scaturiti dalle varie pagine Web.

XLS (Xenu’s Link Sleuth)

Se la soluzione offerta da Google non ti ha soddisfatto appieno, puoi rivolgerti a un crawler locale come Xenu’s Link Sleuth o, più semplicemente, Xenu: nella fattispecie, si tratta di un programma gratuito per Windows (ma utilizzabile anche su macOS tramite emulazione) in grado di analizzare il contenuto di un sito Web e di segnalare, tra le altre cose, la presenza di link rotti. Tieni ben presente che, utilizzando Xenu, l’analisi dei link viene eseguita utilizzando la tua connessione a Internet: di conseguenza, l’operazione di analisi potrebbe richiedere molto tempo.

Sei ben consapevole di ciò e intendi comunque continuare? Perfetto! Per prima cosa, collegati alla pagina di download di Xenu, clicca sul link download collocato al suo interno e attendi che il file (ad es. XENU.zip) venga scaricato sul tuo computer.

Completata questa operazione, estrai l’archivio in una cartella a tuo piacimento (seguendo queste istruzioni, se non sai come fare), lancia con un doppio clic il file Setup.exe contenuto al suo interno e pigia sui pulsanti Next, I AgreeNext per due volte, Install, NextFinish per finalizzare l’installazione e avviare immediatamente il programma.

A questo punto, pigia sul pulsante Close per chiudere il suggerimento iniziale, seleziona la voce Check URL… dal menu File del programma, collocato in alto a sinistra, digita l’indirizzo da analizzare nella casella di testo collocata in alto, pigia sul pulsante More options…, apponi il segno di spunta accanto a tutte le voci proposte e pigia per due volte sul pulsante OK per avviare immediatamente la scansione.

Una volta terminata la scansione, la finestra principale di Xenu mostrerà sia gli errori 404 riscontrati che le pagine contenenti i link rotti ad essi associate.

Plugin per CMS

Se hai creato il tuo sito Web utilizzando un CMS, allora la risoluzione degli errori 404 generati dai link rotti potrebbe rivelarsi molto più semplice: nella maggior parte dei casi, infatti, esistono degli appositi plugin per l’analisi del sito Web, in grado di controllare la presenza di errori 404, di eliminare i riferimenti o generare (ove possibile) dei redirect automatici per “arginare” il danno e, in alcuni casi, di creare delle pagine d’errore appetibili per l’utente, che non vadano a danneggiare in modo significativo i tempi di permanenza o aumentare la frequenza di rimbalzo del sito Web.

Tra i più conosciuti componenti aggiuntivi di questo tipo figurano Yoast SEO e Broken Link Checker per WordPress e Link Checker per Joomla.