Erreur 404 : comment faire pour la corriger ?

Récemment, vous avez essayé d’accéder à un site web que vous aviez précédemment enregistré comme favori, avec l’intention de le visiter calmement et de voir le contenu qui y est publié. Le problème est que peu importe combien vous avez essayé et essayé d’y accéder, la réponse du navigateur était toujours la même : erreur 404. Ce type d’erreur sert notamment à signaler à l’utilisateur que la page qu’il recherchait n’existe plus, pour un certain nombre de raisons qui ne dépendent pas de son comportement : pour ne citer que quelques causes, le site peut avoir été désactivé, déplacé ailleurs, ou la ressource recherchée peut avoir été supprimée. Découvrez comment corriger l’erreur 404, si le site web en question est géré par vous.

Erreur 404 : Signification

L’erreur 404 (ou 404 Not Found) est générée dans le navigateur, les crawlers des moteurs de recherche (c’est-à-dire des robots automatiques qui analysent les liens au sein des différentes pages Web) et les logiciels d’analyse lorsqu’une page Web, une image, un fichier multimédia ou tout autre contenu que vous essayez de visualiser en naviguant sur le Web, n’existent plus. Ainsi, ce type d’erreur peut s’afficher lorsque vous essayez d’accéder à un site Internet supprimé ou déplacé, lorsque vous essayez d’afficher un lien “expiré”, lorsque vous essayez de télécharger une image qui n’existe plus, etc.

Techniquement, 404 fait partie des codes d’état HTTP (ce dernier est le protocole qui domine la navigation sur Internet) : plus précisément, il appartient aux erreurs générées à cause du client (dans le jargon Client Error, ou 4xx), qui s’affichent lorsque la demande faite par ce dernier ne peut être satisfaite, parce qu’elle est syntaxiquement incorrecte ou, comme dans ce cas, parce qu’elle appartient à une ressource non accessible.

Pour être précis, l’erreur 404 fait référence à un contenu qui n’est pas disponible mais qui pourrait être disponible à l’avenir par définition ; cependant, il existe un autre code d’erreur HTTP inhérent à une ressource non trouvée, 410 (ou 410 Gone), qui est généré lorsque le contenu n’est pas disponible et ne le sera plus jamais. En pratique, l’erreur 410 est beaucoup plus rare que l’erreur 404.

Comment contourner l’erreur 404 ?

Maintenant que vous savez parfaitement ce qu’est l’erreur 404, il est temps de passer à la pratique et de trouver comment la contourner. L'”astuce”, dans ce cas, consiste à accéder à une ancienne version de la page Web qui génère l’erreur susmentionnée, connue dans le jargon sous le nom de “copie cache” : presque toutes les pages Web indexées par les moteurs de recherche possèdent au moins une copie cache, générée de manière entièrement automatique à intervalles plus ou moins réguliers.

Cache de Google

Le premier outil qui permet de résoudre l’erreur 404 est le cache de Google : si le site ou la ressource en question sont toujours indexés sur le moteur de recherche de Mountain View, il y a en effet de très bonnes chances qu’ils aient une copie d’une ancienne version, qui peut être consultée pratiquement à tout moment.

Il faut quand même préciser que le contenu qui peut être affiché à l’intérieur de la copie en cache d’une page Web ne peut pas être mis à jour. Il est donc conseillé de ne pas utiliser cette méthode de navigation si vous avez besoin de ressources “fraîches” et de contacter plutôt le webmaster du site en question.

Cependant, l’accès à la copie cache d’un site web est extrêmement simple : il suffit d’établir un lien vers la page principale de Google, de taper dans le champ de recherche le nom du site que vous souhaitez afficher, ou l’adresse web de la page “disparue”, et d’appuyer sur la touche Entrée.

Une fois que vous avez fait cela, regardez les résultats de recherche et identifiez celui qui est le plus pertinent pour votre cas : si vous regardez attentivement, vous devriez remarquer la présence d’une petite flèche pointant vers le bas à l’URL de la page indiquée dans l’extrait (c’est-à-dire dans la case qui, pour chaque résultat de recherche, montre le lien cliquable vers la page, le lien texte et son aperçu). Une fois localisé, il vous suffit de cliquer sur la flèche vers le bas et de sélectionner l’élément Copier le cache parmi les options proposées : avec un peu de chance, la page suivante vous montrera le contenu que vous recherchiez désespérément.

Vous pouvez également vous connecter à Google, saisir le code de cache : [adresse de la page à consulter] (où, au lieu de [adresse de la page à consulter], vous devez saisir l’adresse de la page à mettre en cache, par exemple cache:https://www.aranzulla.it/come-fare-video-online-928083.html pour consulter la copie en cache de la page https://www.aranzulla.it/come-fare-video-online-928083.html) et Entrée.

Machine à remonter le temps

Si vous n’avez pas eu de chance avec la solution précédente, vous pouvez donner une chance à Wayback Machine : ce portail est né avec l’intention précise de collecter et de stocker les anciennes versions des sites Internet, en donnant la possibilité à ceux qui l’utilisent de faire un véritable saut dans le temps.

En particulier, Wayback Machine vous permet de consulter encore plus de versions (ou “instantanés”) d’un même site web, en les choisissant en fonction de la date de sauvegarde : une aubaine pour corriger l’erreur 404 quand Google vient d’échoue.

Donc, sans autres plaisanteries, il est temps de passer aux choses sérieuses : tout d’abord, connectez-vous à la page principale de la Wayback Machine, collez l’adresse de la page Web qui génère l’erreur 404 dans la zone de texte et appuyez sur le bouton “Entrée”.

Quelques secondes plus tard, une sorte d’archive temporelle vous est présentée, grâce à laquelle vous pouvez accéder à l’un des instantanés du site en question : pour ce faire, cliquez d’abord sur l’année à laquelle vous souhaitez revenir en la sélectionnant dans la barre supérieure, puis cliquez sur le mois et le jour à l’aide du calendrier situé juste en dessous. Après quelques instants, on vous montrera l’ancienne version de la ressource à laquelle vous essayiez d’accéder, exactement comme elle était le jour que vous avez choisi.

Contacter le webmaster

Vous n’avez pas eu de chance avec aucune des solutions ? En dernier recours, vous pouvez essayer de contacter le webmaster du site en question et lui demander s’il est possible de restaurer la page que vous cherchiez ou au moins de vous expliquer comment y accéder (si elle a été déplacée).

À titre d’information, le webmaster d’un site web est la figure professionnelle qui s’en occupe, en gérant tous les aspects de mise en œuvre qui y sont liés (structure des pages, schéma des liens, plugins, base de données, etc.) : en d’autres termes, le webmaster est celui qui gère le fonctionnement du site et correspond parfois au propriétaire de celui-ci.

Donc, si vous voulez vous rapprocher de cette solution, vous devez tout d’abord accéder à la page principale qui contient le lien qui génère l’erreur 404, rechercher l’élément Contacts parmi les menus de navigation attachés aux pages du site et utiliser le formulaire proposé, s’il existe, pour communiquer avec un gestionnaire ; dans certains cas, vous devrez utiliser les éléments Contact du webmaster ou Feedback, très souvent situés au bas du site en question.

Quoi qu’il en soit, en plus de demander des explications sur la manière d’accéder à la ressource perdue, prenez soin de préciser l’adresse web qui déclenche l’erreur 404 et une adresse (e-mail, social, Skype, etc.) pour vous contacter : si tout se passe bien, vous devriez recevoir une réponse (et, espérons-le, une solution) dans un bref délai.

Comment corriger l’erreur 404 sur votre site ?

Et c’est vous qui gérez le site web qui génère les erreurs 404. Que devez-vous faire ?

La solution, comme vous le savez sûrement déjà, est théoriquement simple : il vous suffit de trouver et de supprimer des références à des contenus qui n’existent plus dans les pages de votre site web. Par contre, trouver de telles références n’est peut-être pas très facile (surtout si le site en question est suffisamment riche en contenu), mais voici quelques conseils qui pourraient vous aider.

Console de recherche Google

La première méthode pour détecter et corriger les erreurs 404 sur votre site web consiste à utiliser la console de recherche Google : dans ce cas, il s’agit d’une série d’outils permettant de surveiller l’état de votre site web à l’aide du crawler de Google, c’est-à-dire le robot capable d’analyser les pages et leur structure afin de proposer une indexation au sein du moteur de recherche.

Mais avant de continuer, assurez-vous que le fichier robots.txt de votre site web permet au robot de Google de scanner les pages (en pratique, vérifiez que les directives d’interdiction sont limitées au strict nécessaire).

Ensuite, vous pouvez enfin relier la console de recherche Google à votre site web : tout d’abord, allez sur la page principale du service offert par Google, cliquez sur le bouton “Connexion” en haut à droite et entrez vos identifiants de compte Google (si vous ne les avez pas, vous pouvez en créer un gratuitement en suivant ces instructions).

Pour associer un nouveau site web, placez le menu déroulant proposé sur l’option Site web, tapez l’adresse complète de la page principale de votre site dans la case à côté et enfin appuyez sur le bouton Ajouter une propriété pour lancer le processus.

À ce stade, vous devriez pouvoir consulter les instructions pour valider la propriété du site : en général, ce que vous devez faire, c’est télécharger le fichier de vérification, le charger sur votre site web (dans le dossier qui pointe vers la racine du domaine) et, une fois l’opération terminée, le valider en cliquant sur la case Je ne suis pas un robot et en appuyant sur le bouton Vérifier situé en bas.

Une fois la propriété du site validée, retournez à la page principale de la console de recherche, cliquez sur la propriété qui vient d’être ajoutée, sélectionnez les éléments Scan et Sitemap dans le menu de navigation latéral de la page proposée, appuyez sur le bouton Add/Sitemap Head et suivez les instructions pour que la console Google “reconnaisse” le plan du site.

En général, le scan est terminé au bout de quelques jours, après quoi vous pouvez voir non seulement les statistiques sur les clics et les contenus, mais aussi les 404 erreurs générées par le site : pour ce faire, après avoir accédé à la page principale de la console de recherche relative à votre site web, cliquez sur les éléments Scan et Scan Errors et, enfin, sélectionnez l’onglet Not Found pour voir la liste complète des 404 erreurs qui ont résulté des différentes pages web.

XLS (Xenu’s Link Sleuth)

Si vous n’êtes pas entièrement satisfait de la solution proposée par Google, vous pouvez vous tourner vers un crawler local comme Link Sleuth de Xenu ou, plus simplement, Xenu : dans ce cas, il s’agit d’un programme gratuit pour Windows (mais qui peut également être utilisé sur MacOS via une émulation) qui peut analyser le contenu d’un site web et signaler, entre autres, les liens rompus. Gardez à l’esprit qu’en utilisant Xenu, l’analyse des liens est effectuée en utilisant votre connexion Internet, donc l’analyse peut prendre beaucoup de temps.

En êtes-vous bien conscient et avez-vous toujours l’intention de continuer ? C’est parfait ! Tout d’abord, allez sur la page de téléchargement du Xenu, cliquez sur le lien de téléchargement qui s’y trouve et attendez que le fichier (par exemple XENU.zip) soit téléchargé sur votre ordinateur.

Une fois cette opération terminée, extrayez l’archive dans un dossier comme vous le souhaitez (en suivant ces instructions, si vous ne savez pas comment faire), double-cliquez sur le fichier Setup.exe à l’intérieur et appuyez sur les boutons Suivant, J’accepte, Suivant deux fois, Installer, Suivant et Terminer pour finaliser l’installation et lancer le programme immédiatement.

Maintenant, appuyez sur le bouton Fermer pour fermer la suggestion initiale, sélectionnez l’élément Vérifier l’URL… dans le menu Fichier du programme en haut à gauche, tapez l’adresse à scanner dans la zone de texte en haut, appuyez sur le bouton Plus d’options, cochez tous les éléments proposés et appuyez deux fois sur le bouton OK pour lancer le scan immédiatement.

Une fois l’analyse terminée, la fenêtre principale du Xenu affichera à la fois les 404 erreurs trouvées et les pages contenant les liens brisés qui leur sont associés.

Plugin per CMS

Si vous avez créé votre site web à l’aide d’un CMS, la résolution des erreurs 404 générées par les liens rompus pourrait être beaucoup plus facile. Dans la plupart des cas, en effet, il existe des plugins spéciaux pour l’analyse des sites web, qui peuvent vérifier les erreurs 404, supprimer les références ou générer (si possible) des redirections automatiques pour “contenir” les dommages et, dans certains cas, pour créer des pages d’erreur attrayantes pour l’utilisateur, qui n’endommagent pas de manière significative le temps de séjour ou n’augmentent pas le taux de rebond du site web.

Parmi les modules complémentaires les plus populaires de ce type, on trouve Yoast SEO et Broken Link Checker pour WordPress et Link Checker pour Joomla.