Contrôle de l’archivage et de Wayback
Emplacement : Étape 5, Contrôle de l’archivage et de Wayback.
Cette étape contrôle si les services d’archivage et de Wayback peuvent capturer des copies du site, ou si le site publie une posture restrictive contre eux.
Ce que cette étape contrôle
Deux choix :
- Allow Archiving : aucune règle Disallow spécifique aux archives n’est ajoutée. Les bots d’archivage sont gouvernés uniquement par les règles des étapes précédentes.
- Block Archiving : Better Robots.txt publie des directives Disallow explicites visant la catégorie des bots d’archivage.
Le cadrage par catégorie vient de la taxonomie des bots Better Robots.txt, qui classe les bots d’archivage comme un rôle distinct : ils capturent ou rejouent du contenu à des fins de préservation, pas pour soutenir la visibilité dans la recherche ni la récupération de réponses.
Comment décider
Utilisez Allow Archiving si :
- le site valorise la traçabilité historique de ses pages publiques ;
- la préservation dans des archives tierces (comme la Wayback Machine) est jugée neutre ou positive pour la marque ;
- il n’existe aucune raison légale ou de conformité qui justifierait de restreindre la capture.
Utilisez Block Archiving si :
- des pages anciennes ou retirées ne devraient pas rester facilement récupérables via une archive externe ;
- les snapshots d’archive créent une exposition réputationnelle, juridique ou de conformité ;
- le profil du site est déjà orienté protection (voir le preset Fortress et le pattern Fortress pour sites sensibles).
Un choix de blocage est un signal de politique publié, pas une garantie d’application au runtime. Voir la section suivante.
Ce que cette étape ne fait pas
Cette étape :
- n’authentifie pas le bot d’archivage et ne vérifie pas son identité ;
- n’empêche pas la capture par des bots non coopératifs qui ignorent
robots.txt; - ne supprime pas rétroactivement les snapshots déjà détenus par des archives tierces ;
- ne remplace pas une demande de retrait envoyée directement au fournisseur d’archive.
Le bon cadrage : une guidance machine plus claire sur l’intention d’archive, appliquée à la couche politique.
Offre concernée
- Free : Allow Archiving est le comportement par défaut, toujours disponible.
- Premium : Block Archiving est réservé à l’offre Premium.