Suite Office : supprimer les chemins d’image dans vos fichiers PDF

I. Présentation

Dans cet article, je vais vous proposer trois méthodes afin de supprimer les chemins d'image présents dans les fichiers PDF générés par la suite Office.

Vous ne le savez certainement pas, mais lorsque vous insérez une image dans vos documents (Word par exemple) via un glisser-déposer ou un copier/coller, le chemin de provenance de votre image est inséré dans le champ "Texte de remplacement" de votre image. Une sorte de métadonnées de l'image qui peut poser un problème de confidentialité.

En effet, lorsque vous générez un fichier au format PDF à partir de votre document Word et que vos images possèdent cet attribut "Texte de remplacement", alors cet attribut est affiché lors du survol de l'image par le curseur dans le fichier PDF, voyez plutôt :

Affichage d'un chemin d'image dans un fichier PDF généré par Word.
Affichage d'un chemin d'image dans un fichier PDF généré par Word.

On peut ici voir que l'image provient d'un partage sur un serveur, on obtient alors des informations potentiellement sensibles, dont un attaquant saura quoi faire.

J'expose plus en détails ce problème de confidentialité dans l'article suivant : Insertion des images dans Word et fuites d'informations

Afin d'éviter cette fuite d'information, je vous propose trois méthodes à appliquer. Notez bien que celles-ci ne sont pas complémentaires, il s'agit de méthodes différentes qui sont chacunes efficaces.

II. Effacer manuellement le contenu de l'attribut "Texte de remplacement"

La première méthode est certainement la moins efficace, car elle est vulnérable aux oublis de l'utilisateur, notamment lorsqu'un document possède plusieurs dizaines d'images.

Elle consiste à effacer manuellement cet attribut lors de l'insertion d'une image. Pour cela, il faut cliquer sur l'image et afficher les attributs dans "Format de l'image", puis cliquer sur l'icône "Disposition et propriétés", vous verrez alors le contenu de l'attribut d'image "Texte de remplacement".

Accès à l'attribut "Texte de remplacement" d'une image
Accès à l'attribut "Texte de remplacement" d'une image

Il faudra alors supprimer le texte de cet attribut pour chaque image.

II. Utiliser une macro pour nettoyer toutes les images du document

La technique précédente est un peu fastidieuse pour plusieurs images et peut notamment provoquer des oublis. On peut donc utiliser une macro pour effectuer cette tâche automatiquement sur toutes les images. Naturellement, il faudra déclencher cette macro avant de générer le fichier au format PDF.

Pour créer une macro, il faut se rendre dans "Affichage", puis cliquer sur "Macros" et "Afficher les macros". Dans la liste déroulante "Macros disponibles dans", sélectionnez le nom de votre document actuel, puis saisissez le nom de la macro dans le champ "Nom de la macro:" et cliquer sur "Créer".

Création d'une macro dans Word
Création d'une macro dans Word

Il faudrat alors saisir la macro suivante :

Sub SupprimerTexteRemplacementImage()
    For Each image In ThisDocument.InlineShapes
        image.AlternativeText = ""
    Next

End Sub

Voici le résultat final attendu :

Création d'une macro dans Word
Création d'une macro dans Word

Celle-ci parcourt toutes les images du document, et pour chacune d'elle, remplace le contenu de l'attribut "Texte de remplacement" par une chaine de caractère vide.

Pour exécuter cette macro, il faut se rendre à nouveau dans "Affichage", puis "Macros", sélectioner la macro qui ne venons de créer et cliquer sur "Exécuter".

III. Empêcher l'écriture de cet attribut lors de l'export au format PDF

On peut ordonner à Word de ne pas insérer le contenu des attributs inutiles dés la génération du fichier PDF, encore faut il connaitre l'option et penser à décocher celle-ci à chaque fois que l'on génère un fichier PDF.

Lors de l'export au format PDF, il faut se rendre dans "Options" et décocher l'option "Balises de structure de document pour l'accessibilité".

Désactiver l'insertion des attributs d'accessibilité lors de la génération d'un fichier PDF
Désactiver l'insertion des attributs d'accessibilité lors de la génération d'un fichier PDF

Dés lors, le fichier PDFgénéré ne contiendra pas les attributs "Texte de remplacement" des images, même si ceux-ci sont toujours présents dans le fichier Word. Si le décochage de cette option peut être mis en place par défaut via les GPO ou la configuration de Word, faites le moi savoir dans les commentaires :).

IV. Changez vos habitudes

Enfin, la meilleur technique consiste à changer les habitudes de l'utilisateur (ce qui est généralement impossible en entreprise ;)). Il faut en effet utiliser la fonction "Insérer une image" de Word, qui ne prend pas en compte la position initiale de l'image, et ne rempli donc pas l'attribut "Texte de remplacement".

Utilisation de la fonction d'insertion d'image de Word
Utilisation de la fonction d'insertion d'image de Word

A noter qu'il est également possible de procéder à une copie de l'image dans Paint, puis une autre copie de Paint vers Word, ce qui fonctionne aussi mais est quelque peu fastidieux.

Partagez cet article Partager sur Twitter Partager sur Facebook Partager sur Linkedin Partager sur Google+ Envoyer par mail

Mickael Dorigny

Fondateur d’IT-Connect.fr et d’Information-security.fr.
Auditeur sécurité chez Amossys.

    mickael a publié 478 articles sur IT-Connect.See all posts by mickael

    Laisser un commentaire

    Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *