réduction

Conversion de documents de Markdown au format Microsoft Word

Conversion de documents de Markdown au format Microsoft Word
Entre autres activités, la rédaction et l'édition de documents texte font partie des actions les plus courantes pour lesquelles nous utilisons nos ordinateurs (de bureau). La manière exacte dont cela est fait suit différents chemins - de l'utilisation d'un éditeur de texte brut comme Vim à des applications graphiques comme Open/Libre Office ou des services basés sur le cloud accessibles via un navigateur Web comme Google Docs. À notre désavantage, chaque outil est livré avec son propre format de document natif ainsi qu'une sélection d'autres formats de document pris en charge. La qualité de la conversion entre ces formats varie considérablement et peut entraîner beaucoup de frustration lors du franchissement des frontières des formats.

Dans cet article, nous examinons la conversion entre Markdown [1] et DOCX - le format de document natif de Microsoft Word utilisé depuis 2007. Vous vous demandez peut-être pourquoi un passionné de Markdown et d'Asciidoc (comme moi) s'occupe de cette affaire. Eh bien, collaborer avec un groupe d'autres écrivains peut conduire à une situation où un ou plusieurs participants demandent DOCX comme format de sortie. Ne laissez personne tomber, et découvrez quelles limitations existent, à la place, et comment nous pouvons essayer de rendre tous les membres du groupe heureux.

Qu'est-ce que la démarque?

Comme déjà souligné dans « An Introduction into Markdown » [2], l'intention de Markdown est une simple conversion de texte en HTML. L'idée derrière cela était de rendre la rédaction de pages Web, de documentation et surtout d'entrées de blog aussi simple que la rédaction d'un e-mail. À ce jour, c'est le synonyme de facto d'une classe de langages de description de balisage légers, et l'objectif peut être considéré comme atteint.

Markdown utilise une syntaxe de formatage de texte brut. Avec une approche similaire à celle du HTML, un certain nombre de marqueurs indiquent les titres, les listes, les images et les références dans votre texte. Les quelques lignes ci-dessous illustrent un document de base qui contient deux titres (1er et 2e niveau) ainsi que deux paragraphes, et un environnement de liste.

# Lieux recommandés à visiter en Europe
## France
Voici une sélection de lieux :
* Paris (_Ile de France_)
* Strasbourg (_Alsace_)
Pour un bon plan de visite environ une semaine.

Conversion en DOCX

Afin de convertir votre document Markdown en DOCX, utilisez l'outil pandoc [3]. Pandoc est une bibliothèque Haskell et se décrit comme « le convertisseur de documents universel », ou le « couteau suisse pour les conversions de documents ». Il est disponible pour une variété de plates-formes telles que Linux, Microsoft Windows, Mac OS X et BSD. Pandoc est généralement inclus en tant que package pour les distributions Linux telles que Debian GNU/Linux, Ubuntu et CentOS.

Un simple appel à une conversion est le suivant :

$ pandoc -o test.test docx.Maryland

Le premier paramètre '-o' fait référence au fichier de sortie, suivi du nom du fichier ('test.docx'). L'extension de fichier aide pandoc à identifier le format de sortie souhaité. Le deuxième paramètre nomme le fichier d'entrée - dans notre cas, il s'agit simplement de "test.Maryland'.

La version longue de la commande ci-dessus contient les deux paramètres '-f markdown' et '-t docx'. Le premier abrège le terme « saveur » et décrit le format du fichier d'entrée. Le second fait de même pour le fichier de sortie et abrège '-to'.

La commande complète est la suivante :

$ pandoc -o test.docx -f markdown -t docx test.Maryland

L'ouverture du fichier converti à l'aide de Microsoft Word donne le résultat suivant :

Pour les différents éléments de texte, Pandoc utilise des feuilles de style. Cela vous permet d'ajuster ces éléments par la suite en fonction de vos besoins tout au long du document. Les versions les plus récentes de Pandoc offrent également l'inverse - vous pouvez convertir un fichier DOCX en Markdown comme suit :

$ pandoc -o test.essai md.docx

Ensuite, le fichier généré a le contenu suivant :

Lieux recommandés à visiter en Europe
======================================
France
------
Voici une sélection de lieux :
-   Paris (*Ile de France*)
-   Strasbourg (*Alsace*)
Pour un bon plan de visite environ une semaine.

Options de ligne de commande utiles

La liste des options Pandoc est assez longue. Les éléments suivants vous aident à produire de meilleurs résultats et vous facilitent grandement la vie :

* '-P' (version longue '-preserve-tabs'): Conserve les tabulations au lieu de les convertir en espaces. Ceci est utile pour les blocs de code avec des lignes en retrait qui font partie de votre texte.

* '-S' (version longue '-smart'): produit une sortie typographiquement correcte.

Cette option corrige les guillemets, les traits d'union/tirets ainsi que les points de suspension  (« … »). Des espaces supplémentaires insécables sont ajoutés après certaines abréviations telles que « M.".

* '-track-changes=value' : indique ce qu'il faut faire avec les insertions, les suppressions et les commentaires générés à l'aide de la fonctionnalité de suivi des modifications de Microsoft Word. La valeur peut être soit accepter, rejeter ou tout afin d'inclure ou de supprimer les modifications apportées au document. Le résultat est un fichier plat.

Pour plus d'options, consultez la documentation et la page de manuel de Pandoc.

Résumé

La conversion entre Markdown et DOCX n'est plus un mystère. Cela se fait en quelques étapes et fonctionne très bien. Bon hack 🙂

Liens et références

* [1] Réduction
* [2] Frank Hofmann : Introduction à Markdown
* [3] Pandoc

Remerciements

L'auteur tient à remercier Annette Kalbow pour son aide lors de la préparation de l'article.

Le curseur saute ou se déplace de manière aléatoire lors de la saisie dans Windows 10
Si vous constatez que le curseur de votre souris saute ou se déplace tout seul, automatiquement, au hasard lors de la saisie sur un ordinateur portabl...
Comment inverser le sens de défilement de la souris et des pavés tactiles dans Windows 10
Souris et Pavé tactiles rendent non seulement l'informatique facile, mais plus efficace et moins chronophage. Nous ne pouvons pas imaginer une vie san...
Comment changer la taille, la couleur et le schéma du pointeur et du curseur de la souris sous Windows 10
Le pointeur et le curseur de la souris dans Windows 10 sont des aspects très importants du système d'exploitation. Cela peut également être dit pour d...