<link href="/assets/64d0ba83aa42c90354ff97799bcfc0c2.css" type="text/css" rel="stylesheet"> <script src="/assets/6fd6663d5303bb7eda3ef7493fc29db6.js"></script> <script> $(document).ready(function() { anchors.options = { visible: 'hover', placement: 'right', truncate: 64 }; anchors.add('#body h2, #body h3, #body h4, #body h5'); }); </script> <script> hljs.initHighlightingOnLoad(); </script>
<h3>« Parser » un document XML</h3> <ul> <li>Les règles XML doivent pouvoir être vérifiées par un programme : le <strong>parseur</strong></li> </ul> <p><img alt="parseur" src="/user/pages/020.cours/02.format_xml/10.parse/parser.png" /></p> <ul> <li><strong>Où trouver un parseur ?</strong> <ul> <li>dans les bibliothèques de programmation XML (libxml2, Expat, Xerces, JDOM, SAXON, MSXML, …)</li> <li>dans les navigateurs web (firefox, google-chrome, IE, Edge, Safari, Opera, …)</li> <li>intégrés à des éditeurs XML ;</li> <li>en « ligne de commande » xmllint, xmlwf,…)</li> </ul></li> </ul> <p><strong>Remarque :</strong> Dans un programme informatique, « parser » un document permet :</p> <p>= soit de charger en mémoire une <strong>structure arborescente d'objets</strong>, répondant en général à la norme DOM (<strong>parseur DOM</strong>) ;</p> <ul> <li>soit de parcourir séquentiellement le document afin réaliser certaines actions lors de l'ouverture ou de la fermeture de balises (<strong>parseur SAX</strong> ou équivalent).</li> </ul> <p>Dans ces séances, nous utiliserons souvent la commande</p> <pre><code class="language-bash">xmllint -noout fichier.xml</code></pre> <p>pour vérifier que les documents sont bien formés.</p>