<link href="/assets/64d0ba83aa42c90354ff97799bcfc0c2.css" type="text/css" rel="stylesheet"> <script src="/assets/6fd6663d5303bb7eda3ef7493fc29db6.js"></script> <script> $(document).ready(function() { anchors.options = { visible: 'hover', placement: 'right', truncate: 64 }; anchors.add('#body h2, #body h3, #body h4, #body h5'); }); </script> <script> hljs.initHighlightingOnLoad(); </script>

<h3>Modéliser un document</h3> <p>La modélisation d&#8217;un document consiste à le découper en éléments abstraits constituant autant de &#8220;noeuds&#8221; (dans une représentation arborescente) et à définir les relations structurelles entre ces éléments (par exemple un élément est inclus dans un autre, un élément est avant un autre, etc).</p> <p>Il y a en général plusieurs façons de modéliser un document en fonction de ce qu'on souhaite en faire. Par exemple, un document de type &#8220;livre&#8221; ne sera pas modélisé de la même façon si l&#8217;on cherche à conserver les informations nécessaires à sa localisation dans une bibliothèque ou si l&#8217;on cherche à en avoir une visualisation du contenu sur le web. De nombreux critères doivent être pris en compte, par exemple :</p> <ul> <li>la définition claire du type de document à modéliser ;</li> <li>l'existence de schémas standards pour le type de document à modéliser ;</li> <li>les usages prévisibles ;</li> <li>le temps et le budget disponibles ;</li> <li>les processus de production ;</li> <li>...</li> </ul> <p>Les <strong>éléments</strong> peuvent être des <em>containers</em>, c-à-d. des éléments contenant uniquement d&#8217;autres éléments, ou des éléments terminaux</p> <p>À chaque élément est associé :</p> <ul> <li>un nom ;</li> <li>une <em>cardinalité</em> (le nombre d&#8217;occurrence minimal et maximale) ;</li> <li>éventuellement, des <em>attributs</em>, permettant de noter des propriétés de l&#8216;élément (par ex: la langue).</li> </ul> <p>Pour les éléments terminaux, il faut associer le <em>type de données</em> qu&#8217;il contient. Cela peut être du texte, un mélange de texte et d&#8216;éléments (<em>contenu mixte</em>), des chiffres, une année, une date, etc.</p>