⚡ Cliquez sur chaque animation pour voir le détail en grand format.

1. Ajustement rapide de la langue de tri alphabétique

À l'ouverture de la boîte de dialogue sur un nouveau document InDesign, vous allez parfois rencontrer cette petite icône d'alerte ⚠ signalant une discordance entre la langue-cible des « mots vides » et celle régissant le tri alphabétique. Il existe un moyen rapide de rétablir la concordance des deux sans passer par le panneau Sortie⏵Classement: il suffit d'un Ctrl Clic sur l'étiquette de langue située à droite de la liste Mots vides. Cela ajuste automatiquement la langue de classement à celle actuellement sélectionnée pour les mots vides.

1. Ajustement rapide de la langue de tri.

Note : Un clic simple (plutôt que Ctrl clic) ne fait qu'activer le panneau Classement.

2. Vérifier « en contexte » la cohérence lexicale

Durant la préparation ou l'analyse d'un document (en amont du processus d'indexation), un problème courant est de cerner l'environnement d'une expression particulière, et non pas les pages où elle apparaît. Par exemple, vous souhaitez vérifier que les emplois d'un mot restent homogènes sur la totalité de l'ouvrage. Ou bien, vous devez vous assurer qu'un patronyme injecté dans une requête IndexMatic ne renvoie pas à des contextes homonymes ou à des personnes distinctes.

La fonction Concordances en contexte est bien documentée dans le manuel, mais vous pourriez avoir négligé de recourir à ses services ! Voici à titre d'exemple l'extraction du nom propre « Buendia » dans Cent ans de solitude (417 occurrences) :

2. Extraction de contexte.

Note : La largeur de la « zone contextuelle » est réglable dans le panneau Préférences.

3. Signaler les entrées non trouvées par un symbole particulier

Par défaut, IndexMatic exclut de l'index les termes de fréquence nulle, c'est-à-dire ceux correspondant à des requêtes insatisfaites. Vous pouvez cependant le forcer à afficher les clés littérales absentes du document, en abaissant à 0 (zéro) la fréquence minimum. En outre, vous pouvez personnaliser le caractère à afficher en guise de folio, via Sortie⏵Mise en forme⏵Intervalles.

Dans l'exemple ci-dessous, le mot serendipité (absent du document de travail) a été ajouté à la liste de requêtes. Il est alors marqué dans l'index par un symbole tiret long (c'est le caractère par défaut).

3. Rapport des termes introuvables dans l'index.

Note : Cette fonctionnalité n'a de sens qu'en mode Liste de requêtes. Elle concerne spécifiquement les expressions littérales, puisqu'aucun terme explicite n'est dérivable d'une expression régulière.

4. Recherche de mots doublonnés

IndexMatic peut dénicher très rapidement les doublons d'un document, ces mots simples répétés à la suite, avec ou sans ponctuation intercalaire. Une expression régulière prédéfinie est enregistrée parmi vos favoris sous le label « Duplicates » ; il suffit donc de la sélectionner et d'exécuter un scan rapide (⚡):

4. Identification de doublons par une requête favorite.

Note : La regex en question, /(\w{2,})\W{1,3}(\1)/w, est assez élaborée quoique intelligible aux plus experts d'entre vous. Libre à vous de l'améliorer si elle ne répond pas à vos attentes… et de créer alors votre propre requête favorite !

5. Accès aux ressources en ligne

Saviez-vous que le bouton-icône iX³ est «cliquable» et vous conduit directement à la page d'accueil du programme dans votre navigateur par défaut ? Plus la peine de chercher dans vos archives le manuel d'utilisation ou un lien vers un tutoriel oublié : toutes les informations disponibles sur IndexMatic restent à portée de clic !

5. Accès direct à toutes les ressources en ligne.

6. Assignation d'un “PageRank” local

Reprenons l'exemple de Cent ans de solitude. Certains éléments à indexer sont omniprésents, tels que Macondo ou Buendia. Le problème, si vous travaillez avec une liste de requêtes explicites, c'est que vous ne pouvez pas augmenter globalement le PageRank, car vous perdriez alors certains termes plus rares qui doivent tout de même figurer dans l'index. Mais d'un autre côté, les mots de haute fréquence génèrent un déluge de pages et cela rend l'index inutilisable pour ces entrées. Une solution consiste à assigner un flag local de PageRank (dans votre liste de requêtes) aux mots qui réclament un filtrage plus fort. Par exemple, Macondo/4 retient seulement les pages où le village de Macondo est mentionné au moins quatre fois.

L'animation ci-dessous montre comment opérer un tel « ciblage » pour certains mots explicitement choisis. Le résultat est alors reflété dans la liste des Termes :

6. Assignation d'un “PageRank” local à certains mots.

Note : Un flag de PageRank local (au sein de votre liste de requêtes) supplante toujours la valeur du PageRank définie globalement dans l'Explorateur.

7. Alphabets « exotiques » et personnalisation des mots vides

IndexMatic vous permet de travailler avec de nombreuses langues et dans des alphabets non latins. Même des systèmes rarement rencontrés dans un document InDesign, comme l'alphasyllabaire khmer, sont supportés par le moteur de recherche. Il existe alors des situations où l'alphabet est reconnu — ce qui permet d'extraire des mots théoriques via une requête de type \w+ — sans pour autant que les ressources linguistiques (langue de tri, mots vides) soient disponibles. Il vous reste néanmoins l'option de définir vous-mêmes une liste personnalisée de mots vides, afin de filtrer les unités extraites lors d'une recherche automatique.

Une fois l'alphabet sélectionné, il suffit de sélectionner le champ « [Personnalisé] » dans la liste Mots vides. Vous accédez ainsi à un fichier texte éditable que le programme mémorisera et réutilisera si besoin.

7. Traitement d'un document contenant du texte en cambodgien (khmer).

Note : Remarquez que par la même procédure, IndexMatic vous autorise à éditer ou étendre n'importe quelle liste prédéfinie de mots vides, y compris les listes natives. Par ailleurs, concernant le classement des entrées d'index, il est recommandé de sélectionner l'option DUCET (tri Unicode) si aucune langue n'est fournie pour le texte considéré.

8. Raccourcis pour la saisie des métacaractères (regex)

La plupart des métacaractères de regex IndexMatic reposent sur la barre oblique inverse suivie d'un ou plusieurs caractères, par exemple \w (lettre de l'alphabet), \M (lettre majuscule), \p{…} (propriété Unicode), etc. Ces séquences étant assez fastidieuses à saisir au clavier, IndexMatic propose certains raccourcis non documentés pour accélérer la saisie dans le champ Trouver.

Métacaractère Raccourci
\w Ctrl W
\W Ctrl Shift W
\l Ctrl L
\L Ctrl Shift L
\m Ctrl M
\M Ctrl Shift M
\d Ctrl D
\D Ctrl Shift D
\s Ctrl S
\S Ctrl Shift S
\b Ctrl B
\B Ctrl Shift B
\t Ctrl T
[^\t] Ctrl Shift T
[\'‘"“«] Ctrl Q
\Q Ctrl Shift Q
[\'’"”»] Ctrl E
\E Ctrl Shift E
\u Ctrl U
\u{ Ctrl Shift U
\y Ctrl Y
\p{ Ctrl P
\P{ Ctrl Shift P

La combinaison la plus répandue (Ctrl W pour \w) est illustrée dans l'animation ci-dessous :

8. Lors de la saisie d'une regex, utilisez le raccourci Ctrl W pour obtenir le métacaractère \w.

9. Extraction d'une liste « pondérée » vers Wordalizer

À partir de n'importe quel document, IndexMatic peut très facilement extraire une liste de mots dans un domaine de fréquences donné, puis produire un rapport de Termes associant à chaque élément son poids fréquentiel. Si vous souhaitez alors représenter ces données dans Wordalizer, il n'y aura qu'à les récupérer dans un bloc-texte InDesign et à convertir les espaces tabulaires en deux-points (afin de fournir au script une liste pondérée). Voici succinctement comment manœuvrer :

9. Extraction automatique d'une liste de mots pour Wordalizer.

10. Conservation de l'ordre original selon la liste de requêtes

L'option permettant de préserver l'ordre des éléments tels qu'ils apparaissent dans une liste de requêtes est clairement décrite dans le manuel… mais de nombreux utilisateurs continuent de nous interroger à ce sujet ! S'agit-il d'une « fonction documentée cachée » ? Eh bien, faisons un gros plan sur ce petit commutateur :

10. Conservation de l'ordre original d'une liste de requêtes.