Aide à la recherche sur Ht://Dig

Table des matières

1. Présentation du logiciel de recherche
2. Cherchez sur...
3. Mot(s) recherché(s)
4. Type de recherche
5. Méthode de recherche

Exacte (avec signes diacritiques banalisés)

Étendue (pluriel + féminin des mots)

6. Autres facteurs pertinents

Mots exclus («stop words»)

Caractère spécial

7. Résultats

Nombre de résultats par page

Tri des résultats

Affichage des résultats

 

Le texte qui suit décrit le fonctionnement du logiciel de recherche utilisé sur le site Web de l'Université de Montréal. Si vous avez des questions à nous soumettre, vous pouvez nous écrire.

1. Présentation du logiciel de recherche

Le logiciel de recherche utilisé sur les sites Web de l'Université de Montréal est ht://Dig. Cet outil de recherche a un «robot» qui indexe périodiquement les sites du domaine umontreal et il permet d'effectuer des recherches dans l'index constitué suite à cette indexation.

La grande majorité des sites Web des unités de l'Université de Montréal sont indexés par ht://Dig, c'est-à-dire:

  • les sites des facultés et des départements;
  • les sites des unités de recherche;
  • les sites des services;
  • les sites des associations étudiantes et des autres associations dont l'adresse URL est située dans le domaine umontreal.

Par contre, les sites suivants ne sont pas indexés:

L'indexation des sites s'effectue durant la nuit (de 23h00 à 7h00), soit au moment où le nombre d'internautes qui visitent les sites Web de l'UdeM est moindre. Les sites sont indexés à la fréquence suivante:

  • à tous les jours: les sites hébergés sur le SHWEB
  • à tous les deux jours: les autres sites de l'UdeM

Les changements apportés à un site Web dans la période entre deux indexations sont susceptibles d'occasionner les problèmes suivants:

  • les documents qui ont été ajoutés ne sont pas repérés;
  • les documents qui ont été éliminés sont repérés mais, en raison de leur élimination, ils ne sont pas accessibles aux utilisateurs.

Le logiciel de recherche indexe uniquement les fichiers de type htm, html, txt, asp et pdf. Il n'indexe pas les données contenues dans les bases de données, à moins que celles-ci ne soient publiées sous forme de fichiers statiques.

2. Cherchez sur...

La recherche s'effectue sur une collection. Une collection peut être constituée:

  • d'un site Web complet (par exemple, le site www.forum.umontreal.ca/);
  • d'une portion d'un site Web (par exemple, www.forum.umontreal.ca/numeros/1999-2000/);
  • d'un regroupement de sites ou de portions de sites Web (par exemple, la collection «Tous les sites de l'UdeM» ou encore la collection formée de www.dircom.umontreal.ca/communiques/2000/ et de www.forum.umontreal.ca/numeros/1999-2000/).

C'est le responsable du site Web à partir duquel la recherche est effectuée qui définit les collections sur lesquelles l'internaute effectue sa recherche.

3. Mot(s) recherché(s)

L'internaute doit inscrire un ou plusieurs mots dans ce champ. La syntaxe et les résultats de la requête varieront en fonction du type et de la méthode de recherche choisis (voir ci-dessous)

4. Type de recherche

L'internaute a le choix entre trois types de recherche.

Au moins un des mots

L'internaute obtient tous les fichiers contenant au moins un des mots demandés dans la requête.

Tous les mots

L'internaute obtient uniquement les fichiers contenant chacun des mots demandés dans la requête.

Recherche booléenne

Si l'internaute sélectionne ce type de recherche, il doit utiliser les opérateurs traditionnels de recherche AND, OR et NOT dans sa requête. À noter: le logiciel ne reconnaît pas les opérateurs ET, OU et NON.

Avec AND, on obtient tous les documents contenant chacun des mots spécifiés. Par exemple, la requête <Université AND Montréal> permet d'obtenir uniquement les documents contenant à la fois le mot «Université» et le mot «Montréal» (c'est l'équivalent de la recherche en mode «Tous les mots»).

Avec OR, on obtient tous les documents contenant au moins un des mots spécifiés. Par exemple, la requête <Université OR Montréal> permet d'obtenir les documents contenant ou le mot «Université», ou le mot «Montréal», ou les deux (c'est l'équivalent de la recherche en mode «Au moins un des mots»).

Avec NOT, comme dans <Université NOT Montréal>, on obtient uniquement les documents contenant le premier mot, soit «Université», mais non le deuxième, «Montréal».

Il est également possible de combiner des opérateurs booléens, par exemple: <Université AND (Montréal NOT Québec)>.

 
Recherche d'expressions

Le logiciel de recherche ne supporte pas les expressions. Ainsi, avec la requête <"Université de Montréal"> en mode «Tous les mots», on obtiendra tous les documents comprenant le mot «Université» et le mot «Montréal» et non pas uniquement ceux comprenant l'expression exacte «Université de Montréal».

5. Méthode de recherche

Il existe deux méthodes de recherche.

Exacte (avec signes diacritiques banalisés)

Avec ce choix, le logiciel de recherche retourne uniquement les mots demandés mais sans tenir compte ni de la casse (majuscules ou minuscules), ni des signes diacritiques (é, è, ê, ç, À, etc.). Ainsi, avec la requête <Montréal>, on obtient tous les documents contenant au moins l'un des quatre mots suivants: «Montréal», «Montreal», «montréal» ou «montreal».

Étendue (pluriel + féminin des mots)

Avec cette méthode de recherche, le logiciel retournera non seulement le ou les mots demandés (comme dans la première méthode) mais également leur pluriel, leur féminin et, le cas échéant, leurs variantes. Par exemple, avec la requête <hôpital>, on devrait obtenir les documents contenant les mots «hôpital», «hopital», «hôpitaux» et «hopitaux».

Remarque
Dans les faits, la méthode Étendue ne donne pas toujours les résultats escomptés. L'inclusion des pluriels et des féminins des mots recherchés repose sur un «dictionnaire» plus ou moins complet. Par conséquent, le recours à cette méthode ne garantit pas que nous obtenions les pluriels et les féminins de tous les mots demandés; pour être certain d'effectuer une recherche exhaustive, il est donc préférable de spécifier toutes les versions d'un mot et d'utiliser le type Au moins un des mots (par exemple, utiliser la requête <hôpital hôpitaux>.

6. Autres facteurs pertinents

Mots exclus («stop words»)

Le logiciel de recherche ignore une série de mots français et anglais qui ne sont pas susceptibles d'être significatifs dans une requête tels: le, la, les, un, une, a, à, est, (...) the, an, have, is, are, etc. Par contre, des mots courts susceptibles de faire l'objet d'une requête (par exemple TIC ou ONU) sont reconnus par le logiciel.

Caractère spécial

Le caractère «*» remplace n'importe quel caractère ou chaîne de caractères. Il peut seulement apparaître à la droite d'un préfixe. Par exemple, si on cherche <Montreal*>, on obtient tous les documents contenant les mots «Montréal», «montréalais», «montréalaise», etc. Par contre, le logiciel ne traitera pas la requête <Mont*eal>

7. Rsultats

Nombre de résultats par page

Cette option permet de fixer le nombre maximal de résultats affichés sur une page. Une barre de navigation au bas de la page des résultats permet de passer d'une page de résultats à une autre. NB: peu importe le nombre de résultats par page choisi, le nombre maximum de pages de résultats est limité à 10; ainsi, si on choisit d'afficher 10 résultats par page, on aura accès à un maximum de 100 résultats; par contre, si on choisit d'afficher 25 résultats par page, on pourra obtenir un maximum de 250 résultats.

Tri des résultats

Avant d'être affichés, les résultats d'une recherche sont triés selon l'une des trois méthodes suivantes:

  • Pertinence: les documents les plus «pertinents» apparaissent au début de la liste; la pertinence est mesurée par l'outil de recherche en fonction d'un certain nombre de critères dont le nombre d'occurrences des mots recherchés dans le document, le fait que les mots apparaissent dans le titre, etc. NB: le nombre d'étoiles aparaissant à côté du titre du document indique le degré de pertinence, les documents les plus pertinents afichant le maximum d'étoiles.
  • Date: il s'agit de la date à laquelle le document a été créé ou modifié la dernière fois, les documents les plus récents apparaissant en haut de la liste.
  • Date inverse: avec cette méthode d'affichage, les documents les plus anciens apparaissent en premier.

Affichage des résultats

L'affichage détaillé des résultats comprend les éléments suivants (pour chaque document obtenu):

  • Le titre (title) du document, avec un hyperlien vers celui-ci.
  • Le degré de pertinence du document, représenté par un nombre plus ou moins grand d'étoiles.
  • Le contexte du mot trouvé, si possible; le ou les mots recherchés sont normalement mis en évidence (en gras); dans certains cas, le début du document sera affiché à la place du contexte.
  • L'URL du document avec un hyperlien vers celui-ci.
  • La date de mise à jour et la taille du document.

L'affichage sommaire ne retient que le titre du document (avec l'hyperlien vers celui-ci) et le degré de pertinence.

Dernière mise à jour: 17 janvier 2002