indexation
Procédure destinée à décrire et à caractérsier le contenu d'un texte ou d'un document (ou d'une partie d'un texte ou d'un document) à l'aide de mots (dits mots-clé ou descripteurs) représentant les concepts ou informations dans ce document, et ce, à des fins classification et pour en faciliter la recherche. De fait, un processus d'indexation comporte, d'une part, la reconnaissance et l'extraction des concepts informatifs (ou mots porteurs d'informations) et, d'autre part, la traduction de ces concepts dans un langage (dit langage documentaire) approprié à la classification et à la recherche de documents. Voir aussi catégorisation.
Résultat d'ordre numérique obtenu suite aux analyses visant à situer un texte par rapport à un ensemble de textes tenus pour référence ou établis pour des objectifs précis. Ainsi, dans le milieu scolaire, l'indice de calibrage résulte d'opérations portant sur plusieurs aspects (par exemple, l'utilisation du vocabulaire, la répartition dans le texte de certains mots désignés, la construction des phrases) visant à situer le texte sur un continuum établi de la première année du primaire à la cinquième année du secondaire. En somme, l'indice de calibrage est un indicateur caractéristique de la manière dont le texte est construit, notamment sur le plan lexical. Voir aussi calibrage de texte.
indice discriminant (de Salton) Désigne, en ATO, une mesure d'ordre numérique, dû à G. Salton (1989), permettant d'apprécier la contribution d'un mot ou groupe de mots donné à la différenciation entre deux textes ou deux sous-ensemble de texte (dit aussi sous-textes). En d'autres termes, il s'agit de mesurer le poids ou la valeur discriminatoire d'un vocabulaire donné entre deux textes ou parties de texte, afin d'apprécier, par exemple, l'originalité d'un texte par rapport à un autre sur le plan lexical. On par aussi de valeur discriminante. Voir aussi distance.
Désigne, en ATO, des mesures d'ordre numérique permettant d'apprécier la difficulté ou la facilité de lecture, de compréhension et de mémorisation d'un texte ou des parties d'un texte. Ces mesures sont calculées à partir de paramètres comme la longueur des mots, la longueur des phrases, l'usage de certaines constructions de phrase (par exemple, l'emploi excessif des pronoms relatifs) ou autres. Un des indices classiques de la lisibilité est l'indice de Gunning. Voir aussi lisibilité.
Désigne, en ATO, une mesure d'ordre numérique permettant d'apprécier la distribution d'un mot ou groupe de mots, de certains caractères ou signes (par exemple, les signes typographiques) dans un nombre défini d'extraits de texte (dit aussi segments ou segments de texte). Il s'agit, en somme, pour un mot ou groupe de mots donné, du rapport entre le nombre de segments de texte où apparaît le mot et le nombre total de segments, et ce, dans le but de mesurer la participation du mot ou des mots désignés dans les segments. Voir aussi participation, distance.
Désigne le résultat d'un raisonnement logique à base de règles par lequel on admet ou on rejette une proposition en fonction d'autres propositions ou de faits déjà tenus pour vrais. En d'autres termes, une inférence résulte d'un mécanisme d'interprétation (dit moteur d'inférence) de faits par des règles (dites règles de production) qui analysent ces faits pour en produire soit d'autres règles (par exemple, des règles de généralisation), soit une conclusion. Divers types de raisonnements (par exemple, les raisonnements déductifs et inductifs) sont automatisés à des fins d'applications en intelligence artificielle et en traitement automatique des langues. Voir aussi base de connaissance, système expert.
Désigne, en ATO, une information d'ordre linguistique par laquelle chaque mot peut être classé ou catégorisé par rapport à des variables ou propriétés syntaxiques et sémantiques. Dans leur plus simple expression, les informations lexicales se réduisent aux valeurs de la catégorie grammaticale (dite aussi catégorie lexicale) du mot. Ainsi, par exemple, la variable nom associée à un mot comme ordinateur est une information lexicale relevant de la catégorie grammaticale de ce mot. Voir aussi propriété lexicale.
Désigne, en ATO, une information ou connaissance communiquée par du code linguistique écrit, soit du texte. En d'autres termes, il s'agit d'un objet pourvu d'une signification propre (par exemple, un mot ou un groupe de mots), supporté par une forme particulière de codage, c'est-à-dire l'écriture et a fortiori le texte dans toutes ses dimensions (par exemple, une dimension consiste en la mise en relief du mot par le biais des caractères italiques). De ce fait, l'objet (le mot ou groupe de mots) devient le véhicule d'une information ou d'une connaissance donnée. En conséquence, l'information textuelle relève, d'une part, d'une organisation physique du code écrit qui la supporte et, d'autre part, d'un contenu signifiant ou informationnel qui peut faire l'objet d'analyses (par exemple, analyses linguistique, sémiotique, philosophique, etc.) ou de gestion (auquel cas on parle de gestion de l'information textuelle; par exemple, la catégorisation du contenu ou du sens par des mots-clé). Voir aussi donnée textuelle.
Désigne l'utilisation des moyens informatiques à des fins d'assistance, ou de résolution de problèmes, dans les domaines de la documentation et du traitement de l'information. Ainsi, que ce soit au niveau des analyses des textes ou des documents (par exemple, l'analyse du contenu des textes à des fins de repérage de mots porteurs d'informations) ou au niveau de l'activité documentaire (par exemple, la catégorisation du contenu des textes), on trouve de nombreux outils technologiques permettant la recherche, l'extraction, l'archivage et la gestion d'informations, l'analyse et le traitement de la documentation, etc.
Discipline visant à comprendre la nature et les mécanismes de fonctionnement de l'intelligence en général, et celle de l'humain en particulier, afin d'en produire des imitations par le biais de programmes informatiques. L'intelligence artificielle s'intérresse essentiellement aux processus ou mécanismes cognitifs mis en oeuvre par les humains dans l'accomplissement de tâches intelligentes, comme, par exemple, la compréhension d'un texte, la résolution de calculs mathématiques, ou encore la prise de décision face une situation donnée. Voir aussi génie linguistique, linguistique informatique.
© Service ATO (UQAM) et EBSI (Université de Montréal) |