base
de connaissances
Désigne, en ATO, un ensemble de mots catégorisés, c'est-à-dire associés à un certain nombre d'informations pouvant être linguistiques (par exemple, la catégorie grammaticale) et/ou méta-linguistiques (essentiellement d'ordre sémantique et pragmatique; par exemple, les relations d'équivalence et d'antonymie entre les mots, les traits sémantiques et autres), et organisés (parfois en réseaux) en vue de leur utilisation par des programmes informatiques d'analyse de texte. De fait, la base de connaissances sert généralement de source de références essentiellement sur les savoirs non linguistiques dont a besoin un programme informatique d'analyse de texte pour mettre en évidence ou représenter le sens d'un énoncé.
base de données lexicales (BDL) Ensemble de mots (dits entrées lexicales ou données lexicales) catégorisés, c'est-à-dire associés à un certain nombre d'informations, généralement d'ordre linguistique (dites informations lexicales; par exemple, la catégorie grammaticale et les informations sur le comportement flexionnel des mots), et organisés en vue de leur utilisation par des programmes informatiques d'analyse de texte. La base de données lexicales sert ainsi de source de références et d'informations lors des prodédures d'annotation ou de catégorisation des mots d'un texte donné. On parle aussi de dictionnaire électronique. V. aussi dictionnaire indexé, dictionnaire séquentiel.
Désigne, en ATO, un ensemble de textes rassemblés et structurés à des fins de consultation et d'exploitation par des utilisateurs ou par des programmes informatiques d'analyse de texte. La base de données textuelles sert ainsi de sources de références et d'exemples pour divers types d'analyses (analyses sociologiques, linguistiques, documentaires, ou autres).
Désigne, en ATO, les résulats non désirés ou les fausses réponses parmi les résultats fournis par un programme informatique d'analyse de texte. Voir aussi silence.
© Service ATO (UQAM) et EBSI (Université de Montréal) |