Extraction terminologique
Extraction terminologique
Méthode statistique
Méthode linguistique
La méthode
statistique permet de repérer les termes selon des critères
quantitatifs (longueur, fréquence) dans un corpus textuel. Par
rapport à sa fréquence, le terme est une unité qui apparaît plus
fréquemment dans les textes spécialisés que dans les textes
généraux.
Cette définition
permet d'envisager plusieurs méthodes statistiques de repérage, ou
d'extraction, terminologique.
- le repérage des
unités lexicales les plus fréquentes dans un texte ou un corpus
Il faut préciser
qu'il s'agit d'unités lexicales appartenant aux langues de
spécialité et non à la langue générale. Dès lors, il faut
exclure les unités appartenant à la langue générale : c'est
le rôle de la liste d'exclusion
- le repérage des unités lexicales caractéristiques du genre textuel
Dans les documents spécialisés, l'auteur utilise non seulement une terminologie spécifique au domaine de spécialité, mais aussi des tournures syntaxiques propres à la rédaction de documents spécialisés. De plus, certains termes ont une forme faisant également partie de la langue générale, par exemple la forme lexicale « tension » a le sens de situation tendue entre deux groupes, deux personnes, deux États dans un document d'intérêt générale socio-politique, mais dans un document technique l'unité lexicale « tension » désigne une grandeur caractérisant le mouvement de charges électriques et constituera en même temps un élément de termes composés comme tension d'alimentation, tension de sortie, tension de secteur.
Un logiciel de concordance permet de calculer la fréquence d'occurence dans un document spécialisé par rapport à un ou plusieurs documents en langue générale.
Logiciels d'extraction ou de reconnaissance terminologique
Liens de logiciels en ligne :
Labs Translated Net
WebCorp
Logiciels et suites :
TRADOS Multiterm extract
Wordfast
- le repérage des unités lexicales caractéristiques du genre textuel
Dans les documents spécialisés, l'auteur utilise non seulement une terminologie spécifique au domaine de spécialité, mais aussi des tournures syntaxiques propres à la rédaction de documents spécialisés. De plus, certains termes ont une forme faisant également partie de la langue générale, par exemple la forme lexicale « tension » a le sens de situation tendue entre deux groupes, deux personnes, deux États dans un document d'intérêt générale socio-politique, mais dans un document technique l'unité lexicale « tension » désigne une grandeur caractérisant le mouvement de charges électriques et constituera en même temps un élément de termes composés comme tension d'alimentation, tension de sortie, tension de secteur.
Un logiciel de concordance permet de calculer la fréquence d'occurence dans un document spécialisé par rapport à un ou plusieurs documents en langue générale.
Logiciels d'extraction ou de reconnaissance terminologique
Liens de logiciels en ligne :
Labs Translated Net
WebCorp
Logiciels et suites :
TRADOS Multiterm extract
Wordfast
0 commentaires:
Enregistrer un commentaire