jeudi 9 octobre 2014

Extraction terminologique

Extraction terminologique


Méthode statistique


Méthode linguistique


La méthode statistique permet de repérer les termes selon des critères quantitatifs (longueur, fréquence) dans un corpus textuel. Par rapport à sa fréquence, le terme est une unité qui apparaît plus fréquemment dans les textes spécialisés que dans les textes généraux.
Cette définition permet d'envisager plusieurs méthodes statistiques de repérage, ou d'extraction, terminologique.
- le repérage des unités lexicales les plus fréquentes dans un texte ou un corpus

Il faut préciser qu'il s'agit d'unités lexicales appartenant aux langues de spécialité et non à la langue générale. Dès lors, il faut exclure les unités appartenant à la langue générale : c'est le rôle de la liste d'exclusion

- le repérage des unités lexicales caractéristiques du genre textuel
Dans les documents spécialisés, l'auteur utilise non seulement une terminologie spécifique au domaine de spécialité, mais aussi des tournures syntaxiques propres à la rédaction de documents spécialisés. De plus, certains termes ont une forme faisant également partie de la langue générale, par exemple la forme lexicale « tension » a le sens de situation tendue entre deux groupes, deux personnes, deux États dans un document d'intérêt générale socio-politique, mais dans un document technique l'unité lexicale « tension » désigne une grandeur caractérisant le mouvement de charges électriques et constituera en même temps un élément de termes composés comme tension d'alimentation, tension de sortie, tension de secteur.
Un logiciel de concordance permet de calculer la fréquence d'occurence dans un document spécialisé par rapport à un ou plusieurs documents en langue générale.



Logiciels d'extraction ou de reconnaissance terminologique
Liens de logiciels en ligne :
Labs Translated Net 
WebCorp



Logiciels et suites :
TRADOS Multiterm extract

Wordfast

0 commentaires:

About This Blog

Terminologie du blogueur

Blog : contraction des mots web et log. Il s’agit tout simplement d’un site sur lequel du contenu est publié et affiché chronologiquement. Un peu comme un journal. Synonyme(s): carnet Web n. m. / cybercarnet n. m. / Terme(s) à éviter: / blog NR / weblog NR / weblogue NR / journal Web NR / webjournal NR / joueb NR / jourel NR / bloc-notes NR / bloc NR
Blogueur
: Un blogueur est une personne qui publie du contenu sur un blog.

Blogosphère : univers des blogs, cela englobe les blog pro, perso etc…
Post ou article ou billet ou note : contenu publié sur un blog. Le blog est alors constitué d’articles classés par ordre chronologique avec en général le plus récent en haut de page.(6)
Commentaire : Cela permet aux lecteurs des blogs de commenter les articles de l’auteur ou d’ajouter de l’information. Les commentaires apparaissent ensuite en dessous du billet. Donc n’hésitez pas à commenter cet article.

Liste complète

  © Blogger templates The Professional Template by Ourblogtemplates.com 2008

Back to TOP