lundi 25 septembre 2017
lundi 12 octobre 2015
jeudi 18 décembre 2014
Terminologie du gaz de schiste
Corpus de textes ALL
Les textes sont protégés par un mot de passe Read more...
jeudi 13 novembre 2014
vendredi 17 octobre 2014
Exercices TAO
Exercice de TAO
15 oct : Automobile
Texte DE
Lexique DE-FR
15 nov : Cholestérol
Texte DE
Lexique DE-FR
jeudi 9 octobre 2014
Liste d'exclusion
Création d'une liste d'exclusion (non exhaustive) avec l'outil de concordance antconc
1.
Lancer la fonction « Wordlist »
exemple
sans liste d'exclusion :
exemple
avec liste d'exclusion :
2. Marche à suivre :
-
surligner avec la souris la colonne « Word » dans sa
totalité ou jusqu'au rang correspondant à 10 % du rang atteint
par la fréquence 3 (dans notre exemple, la fréquence 3 est atteinte
au rang 11563, donc la liste d'exclusion reprend les unités du rang
1 au rang 1150)
-
copier cette liste par le raccourci CTRL+C
-
coller le contenu du presse-papier dans un traitement de texte
capable de trier les lignes (MS WORD)
-
dans le traitement de texte, trier les lignes
-
supprimer les lignes contenant des termes (ou selon le raisonnement
inverse, ne conserver que les mots de la langue générale –
articles, prépositions, conjonctions, verbes auxiliaires conjugués,
etc.)
-
à ce stade, une série de décisions s'impose : Faut-il garder
les noms propres (marques, auteurs, lieux) ? Quel est le niveau
de spécialité que l'on veut atteindre (exclure des termes
techniques faisant partie de la langue générale, comme tension,
intensité, transformateur) ?
-
sauvegarder le document dans un format texte (code Western iso-8859
ou Unicode utf8)
3.
Activer une liste d'exclusion dans l'outil de concordance antconc
Choisir
l'onglet « TOOL PREFERENCES »
Point
« Word List »
Activer
le point « Use a stoplist listed below »
Ouvrir
le fichier d'exclusion « Open » sous cette rubrique
La
liste d'exclusion apparaît dans la fenêtre du bas
Terminer
l'activation en cliquant sur « Apply »
Read more...
Extraction terminologique
Extraction terminologique
Méthode statistique
Méthode linguistique
La méthode
statistique permet de repérer les termes selon des critères
quantitatifs (longueur, fréquence) dans un corpus textuel. Par
rapport à sa fréquence, le terme est une unité qui apparaît plus
fréquemment dans les textes spécialisés que dans les textes
généraux.
Cette définition
permet d'envisager plusieurs méthodes statistiques de repérage, ou
d'extraction, terminologique.
- le repérage des
unités lexicales les plus fréquentes dans un texte ou un corpus
Il faut préciser
qu'il s'agit d'unités lexicales appartenant aux langues de
spécialité et non à la langue générale. Dès lors, il faut
exclure les unités appartenant à la langue générale : c'est
le rôle de la liste d'exclusion
- le repérage des unités lexicales caractéristiques du genre textuel
Dans les documents spécialisés, l'auteur utilise non seulement une terminologie spécifique au domaine de spécialité, mais aussi des tournures syntaxiques propres à la rédaction de documents spécialisés. De plus, certains termes ont une forme faisant également partie de la langue générale, par exemple la forme lexicale « tension » a le sens de situation tendue entre deux groupes, deux personnes, deux États dans un document d'intérêt générale socio-politique, mais dans un document technique l'unité lexicale « tension » désigne une grandeur caractérisant le mouvement de charges électriques et constituera en même temps un élément de termes composés comme tension d'alimentation, tension de sortie, tension de secteur.
Un logiciel de concordance permet de calculer la fréquence d'occurence dans un document spécialisé par rapport à un ou plusieurs documents en langue générale.
Logiciels d'extraction ou de reconnaissance terminologique
Liens de logiciels en ligne :
Labs Translated Net
WebCorp
Logiciels et suites :
TRADOS Multiterm extract
Wordfast
Read more...
- le repérage des unités lexicales caractéristiques du genre textuel
Dans les documents spécialisés, l'auteur utilise non seulement une terminologie spécifique au domaine de spécialité, mais aussi des tournures syntaxiques propres à la rédaction de documents spécialisés. De plus, certains termes ont une forme faisant également partie de la langue générale, par exemple la forme lexicale « tension » a le sens de situation tendue entre deux groupes, deux personnes, deux États dans un document d'intérêt générale socio-politique, mais dans un document technique l'unité lexicale « tension » désigne une grandeur caractérisant le mouvement de charges électriques et constituera en même temps un élément de termes composés comme tension d'alimentation, tension de sortie, tension de secteur.
Un logiciel de concordance permet de calculer la fréquence d'occurence dans un document spécialisé par rapport à un ou plusieurs documents en langue générale.
Logiciels d'extraction ou de reconnaissance terminologique
Liens de logiciels en ligne :
Labs Translated Net
WebCorp
Logiciels et suites :
TRADOS Multiterm extract
Wordfast
vendredi 15 novembre 2013
Inscription à :
Articles (Atom)