Formation ELAN des 10 et 11
janvier 2011
Dominique Boutet
Session du 10 janvier de 3 heures répartie en :
– 1h1/2 de formation (le Power Point), entrecoupée de courtes mises en
pratique
– 1h1/2 de manipulations (Travaux Pratiques).
Objectifs : Savoir manipuler les fonctionnalités d’ajustement des fenêtres
du logiciel, savoir se repérer et créer des tiers, des annotations, savoir
ajuster les séquences, naviguer entre les annotations et les tiers, savoir
enregistrez un fichier .eaf.
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Transcription : tendance à une linéarisation d’éléments perçus
dans le corpus> codification des juxtapositions.
Ex : Marie-Anne Pté(x) Marie-Thérèse(y) COMMUNIQUER(x-y)
versus Marie-Anne Pté(x) Marie-Thérèse(y) COMMUNIQUER(y-x)
La nécessité de lisibilité d’une transcription prend le pas sur
l’annotation. Elle s’oppose à la fois à la multilinéarité de l’annotation et
aux fonctions de recherche qu’offre le logiciel.
Suppose une révolution double :
1/annoter sans penser à la lecture (annoter n’est pas transcrire)
2/disperser au lieu de rassembler (éclater dans des catégories étanches les
unes des autres)> annoter n’est pas vouloir faire sens.
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Ainsi la transcription :
Marie-Anne Pté(x) Marie-Thérèse(y) COMMUNIQUER(x-y)
annotée peut devenir sur 5 lignes :
ENTITES Marie-Anne Marie-Thérèse
POINTAGE Pté
SST COMMUNIQUER
POSITION ( x) ( y )
MVT ( y – x )
La lisibilité est mauvaise, le sens n’apparaît pas clairement. Mais, je
peux savoir quand un pointage suit une entité et quand il la précède, par
ex.
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Transcription : tendance à une linéarisation d’éléments perçus
dans le corpus> codification des juxtapositions.
Ex : Marie-Anne Pté(x) Marie-Thérèse(y) COMMUNIQUER(x-y)
versus Marie-Anne Pté(x) Marie-Thérèse(y) COMMUNIQUER(y-x)
La nécessité de lisibilité d’une transcription prend le pas sur
l’annotation. Elle s’oppose à la fois à la multilinéarité de l’annotation et
aux fonctions de recherche qu’offre le logiciel.
Suppose une révolution double :
1/annoter sans penser à la lecture (annoter n’est pas transcrire)
2/disperser au lieu de rassembler (éclater dans des catégories étanches les
unes des autres)> annoter n’est pas vouloir faire sens.
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Annoter suppose donc d’établir
– des catégories (ligne=tier ou acteur),
– le cas échéant des hiérarchies entre des lignes (POSITION et MVT
subordonnée à ENTITES et SST),
– des relations entre la ligne et le temps (SST est directement liée au
temps, POINTAGE aussi..) par contre POSITION et MVT peuvent
ne pas l’être directement.
– et peut-être un vocabulaire stable pour certaines tiers (x, y, z…pour
la POSITION).
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Annoter relève d’un pari fort non seulement sur ce qu’on note (ce
n’est pas un transcodage comme la transcription), mais en plus
sur la manière de le faire (multi-linéarisation [plurielles
+différences entre lignes], catégorisation, hiérarchisation, typage
des relations, vocabulaire contrôlé). Le modèle (template) doit
donc être pensé et testé. Un même template est ré-applicable.
Excel n’offre pas une multi-linéarisation, seulement une pluri-
linéarité.
Annoter permet de sélectionner, filtrer ou fusionner des annotations
selon les lignes par exemple. On peut donc créer des nouvelles
données à partir de données de base. Ex : « Marie-Anne +Pté
+x » = « Marie-Thérèse + y » = SN
Annoter permet d’interroger des données selon plusieurs critères.
Les requêtes peuvent être sauvegardées et appliquées à d’autres
fichiers.
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
–
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Où télécharger ELAN : http://www.lat-mpi.eu/tools/elan/download
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »
Annotation, Transcription
ELAN : logiciel multilinéaire d’annotation
multimodale.
Où trouver une documentation(en anglais) :
http://www.mpi.nl/corpus/manuals/manual-elan.pdf
Que fait ELAN : Alignement temporel d’une vidéo et audio avec des
balises (séquences) qu’on peut étiqueter (annotations). L’alignement
peut se faire entre les tiers et donc entre des annotations. Ceci
permet entre autres une synchronisation.
Le langage de balisage utilisé par ELAN repose sur un standard
(XML) tel qu’on peut importer/exporter des alignements faits par
d’autres logiciels (CLAN, PRAAT, ANVIL, Toolbox…).
DB Dominique Boutet, UMR 7023, SFL, CNRS, Paris 8 « Langues des signes et gestualité »