cours / présentation

02a - Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole (taln2015)

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole Laurent Besacier, Benjamin Lecouteux et Luong Ngoc Quang Résumé : Les mesures de confiance au niveau mot (Word Confidence Estimation – WCE) pou...

Date de création :

23.06.2015

Présentation

Informations pratiques

Langue du document : Français
Type : cours / présentation
Niveau : enseignement supérieur
Durée d'exécution : 27 minutes 16 secondes
Contenu : vidéo
Document : video/mp4
Poids : 118.07 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource

Résumé

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Utilisation de mesures de confiance pour améliorer le décodage en traduction de parole Laurent Besacier, Benjamin Lecouteux et Luong Ngoc Quang Résumé : Les mesures de confiance au niveau mot (Word Confidence Estimation – WCE) pour la traduction auto- matique (TA) ou pour la reconnaissance automatique de la parole (RAP) attribuent un score de confiance à chaque mot dans une hypothèse de transcription ou de traduction. Dans le passé, l’estimation de ces mesures a le plus souvent été traitée séparément dans des contextes RAP ou TA. Nous proposons ici une estimation conjointe de la confiance associée à un mot dans une hypothèse de traduction automatique de la parole (TAP). Cette estimation fait appel à des paramètres issus aussi bien des systèmes de transcription de la parole (RAP) que des systèmes de traduction automatique (TA). En plus de la construction de ces estimateurs de confiance robustes pour la TAP, nous utilisons les informations de confiance pour re-décoder nos graphes d’hypothèses de traduction. Les expérimentations réalisées montrent que l’utilisation de ces mesures de confiance au cours d’une seconde passe de décodage permettent d’obtenir une amélioration significative des performances de traduction (évaluées avec la métrique BLEU – gains de deux points par rapport à notre système de traduc- tion de parole de référence). Ces expériences sont faites pour une tâche de TAP (français-anglais) pour laquelle un corpus a été spécialement conçu (ce corpus, mis à la disposition de la communauté TALN, est aussi décrit en détail dans l’article).

"Domaine(s)" et indice(s) Dewey

  • Traduction automatique (418.02)
  • Informatique appliquée à la linguistique (410.285)

Domaine(s)

  • Langues
  • Linguistique

Document(s) annexe(s)

Fiche technique

Identifiant de la fiche : 18177
Identifiant OAI-PMH : oai:canal-u.fr:18177
Schéma de la métadonnée : oai:uved:Cemagref-Marine-Protected-Areas
Entrepôt d'origine : Canal-U

Voir aussi

Canal-U
Canal-U
23.06.2015
Description : Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Multi-alignement vs bi-alignement : à plusieurs, c’est mieux ! Olivier Kraif Résumé : Dans cet article, nous proposons une méthode originale destinée à effectuer l’alignement d’un corpus multi-parallèle, i.e. comportant plus ...
  • traduction
  • traitement automatique du langage naturel
  • taln2015
Canal-U
Canal-U
23.06.2015
Description : Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Traduction Apprentissage discriminant des modèles continus de traduction Quoc-Khanh Do, Alexandre Allauzen et François Yvon Résumé : Alors que les réseaux neuronaux occupent une place de plus en plus importante dans le traitement automatique ...
  • traduction
  • traitement automatique du langage naturel
  • taln2015