Finaliste Prix EPFL de doctorats 2019 – Amit Gupta

© 2019 EPFL - A. Gupta

© 2019 EPFL - A. Gupta

Mention spéciale du jury à Amit Gupta pour sa thèse “Automated Taxonomy Induction and its Applications”

Thèse EPFL n°8160 (2017)

Directeur de thèse : Prof. K. Aberer

La représentation des connaissances sous forme de taxonomies s’est avérée bénéfique pour un ensemble de tâches du TALN.
Nous nous concentrons sur la construction automatique de taxonomies dans différents contextes. Dans un premier temps, nous nous penchons sur la construction de taxonomies à partir de Wikipédia. Nous introduisons un nouvel ensemble d’heuristiques visant à construire une taxonomie à grande échelle à partir du réseau de Wikipédia en anglais.
Par la suite, nous proposons une approche novatrice, qui exploite les liens interlangues de Wikipédia pour construire des taxonomies dans d’autres langues. Comparativement à l’état de l’art, notre approche est plus simple, plus systématique, et produit des taxonomies beaucoup plus précises sur diverses mesures d’évaluation au niveau des liens et des séquences. Dans la deuxième partie, nous nous concentrons sur la tâche de construction de taxonomies à partir de textes non structurés. Contrairement à toutes les approches précédentes, qui extraient des liens hyperonymiques singuliers pour les termes, nous utilisons un nouveau cadre probabiliste pour trouver de longues sous-séquences d’hyperonymes. Au travers d’expériences, nous démontrons que notre méthode surpasse les approches de construction automatique de taxonomies dans quatre langues.
En résumé, cette thèse propose de nouvelles approches pour la construction automatique de taxonomies. Il améliore l’état de l’art dans une variété de contextes différents. Elle permet également d’assouplir un bon nombre des hypothèses simplificatrices qui ont limité l’applicabilité des approches antérieures.



Images à télécharger

© 2019 A. Gupta
© 2019 A. Gupta

Partager sur