Mieux détecter les cancers grâce au machine learning

Imane Araf, doctorante de la 2e cohorte des 100PhDs for Africa © 2025 EPFL
Doctorante à l’Université Mohammed VI Polytechnique (Maroc), Imane Araf explore comment le machine learning peut aider à mieux diagnostiquer des maladies rares à partir de données médicales complexes. Ses travaux portent en particulier sur les cancers touchant les femmes, avec l’objectif de rendre les modèles d’IA plus justes et plus fiables. Elle nous parle ici de son parcours, de sa recherche et de ce qui la motive au quotidien.
Pourriez-vous vous présenter ?
Je m'appelle Imane Araf et je suis étudiante en troisième année de doctorat à la Faculté des sciences médicales (FMS) de l'UM6P. Avant de commencer mes études doctorales, j'ai obtenu un diplôme d'ingénieur en informatique et en intelligence artificielle, puis j'ai travaillé pendant quelques années comme ingénieure en intelligence artificielle au centre de R&D MAScIR, où j'ai acquis de solides bases pratiques avant de me tourner vers la recherche universitaire. Actuellement, mes travaux portent sur le développement de méthodes sensibles au coût pour les données médicales déséquilibrées, avec un accent particulier sur les cancers féminins, où la prédiction de résultats rares mais critiques constitue un défi majeur.
Comment avez-vous entendu parler du programme Excellence in Africa 100 PhDs ?
J'ai d'abord entendu parler du programme par des collègues, et en particulier par Amal, une doctorante de la première promotion, qui m'a fait part de son expérience très positive. J'ai ensuite fait quelques recherches en ligne et trouvé plusieurs ressources utiles. J'ai également trouvé des informations supplémentaires sur le programme dans la newsletter de l'UM6P.
Qu'est-ce qui vous a motivé à postuler ?
C'est la structure de co-supervision qui m'a d'abord attiré, car je savais que ma recherche bénéficierait d'une collaboration internationale. J'ai également apprécié le fait que le programme soit spécifiquement conçu pour renforcer les capacités de recherche en Afrique et favoriser des partenariats scientifiques à long terme qui répondent aux défis réels du continent.
Avez-vous trouvé le processus de candidature facile ?
Oui, le processus était clair, bien organisé et transparent. Il exigeait de la diligence et de la précision, ce qui est normal pour un programme aussi compétitif, mais les instructions étaient simples et la communication avec l'équipe s'est bien passée.
Pourriez-vous décrire votre projet ? Quelles sont vos questions de recherche ?
Mon projet porte sur l'apprentissage sensible au coût pour les données médicales déséquilibrées, avec un accent particulier sur les cancers féminins. Le principal défi réside dans le fait que, dans les ensembles de données médicales, les cas les plus critiques sont souvent les plus rares. Les modèles d'apprentissage automatique standard traitent toutes les erreurs de prédiction de la même manière, alors que sur le plan clinique, passer à côté d'un patient à haut risque a des répercussions bien plus graves que de signaler à tort un patient à faible risque.
Mes questions de recherche portent sur la manière de construire des modèles qui tiennent explicitement compte de ces différents coûts, de garantir leur bonne généralisation malgré le travail avec des données très déséquilibrées où les résultats positifs sont sous-représentés, et de s'assurer qu'ils restent fiables et cliniquement significatifs dans des contextes médicaux réels.
Pourriez-vous donner quelques exemples concrets d'application de vos recherches ?
Mes travaux peuvent contribuer à améliorer le dépistage précoce des cancers féminins, en particulier lorsqu'il s'agit de cas à un stade précoce qui sont rares et difficiles à identifier ; à réduire le nombre de faux négatifs, qui sont particulièrement préjudiciables dans le diagnostic du cancer ; et à soutenir la hiérarchisation clinique en identifiant plus précisément les patients à haut risque. Cela permet aux cliniciens d'ajuster les stratégies de surveillance ou d'intervention en fonction des besoins, ce qui est particulièrement utile dans les contextes où les ressources sont limitées et où il est essentiel d'identifier les personnes qui nécessitent une attention urgente. De plus, ces méthodes peuvent également s'étendre à d'autres maladies et défis sanitaires impliquant des résultats rares mais à haut risque.
Quel est le défi scientifique de votre sujet de recherche ?
Le principal défi réside dans le fait que les ensembles de données médicales sont très déséquilibrés ; la plupart des patients ne connaissent pas les pires résultats, mais ce sont précisément ces cas qui doivent être détectés. Les modèles doivent tenir compte des différents coûts cliniques sans surajustement à la classe minoritaire ni produire trop de fausses alertes. En oncologie, cela est encore compliqué par des données à haute dimension et des échantillons de taille limitée. Il est particulièrement difficile de trouver un équilibre entre la sensibilité aux cas rares, le contrôle des faux positifs et la garantie d'une bonne généralisation.
Pourriez-vous présenter brièvement votre directeur de thèse et votre co-directeur ?
Mon directeur de thèse est le professeur Ali Idri, qui possède une solide expertise en apprentissage automatique et en génie logiciel. Mon co-directeur de thèse, le professeur Pascal Frossard, apporte une expertise approfondie en traitement du signal et en apprentissage automatique, ce qui m'a aidé à aborder ma recherche sous différents angles techniques. Ensemble, ils offrent des perspectives complémentaires qui renforcent mon travail.
Quels sont les avantages d'une co-direction entre votre directeur de thèse africain et votre co-directeur de thèse de l'EPFL ?
La co-direction me permet de bénéficier des deux mondes : une compréhension approfondie des besoins médicaux locaux et du contexte des données, et l'expertise scientifique de haut niveau de l'EPFL. La supervision africaine garantit la pertinence et le caractère concret du travail, tandis que la co-direction européenne apporte des perspectives méthodologiques plus larges et une visibilité internationale. Cette combinaison me permet de produire des recherches qui sont à la fois significatives au niveau local et rigoureuses selon les normes internationales.
Comment la collaboration avec l'EPFL vous aidera-t-elle à relever le défi scientifique décrit dans la question précédente ?
L'EPFL offre un environnement exceptionnel, avec une expertise de pointe, des groupes de recherche à la pointe de l'apprentissage automatique et l'accès à de solides ressources scientifiques. Travailler avec le professeur Pascal a été particulièrement précieux ; il s'est montré disponible chaque fois que j'avais besoin de conseils, et nos discussions m'ont aidé à réfléchir plus attentivement aux aspects les plus techniques du projet. L'environnement du laboratoire, les séminaires et l'exposition au travail d'autres chercheurs ont également élargi ma perspective et m'ont aidé à structurer mes recherches de manière plus rigoureuse et innovante.
Pouvez-vous nous parler de votre séjour en Suisse ? Comment vous êtes-vous préparé à votre déménagement en Suisse ?
Le processus depuis le Maroc, en particulier la procédure de visa auprès de l'ambassade, s'est déroulé sans encombre et sans complication, ce qui m'a certainement aidé. Cependant, m'installer à Lausanne a été fastidieux. Le plus difficile a été de trouver un logement et de régler les formalités administratives, ce qui a demandé du temps et des efforts. Une fois ces étapes franchies, tout le reste s'est déroulé sans encombre. Les membres du laboratoire d'accueil, y compris le professeur Pascal, ont été très accueillants et gentils, ce qui a rendu mon séjour agréable et mémorable. Kelly et Carine, de l'EXAF, m'ont également beaucoup aidé et soutenu ; chaque fois que j'avais des questions ou besoin de conseils, je savais que je pouvais compter sur elles.
Avez-vous des anecdotes amusantes ou inattendues à nous raconter au sujet de votre séjour ?
Une petite anecdote : je n'ai jamais vraiment réussi à m'orienter correctement sur le campus de l'EPFL. Il y avait beaucoup trop de raccourcis à mémoriser, si bien que je finissais souvent par prendre le chemin le plus long ou par me tromper de bâtiment. Mais ce n'était pas si mal, car cela m'a permis de découvrir de nouvelles parties du campus en cours de route.
Que signifie pour vous l'excellence ?
Pour moi, l'excellence consiste à produire un travail à la fois rigoureux et significatif. Il s'agit de poser les bonnes questions, de rechercher des réponses avec honnêteté intellectuelle, même lorsque les résultats remettent en cause vos hypothèses initiales, et de maintenir des normes élevées et une intégrité tout au long du processus.