Je crois que l'une des plus grandes joies de la vie est de découvrir et de construire de nouvelles choses, et de contribuer, même modestement, au débat scientifique.
Les actions du Seigneur sont extraordinaires, tous ceux qui les aiment réfléchissent sur elles ...
Il veut qu’on se souvienne de ses actions étonnantes. Le Seigneur a pitié, il aime avec tendresse.
(Psaume 111:2,4, PDV2017)

Intérêts de recherche

Je m’intéresse à l’interprétabilité de l’apprentissage machine, à la linguistique computationnelle et aux fondements théoriques de l’intelligence artificielle. Je suis particulièrement intéressé par des questions telles que: Comment rendre les réseaux neuronaux plus transparents ? et Comment la structure linguistique et la sémantique interagissent-elles dans les modèles de traitement automatique du langage naturel (TALN) multilingues ?

Vous pouvez consulter un résumé de mes projets de recherche et de mes publications scientifiques sur mon ORCID iD profil ORCID.

Projets en cours

Interprétation des réseaux de neurones de régression avec des substituts linéaires

avril 2025–Aujourd’hui

Dans ce projet, j’évalue la fiabilité des substituts linéaires pour l’interprétation des réseaux de neurones. À l’aide d’une métrique appelée score lambda, je mesure la capacité des modèles linéaires à approximer les prédictions et les représentations des réseaux entraînés. Si les substituts atteignent souvent une forte corrélation, je montre que cela n’implique pas une approximation fidèle ; en fait, la variance inexpliquée restante peut correspondre à la logique de décision réelle du réseau. Cela suggère que les substituts linéaires simples peuvent être trompeurs, en particulier lorsque la structure non linéaire clé est concentrée dans des régions à faible volume de l’espace d’entrée.

Détection d’idiomes français grâce aux techniques de traduction automatique neuronale

février 2025–Aujourd’hui

Les expressions idiomatiques restent un défi majeur en traduction automatique neuronale (NMT), entraînant souvent des erreurs dans les systèmes statistiques et modernes de NMT. ​​Dans ce projet, j’adapte des techniques efficaces pour identifier les idiomes dans les corpus anglais et les applique aux données françaises. Ce travail, encore à ses débuts, constituera mon mémoire de fin d’études en français et en informatique.

Améliorer la sécurité énergétique grâce aux réseaux neuronaux et aux arbres de décision

janvier 2025–Aujourd’hui

La précarité énergétique est un réel problème aux États-Unis. Le gouvernement fédéral verse des fonds aux États pour lutter contre ce problème. Cependant, les moyens de mobiliser ces fonds sont multiples, ce qui entraîne une répartition inefficace. Nos travaux visent à simplifier cette allocation en intégrant les réseaux de neurones et les réseaux de neurones profonds aux modèles énergétiques des bâtiments urbains (UBEM). Les résultats de cette combinaison de modèles permettront aux décideurs politiques de visualiser les schémas de consommation énergétique, de comparer les stratégies d’allocation des ressources et de simuler l’impact de différentes approches d’atténuation. Ce projet en est à ses débuts.

En collaboration avec le professeur Jorge Silveyra (Lafayette College)

Projets à venir

FuncLearn: Un langage de programmation fonctionnel pour l’apprentissage machine

Statut: Conception préliminaire

L’apprentissage machine est utilisé dans de nombreuses disciplines, mais pour les personnes extérieures à l’informatique, travailler avec Python et TensorFlow peut paraître inutilement complexe. FuncLearn vise à fournir un langage fonctionnel simple, intuitif, proche de l’anglais, qui simplifie l’accès. Ce langage compilera du code Python basé sur TensorFlow, permettant aux utilisateurs d’importer des jeux de données, de créer des modèles de chaîne et d’entraîner des réseaux grâce à une syntaxe expressive et composable ; aucune expertise en apprentissage machine n’est requise.

Intérêts / Idées à long terme

Je m’intéresse également à l’accessibilité des langages de programmation, en particulier au potentiel des mots-clés localisés (par exemple, en utilisant la syntaxe native comme si au lieu de if) et à la refonte des structures syntaxiques pour les langages s’écrivant de droite à gauche. Bien que ce travail soit encore conceptuel, il reflète un intérêt plus large pour la conception inclusive des langages.