Tamara Broderick a mis les pieds sur le campus du MIT pour la première fois lorsqu'elle était lycéenne, en tant que participante à la conférence inaugurale Programme de technologie pour les femmes. L'expérience universitaire d'été d'un mois donne aux jeunes femmes une introduction pratique à l'ingénierie et à l'informatique.
Quelle est la probabilité qu’elle revienne au MIT des années plus tard, cette fois en tant que membre du corps professoral ?
C'est une question à laquelle Broderick pourrait probablement répondre quantitativement en utilisant l'inférence bayésienne, une approche statistique de la probabilité qui tente de quantifier l'incertitude en mettant continuellement à jour ses hypothèses à mesure que de nouvelles données sont obtenues.
Dans son laboratoire du MIT, la nouvelle professeure agrégée au Département de génie électrique et d'informatique (EECS) utilise l'inférence bayésienne pour quantifier l'incertitude et mesurer la robustesse des techniques d'analyse des données.
« J'ai toujours voulu comprendre non seulement « Que savons-nous de l'analyse des données », mais aussi « Dans quelle mesure le savons-nous ? » », explique Broderick, qui est également membre du Laboratoire des systèmes d'information et de décision et l'Institut des données, des systèmes et de la société. « La réalité est que nous vivons dans un monde bruyant et que nous ne pouvons pas toujours obtenir exactement les données que nous souhaitons. Comment pouvons-nous apprendre des données tout en reconnaissant qu’il existe des limites et comment les gérer de manière appropriée ? »
D’une manière générale, son objectif est d’aider les gens à comprendre les limites des outils statistiques à leur disposition et, parfois, de travailler avec eux pour créer de meilleurs outils adaptés à une situation particulière.
Par exemple, son groupe a récemment collaboré avec des océanographes pour développer un modèle d'apprentissage automatique capable de rendre des prédictions plus précises sur les courants océaniques. Dans un autre projet, elle et d'autres ont travaillé avec des spécialistes des maladies dégénératives sur un outil qui aide les personnes gravement handicapées motrices utiliser l'interface utilisateur graphique d'un ordinateur en manipulant un seul commutateur.
Un fil conducteur tissé dans son travail est l’accent mis sur la collaboration.
« En travaillant dans le domaine de l'analyse de données, vous pouvez passer du temps dans le jardin de tout le monde, pour ainsi dire. On ne peut vraiment pas s'ennuyer, car on peut toujours en apprendre davantage sur un autre domaine et réfléchir à la manière dont nous pouvons y appliquer l'apprentissage automatique », dit-elle.
Traîner dans de nombreux « arrière-cours » universitaires est particulièrement attrayant pour Broderick, qui a eu du mal, même dès son plus jeune âge, à affiner ses intérêts.
Un état d'esprit mathématique
Ayant grandi dans une banlieue de Cleveland, Ohio, Broderick s'est intéressée aux mathématiques d'aussi loin qu'elle se souvienne. Elle se souvient avoir été fascinée par l’idée de ce qui se passerait si l’on continuait à ajouter un nombre à lui-même, en commençant par 1+1=2 puis 2+2=4.
« J'avais peut-être 5 ans, donc je ne savais pas ce qu'étaient les « puissances de deux » ou quoi que ce soit du genre. J'étais vraiment passionnée par les mathématiques », dit-elle.
Son père a reconnu son intérêt pour le sujet et l'a inscrite à un programme de Johns Hopkins appelé Center for Talented Youth, qui a donné à Broderick l'opportunité de suivre des cours d'été de trois semaines sur une gamme de sujets, de l'astronomie à la théorie des nombres en passant par l'informatique.
Plus tard, au lycée, elle a mené des recherches en astrophysique avec un postdoctorant à l’Université Case Western. À l'été 2002, elle a passé quatre semaines au MIT en tant que membre de la première promotion du Women's Technology Program.
Elle a particulièrement apprécié la liberté offerte par le programme et l'accent mis sur l'utilisation de l'intuition et de l'ingéniosité pour atteindre des objectifs de haut niveau. Par exemple, la cohorte a été chargée de construire un appareil avec des LEGO qu'elle pourrait utiliser pour biopsier un raisin suspendu dans du Jell-O.
Le programme lui a montré à quel point la créativité est impliquée dans l’ingénierie et l’informatique et a éveillé son intérêt pour la poursuite d’une carrière universitaire.
«Mais quand je suis entré à l'université à Princeton, je n'arrivais pas à me décider : les mathématiques, la physique, l'informatique, ils me semblaient tous super cool. Je voulais tout faire», dit-elle.
Elle a décidé de poursuivre des études de premier cycle en mathématiques, mais a suivi tous les cours de physique et d'informatique qu'elle pouvait intégrer à son emploi du temps.
Creuser l’analyse des données
Après avoir reçu une bourse Marshall, Broderick a passé deux ans à l'Université de Cambridge au Royaume-Uni, obtenant une maîtrise d'études avancées en mathématiques et une maîtrise de philosophie en physique.
Au Royaume-Uni, elle a suivi un certain nombre de cours de statistiques et d'analyse de données, notamment son premier cours sur l'analyse de données bayésiennes dans le domaine de l'apprentissage automatique.
Ce fut une expérience transformatrice, se souvient-elle.
«Pendant mon séjour au Royaume-Uni, j'ai réalisé que j'aimais vraiment résoudre des problèmes du monde réel qui importent aux gens, et l'inférence bayésienne était utilisée dans certains des problèmes les plus importants», dit-elle.
De retour aux États-Unis, Broderick s'est rendue à l'Université de Californie à Berkeley, où elle a rejoint le laboratoire du professeur Michael I. Jordan en tant qu'étudiante diplômée. Elle a obtenu un doctorat en statistiques avec une spécialisation en analyse bayésienne des données.
Elle a décidé de poursuivre une carrière universitaire et a été attirée par le MIT par la nature collaborative du département EECS et par la passion et la gentillesse de ses futurs collègues.
Ses premières impressions se sont avérées positives et Broderick affirme avoir trouvé une communauté au MIT qui l'aide à faire preuve de créativité et à explorer des problèmes difficiles et percutants avec des applications très diverses.
« J'ai eu la chance de travailler dans mon laboratoire avec un groupe vraiment formidable d'étudiants et de postdoctorants : des gens brillants et travailleurs dont le cœur est à la bonne place », dit-elle.
L'un des projets récents de son équipe implique une collaboration avec un économiste qui étudie l'utilisation du microcrédit, ou le prêt de petites sommes d'argent à des taux d'intérêt très bas, dans des zones pauvres.
L’objectif des programmes de microcrédit est de sortir les gens de la pauvreté. Les économistes mènent des essais contrôlés randomisés dans des villages d'une région qui reçoivent ou non du microcrédit. Ils souhaitent généraliser les résultats de l'étude, en prédisant le résultat attendu si l'on applique le microcrédit à d'autres villages en dehors de leur étude.
Mais Broderick et ses collaborateurs ont découvert que les résultats de certaines études sur le microcrédit peuvent être très fragiles. La suppression d'un ou de quelques points de données de l'ensemble de données peut complètement modifier les résultats. L’un des problèmes est que les chercheurs utilisent souvent des moyennes empiriques, dans lesquelles quelques points de données très élevés ou faibles peuvent fausser les résultats.
Grâce à l’apprentissage automatique, elle et ses collaborateurs ont développé une méthode permettant de déterminer combien de points de données doivent être supprimés pour modifier la conclusion substantielle de l’étude. Grâce à son outil, un scientifique peut constater à quel point les résultats sont fragiles.
« Parfois, la suppression d’une très petite fraction de données peut modifier les principaux résultats d’une analyse de données, et nous pouvons alors nous inquiéter de la mesure dans laquelle ces conclusions se généralisent à de nouveaux scénarios. Existe-t-il des moyens de signaler cela aux gens ? C’est à cela que nous tendons avec ce travail », explique-t-elle.
Parallèlement, elle continue de collaborer avec des chercheurs dans divers domaines, comme la génétique, pour comprendre les avantages et les inconvénients de différentes techniques d'apprentissage automatique et d'autres outils d'analyse de données.
Bonne route
L’exploration est ce qui motive Broderick en tant que chercheuse, et elle alimente également l’une de ses passions en dehors du laboratoire. Elle et son mari aiment collectionner les parcelles qu'ils gagnent en parcourant tous les sentiers d'un parc ou d'un réseau de sentiers.
«Je pense que mon passe-temps combine vraiment mes intérêts pour le plein air et les feuilles de calcul», dit-elle. « Avec ces zones de randonnée, vous devez tout explorer, puis vous découvrez des zones que vous ne verriez pas normalement. C’est aventureux, de cette façon.
Ils ont découvert des randonnées incroyables dont ils n'auraient jamais entendu parler, mais se sont également lancés dans plusieurs « randonnées totalement désastreuses », dit-elle. Mais chaque randonnée, qu'elle soit un joyau caché ou un désordre envahi par la végétation, offre ses propres récompenses.
Et tout comme dans ses recherches, la curiosité, l’ouverture d’esprit et la passion pour la résolution de problèmes ne l’ont jamais égarée.