ANNE GARCIA-FERNANDEZ

Ingénieuse de recherche CNRS

Fonctions

Membre d'ELAN au sein de Litt&Arts (UMR 5316), chargée des traitements et analyses des données, de la conception et du développement d’outils d’exploitation et de visualisation des données.

Responsabilités actuelles


Un parcours pluridisciplinaire : du TAL aux HumanitéS Numériques

Anne Garcia Fernandez est titulaire d'une thèse en Informatique obtenue à l'Université Paris-Sud Orsay. Ses travaux, pluridisciplinaires, se situent à la croisée des sciences humaines sociales et de l’informatique. Elle a travaillé plusieurs années dans le domaine du Traitement Automatique des Langues. Elle a contribué lors de son doctorat effectué au LIMSI, un laboratoire du CNRS situé à Orsay, aux recherches sur la génération de réponses en langue naturelle avec la particularité de travailler sur l'oral aussi bien que sur l'écrit. Elle a participé à différents projets en fouille de texte et extraction automatique d'information.
 
Au cours d'un premier post-doctorat au CEA, elle a étendu son champ de compétences à l'apprentissage automatique en mettant en œuvre des techniques de boosting pour des tâches de fouille d'opinion. Elle a travaillé en tant que post-doctorante au SeDyL, un laboratoire CNRS à Villejuif et a appliqué ses connaissances en fouille à des corpus de contacts de langues. C’est à ce moment que son intérêt pour une réelle collaboration pluridisciplinaire entre les chercheurs de terrain et la recherche en informatique est né.

Ingénieure de recherche au LAS (Laboratoire d’anthropologie sociale), elle a été responsable Humanités Numériques et co-responsable de l'équipe de recherche Traitement Informatique des Matériaux Ethnographiques (TIME). Elle y a initié plusieurs projets en Humanités Numériques et a participé notamment à l’ANR Kinsources, dont les deux objectifs principaux sont la mise en place d'une plate forme de publication et d'archivage de données de parentés, et la numérisation de sources écrites textuelles ou graphiques (données de terrain, extraites de monographies...).

Depuis 2012, Anne travaille au sein de laboratoires SHS y apportant ses compétences en informatique, TAL et Humanités Numériques. Elle a eu l'occasion de travailler avec des chercheurs et enseignants-chercheurs de différentes disciplines SHS (linguistes, anthropologues, historiens, démographes...) et sur des aspects liés au numérique variés (numérisation, structuration, diffusion, exploitation, juridique...). Son travail se centre sur la donnée scientifique, l'accompagnement des chercheurs notamment dans leur rapport aux sources (textuelles, d'auteur, mais aussi données de terrain...) et l'outillage des analyses qualitatives en SHS.

Disciplines enseignées

Enseignements et formations

  • (2018) Formatrice (et co-organisatrice) de la formation EDEEN 2018 (École D’été Édition Numérique et Humanités Numériques qui se tiendra du 28 mai au 2 juin 2018. https://edeen.sciencesconf.org/
  • (2018) Cours de structuration de corpus avec XML, outils d'annotation, L3 Sciences du langage, Université Grenoble Alpes.
  • (2015, 2017) Formatrice dans le cadre d'un action nationale de formation du CNRS (ANF)
  • (2016) Formation à la formation permanente de la DR2, CNRS
    • Initiation à l'utilisation d'un Mediawiki dans une unité de recherche
    • Anne Garcia Fernandez et Anne-Laure Ligozat
  • (2015) Encadrement d'un projet TAL niveau L3, au sein du cursus LI (Linguistique Informatique) de Université Paris Diderot (Paris 7)
    • Étiquetage automatique d'un corpus d'actes de mariage
    • Pascal Amsili, Christophe Prieur, Anne Garcia Fernandez
  • (2014 à 2017) Enseignement dans le cadre d'un séminaire doctoral de l'EHESS
    • Atelier d’initiation au traitement informatique de la parenté
    • Pietro Fornasetti, Anne Garcia Fernandez, Cyril Grange, Klaus Hamberger
  • (2013) Formation EHESS interne au LAS, UMR 7130
    • Lodel 0.9 pour modifier le site web du LAS
    • Anne Garcia Fernandez, Jérôme Lamarque

Thèmes de recherche

  • Humanités Numériques comme au croisement de toutes les Humanités et du Numérique
  • Traitement Automatique des Langues (TAL)
  • Traitement Informatique de la Parenté
  • Littérature orale et en particulier les mythes et les contes

Informations complémentaires

Principales publications

Conférence ou workshop international
  • 2014 Garcia-Fernandez, Anne, Ligozat, Anne-Laure and Vilnat, Anne, Construction and Annotation of a French Folkstale Corpus in LREC 2014.
  • 2014 Garcia-Fernandez, Anne, Ferret, Olivier, Dinarelli, Marco, Evaluation of Different Strategies for Domain Adaptation in Opinion Mining in LREC 2014.
  • 2011 Garcia-Fernandez, Anne, Ligozat, Anne-Laure, Dinarelli, Marco, Bernhard, Delphine, When was it written? Automatically Determining Publication Dates in the 18th edition of the International Symposium on String Processing and Information Retrieval (SPIRE).
  • 2010 Garcia-Fernandez, Anne, Vasilescu, Ioana, Rosset, Sophie, Euh as Cue for Speaker Confidence and Word Searching in Human Spoken Answers in French in The 5th Workshop on Disfluency in Spontaneous Speech and the 2nd International Symposium on Linguistic Patterns in Spontaneous Speech Joined Workshop (DiSS-LPSS Joint Workshop 2010), InterSpeech 2010.
  • 2010 Garcia-Fernandez, Anne, Rosset, Sophie et Vilnat, Anne, MACAQ: A Multi Annotated Corpus to study how we adapt Answers to various Questions in The seventh international conference on Language Resources and Evaluation (LREC).
Conférence ou workshop international francophone
  • 2013 Anne-Laure Ligozat, Cyril Grouin, Anne Garcia-Fernandez et Delphine Bernhard. Approches à base de fréquences pour la simplification lexicale, in TALN 2013.
  • 2012 Garcia-Fernandez, Anne et Ferret, Oliver, Étude de différentes stratégies d'adaptation à un nouveau domaine en fouille d'opinion in TALN 2012.
  • 2011 Garcia-Fernandez, Anne, Ligozat, Anne-Laure, Dinarelli, Marco, Bernhard, Delphine, Méthodes pour l’archéologie linguistique : datation par combinaison d’indices temporels. Atelier DEFT 2011, Actes de TALN 2011.
Conférence ou workshop national
  • 2011 Garcia-Fernandez, Anne, Ligozat, Anne-Laure, Bernhard, Delphine. (2011) Présent, hypothétique, conditionnel ? Annotation du statut des problèmes médicaux dans des comptes-rendus cliniques en français , in Actes de SIIM 2011.
Thèse
  • Garcia-Fernandez, Anne (2010). Génération de réponses en langue naturelle orales et écrites pour les systèmes de question-réponse en domaine ouvert Thèse de doctorat, Université Paris Sud 11 Orsay.
Chapitre d'ouvrage
  • Garcia-Fernandez, Anne, Ligozat, Anne-Laure, Dinarelli, Marco, Bernhard, Delphine (2011) Méthodes pour l’archéologie linguistique : datation par combinaison d’indices temporels. in Le Défi fouille de textes.