6 nov. 2024
🏆 Thibault Clérice a remporté le Prix Science Ouverte de la Thèse 2024
Thibault Clérice a remporté le Prix Science Ouverte de la Thèse 2024 pour sa thèse de doctorat sur la détection des isotopies dans les textes latins et la production de corpus et d'outils ouverts, qu'il a réalisée à l'Université Jean Moulin avant de rejoindre ALMAnaCH.
1 nov. 2024
🤝 Gabrielle Le Bellier rejoint ALMAnaCH en tant que doctorant
Gabrielle travaillera sur la génération contrôlée pour l'atténuation des biais et la prise en compte des différences culturelles dans les modèles de langue conversationnels.
1 nov. 2024
🤝 Célia Nouri rejoint ALMAnaCH en tant que doctorant
Célia travaillera sur l'analyse automatique des conversations des réseaux sociaux.
1 oct. 2024
🤝 Panagiotis Tsolakis rejoint ALMAnaCH en tant qu'ingénieur de recherche
Panagiotis travaillera sur l'extraction de ressources et le développement de l'infrastructure de traduction dans le cadre du projet MaTOS.
1 oct. 2024
🤝 Oriane Nédey démarre une thèse au sein d'ALMAnaCH
Oriane travaillera sur la traduction automatique en scénario peu doté impliquant des continuums dialectaux, en se concentrant sur certaines langues de France (notamment l'occitan, le picard, l'alsacien), dans le cadre du projet COLaF.
1 oct. 2024
🤝 Aina Gari Soler rejoint ALMAnaCH en tant que post-doctorante
Aina travaillera sur la dynamique du sens des mots dans le dialogue : comment les locuteurs comprennent, négocient et adaptent leur usage des mots dans l'interaction.
1 oct. 2024
🤝 Yanzhu Guo rejoint ALMAnaCH pour son dernier semestre de thèse
Yanzhu travaillera sur l'évaluation automatique des énoncés générés dans les conversations.
18 sept. 2024
🎓 Soutenance d'HDR de Djamé Seddah
Djamé a soutenu son HDR (Habilitation à diriger les recherches) intitulé "From French Statistical Parsing to Low-Resource
Language Modeling: a Research Journey".
2 sept. 2024
🤝 Marine Carpuat nous rejoint ALMAnaCH cette année.
Marine est en congé sabbatique de l'University de Maryland et elle restera avec nous jusqu'à la fin de l'année académique.
1 sept. 2024
🤝 Thibault Clérice est maintenant membre permanent de l'équipe
Les directions de recherche de Thibault Humanités numériques, les humanités computationnelles et le traitement automatique des langues pour les langues anciennes
1 août 2024
🤝 Djamé Seddah est désormais chargé de recherches Inria
Djamé, qui était précédemment Maître de conférences à Sorbonne Université en détachement à Inria au sein d'ALMAnaCH, est désormais chargé de recherches Inria au sein de l'équipe.
5 juil. 2024
🎓 Soutenance de thèse de Chadi Helwe
Chadi a soutenu sa thèse dirigée par Fabian Suchanek et Chloé Clavel sur l'évaluation et l'amélioration des capacités de raisonnement des modèles de langue.
1 juil. 2024
Le centre Inria de Paris a déménagé !
L'équipe se trouvent maintenant dans les nouveaux bureaux d'Inria Paris à 48 rue Barrault dans le 13è arrondissement.
24 juin 2024
🏆 Prix ILLC du meilleur article étudiant à LREC-COLING 2024.
Niyati Bafna, Cristina España-Bonet, Josef van Genabith, Benoît Sagot et Rachel Bawden ont reçu le prix pour leur article intitulé « When Your Cousin Has the Right Connections: Unsupervised Bilingual Lexicon Induction for Related Data-Imbalanced Languages ».
1 mai 2024
🤝 Malik Marmonier rejoint ALMAnaCH en tant qu'ingénieur de recherche
Malik travaillera sur la traduction automatique avec des grands modèles de langues pour les scénarios peu dotés et pour les langues non vues dans le contexte du projet ANR TraLaLaM.
9 avr. 2024
🎓 Soutenance de thèse de Tú Anh Nguyễn
Tú Anh a soutenu sa thèse dirigée par Benoît Sagot et Emmanuel Dupoux (META) sur les modèles de langue pour la parole appris à partir du signal audio.
14 mars 2024
🎓 Soutenance de thèse de Paul-Ambroise Duquenne
Paul-Ambroise a soutenu sa thèse dirigée par Benoît Sagot et Holger Schwenk (META) sur des représentations vectorielles de phrases pour le traitement massivement multilingue du texte et de la parole.
26 févr. 2024
🤝 Pierre Chambon rejoint ALMAnaCH en tant que doctorant
La thèse CIFRE de Pierre, encadrée par Benoît Sagot en collaboration avec META (Gabriel Synnaeve and Baptiste Rozière) sera consacrée à la génération de code à l'aide de grands modèles de langue.
1 janv. 2024
🤝 Sinem Demirkan rejoint ALMAnaCH en tant qu'ingénieure de recherche
Sinem travaillera sous la direction de Justine Cassell sur l'hyperscanning avec des paires d'enfants pour mieux comprendre les aspects neurologiques de la connivence.
1 janv. 2024
🤝 Hao Wang rejoint ALMAnaCH en tant qu'ingénieur de recherche
Hao travaillera sous la supervision de Biswesh Mohapatra sur le benchmarking des LLMs en matière de grounding conversationnel.
1 janv. 2024
🤝 Anh Ha Ngo rejoint ALMAnaCH en tant que doctorante
Anh travaillera sous la direction de Chloé Clavel et Catherine Pelachaud (ISIR) sur les modèles multimodaux, la réparation de conversation et l'interaction humain-agent.
15 déc. 2023
🎓 Soutenance de thèse de Alafate Abulimiti
Alafate a soutenu sa thèse, encadré par Justine Cassell et Chloé Clavel sur le rôle des stratégies socio-conversationnelles dans les dialogues orientés-tâche dans le cas des interactions de tutorat entre pairs : une mise en lumière des discussions hors tâche et des « hedges ».
1 déc. 2023
🤝 Oriane Nédey rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sous la direction de Thibault Clérice, Rachel Bawden et Benoît Sagot sur la collecte de données et modèles de traduction pour une langue régionale de France.
1 déc. 2023
🤝 Cecilia Graiff rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur la désambiguïsation des entités nommées pour les Archives Nationales dans le contexte du projet NER4Archives, encadrée par Laurent Romary.
30 nov. 2023
🏆 Benoît Sagot est titulaire de la chaire annuelle Informatique et sciences numériques au Collège de France
Sa leçon inaugurale se tiendra le 30 novembre à 18h, suivi de 8 cours ouverts au public accompagné chacun d'un séminaire du domaine.
29 nov. 2023
🏆 Thibault Clérice et Alix Chagué ont gagné le prix Jeunes Chercheurs Science Ouverte des Données de la Recherche
HTR-United est un catalogue de metadonnées pour les données de transcription et de segmentation.
1 nov. 2023
🤝 Justine Cassell et son équipe de recherche, Articulabo, rejoignent ALMAnaCH
Ses recherches portent sur l'interaction human-machine, les systèmes de dialogue, et les chatbots incarnés.
1 nov. 2023
🤝 Rasul Dent rejoint ALMAnaCH en tant que doctorant.
Ses recherches porteront sur l'identification de la langue à grande échelle (nombreuses langues, données massives, distinction entre variétés proches) avec un accent sur les langues de France et les créoles à base française.
1 nov. 2023
🤝 Armel Zebaze rejoint ALMAnaCH en tant que doctorant.
Ses recherches porteront sur l'utilisation de l'analogie pour le traitement automatique des langues multilingue.
1 nov. 2023
🤝 Christelle Rosello rejoint ALMAnaCH en tant qu'assistante administrative, prenant la suite de Meriem Guemair
Nous nous rejouissons de travailler avec Christelle et remercions Meriem très chaleureusement pour ces 5 années que nous avons passées ensemble.
1 nov. 2023
🤝 Marius Le Chapelier rejoint ALMAnaCH en tant qu'ingénieur de recherche
Il travaillera au développement de SARA (Socially Aware Robot Assistant), un système de dialogue incarné qui sera capable de créer du lien social avec ses utilisateurs de manière à améliorer ses performances.
19 oct. 2023
🎓 Soutenance de thèse de Lionel Tadonfouet Tadjou
Lionel a soutenu sa thèse, dirigée par Laurent Romary et Éric de la Clergerie sur la constitution de fils de discussion cohérents à partir de conversations issues d'outils professionnels de communication et de collaboration.
3 oct. 2023
🎓 Soutenance de thèse de José Carlos Rosales Núñez
José a soutenu sa thèse, dirigée par Guillaume Wisniewski et Djamé Seddah sur la traduction automatique de contenus générés par l’utilisateur: une évaluation des systèmes de traduction neuronaux dans des conditions zero-shot.
1 oct. 2023
🤝 Nicolas Dahan rejoint ALMAnaCH en tant que doctorant.
Il travaillera sous la direction de Rachel Bawden et François Yvon (CNRS) sur l'évaluation de la traduction automatique pour les documents scientifiques dans le cadre du projet ANR MATOS.
1 oct. 2023
🤝 Ziqian Peng rejoint ALMAnaCH en tant que doctorante (recrutée au CNRS).
Elle travaillera sous la direction de François Yvon (CNRS) et Rachel Bawden sur la traduction automatique pour les documents scientifiques dans le cadre du projet ANR MATOS.
1 oct. 2023
🤝 Juliette Janès rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sous la direction de Thibault Clérice et Benoît Sagot sur la récupération, encodage, maintenance et publication des données textuelles sur le français et les autres langues de France produites dans le cadre du DEFI COLaF.
1 oct. 2023
🤝 Sarah Bénière rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur l'analyse automatique des catalogues de ventes numerisés dans le cadre du projet DataCatalogue avec Hugo Scheithauer et sous la direction de Laurent Romary.
1 oct. 2023
🤝 Samuel Scalbert rejoint ALMAnaCH en tant qu'ingénieur de recherche
Il travaillera sur le repérage des softwares dans les articles de HAL avec GROBID et Softcite dans le cadre du projet GrapOS.
1 oct. 2023
🤝 Chloé Clavel rejoint ALMAnaCH en tant que Directrice de Recherches
Ses recherches porteront sur les modèles neuronaux permettant d'analyser et de générer des comportements socio-émotionnels dans les interactions, dans le but de rendre ces modèles plus transparents et contrôlables.
26 sept. 2023
🎓 Soutenance de thèse de Robin Algayres
Robin Algayres a soutenu sa thèse, dirigée par Emmanuel Dupoux et Benoît Sagot sur la découverte non supervisée de mots à partir de la parole.
19 sept. 2023
🏆 Lydia Nishimwe a gagné le prix du meilleur papier à RECITAL 2023
Son article est sur la normalisation lexicale de contenus générés par les utilisateurs sur les réseaux sociaux.
1 août 2023
🤝 Seth Aycock rejoint ALMAnaCH en tant qu'ingénieure de recherche
Il travaillera sous la direction de Rachel Bawden sur l'adaptation de domaine pour la traduction neuronale dans le contexte du projet DadaNMT.
1 mai 2023
🤝 Thibault Clérice rejoint l'équipe ALMAnaCH comme un chercheur SRP (starting research position)
Thibault Clérice travaillera sur la collecte et le développement de ressources textuelles pour le français dans toute sa diversité (en France et dans le monde) et pour les langues de France dans le cadre du Défi COLaF (Corpus et Outils pour les Langues de France).
17 nov. 2022
🎓 Soutenance de thèse de Benjamin Muller
Benjamin Muller a soutenu sa thèse, dirigée par Djamé Seddah et Benoît Sagot, sur le traitement de la variation et de la diversité linguistiques dans les modèles de langue neuronaux, avec un accent sur les langues à faibles ressources.
1 nov. 2022
🤝 Francis Kulumba rejoint l'équipe ALMAnaCH comme doctorant
Francis Kulumba travaillera sur les méthodes de désambiguïsation d'entités (auteurs, affiliations etc.) dans les publications scientifiques.
3 oct. 2022
🤝 Niyati Bafna rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur les modèles de langues inspirés par la linguistique pour les langues proches, encadrée par Benoît Sagot, Rachel Bawden et (du DFK) Cristina España-Bonet et Josef van Genabith.
26 sept. 2022
🎓 Soutenance de thèse de Clémentine Fourrier
Clémentine Fourrier a soutenu sa thèse, dirigée par Benoît Sagot, Rachel Bawden et Laurent Romary sur des approches neuronales pour la reconstruction de mots historiques.
27 juil. 2022
🎓 Soutenance de thèse de Pedro Ortiz Suarez
Pedro Ortiz Suarez a soutenu sa thèse, dirigée par Laurent Romary et Benoît Sagot sur une approche basée sur les données pour le traitement automatique du langage naturel en français contemporain et historique.
31 mars 2022
🤝 Anna Chepaikina rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur la génération de commentaires œnologiques, encadrée par Benoît Sagot et en collaboration avec la startup Winespace.
9 mars 2022
Nous sommes très heureux d'annoncer la publication d'une nouvelle version de notre très gros corpus multilingue OSCAR, la version 22.02
Principaux changements : corpus orienté-documents avec des annotations sur lesquelles vous pouvez filtrer, identification de la langue au niveau du document, un nouveau sous-corpus multilingue pour les documents multilingues, et plus encore !
1 mars 2022
🤝 Wissam Antoun rejoint ALMAnaCH en tant qu'ingénieur de recherche
Il travaillera sous la direction de Djamé Seddah et Benoît Sagot sur les modèles de langage pour les langues présentant une variabilité élevée, en particulier sur les dialectes arabes que l'on trouve dans le contenu généré par les utilisateurs sur les médias sociaux.
1 févr. 2022
🤝 Jesujoba Alabi rejoint ALMAnaCH en tant qu'ingénieur de recherche
Il travaillera sous la direction de Rachel Bawden sur l'adaptation de domaine pour la traduction neuronale dans le contexte du projet DadaNMT.
17 janv. 2022
🤝 Rua Ismail a rejoint ALMAnaCH en tant qu'ingénieur de recherche
Elle travaillera sous la direction de Benoît Sagot sur le corpus OSCAR, et notamment sur l'identification de la langue d'un document, et sur la description de deux langues nubiennes.
1 déc. 2021
🤝 Nathan Godey rejoint ALMAnaCH en tant que doctorant
Il travaillera sous la direction de Benoît Sagot et d'Éric de la Clergerie sur l'amélioration des modèles de langue, notamment par l'utilisation de techniques relevant du transport optimal.
27 oct. 2021
🎓 Soutenance de thèse de Louis Martin
Louis Martin a soutenu sa thèse, dirigée par Benoît Sagot, Éric de La Clergerie, Antoine Bordes (FAIR Paris), sur la simplification de phrases au moyen de méthodes contrôlables et non supervisées.
1 oct. 2021
🤝 Lydia Nishimwe a rejoint ALMAnaCH en tant que doctorante
Dans le cadre de la chaire PRAIRIE de Rachel Bawden, elle travaillera sur les modèles de traduction neuronaux robustes pour les contenus générés par les utilisateurs.
1 oct. 2021
🤝 You Zuo a rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur la classification fine de brevets en collaboration avec l'INPI.
1 oct. 2021
🤝 Roman Castagné est désormais un doctorant ALMAnaCH.
Il travaillera sous la direction de Benoît Sagot et d'Éric de la Clergerie sur l'amélioration des modèles de langue par une meilleure compréhension de ce qu'ils apprennent et de quand ils l'apprennent.
20 sept. 2021
🤝 Camille Rey a rejoint ALMAnaCH en tant que stagiaire de Master 2
Elle étudiera les erreurs produites par les systèmes de traduction automatique neuronale.
15 mai 2021
🤝 Paul-Ambroise Duquenne a rejoint ALMAnaCH en tant que doctorant
Il travaillera sur les espaces de représentation des phrases de type LASER sous la double direction de Benoît Sagot, pour ALMAnaCH, et Holger Schwenk, pour FAIR (le laboratoire de recherche en IA de Facebook à Paris) dans le cadre d'une thèse CIFRE.
4 mai 2021
Nous sommes heureux d'annoncer la publication de PAGnol, un nouveau membre de notre famille de modèles de langue
PAGnol est un nouveau modèle de langue génératif libre pour le français, dont l'architecture est similaire à celle de GPT-3. Il est le résultat d'une collaboration avec l'entreprise LightOn.
3 mai 2021
🤝 Matthieu Futeral-Peter a rejoint ALMAnaCH en tant que stagiaire de Master 2
Son travail est en collaboration avec l'équipe-projet Willow à Inria, le but étant de construire de meilleurs word embeddings à la fois multilingues et multimodaux.
19 avr. 2021
🤝 Tú Anh Nguyễn a rejoint ALMAnacH en tant que doctorant
Il travaillera sur l'apprentissage non supervisé de représentations linguistiques à partir de données de parole (audio) sous la double direction de Benoît Sagot, pour ALMAnaCH, et Emmanuel Dupoux, pour FAIR (le laboratoire de recherche en IA de Facebook à Paris) dans le cadre d'une thèse CIFRE.
5 avr. 2021
🤝 Hugo Scheithauer a rejoint ALMAnaCH en tant que stagiaire de Master 2
Il travaillera sur l'ajout de technologies NER dans l'environnement open-source eScriptorium pour la transcription automatique, en s'appuyant le cas d'usage fourni par le projet LECTAUREP.
1 avr. 2021
🤝 Syrielle Montariol a rejoint ALMAnaCH en tant que post-doc
Elle travaillera au sein du projet H2020 CounteR sous la direction principale de Djamé Seddah sur la détection des changements sémantiques dans les publications sur les réseaux sociaux au niveau individuel, afin de contribuer à la détection et à l'analyse de différents types de processus de radicalisation.
1 avr. 2021
🤝 Thomas Wang a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, il va travailler sur de nouvelles architectures pour les modèles de langue neuronaux qui nécessitent moins de puissance de calcul, moins de mémoire et/ou moins de données pour leur entraînement. Il travaillera notamment sur la réduction de l'impact computationnel et mémoire des mécanismes d'attention, en particulier lorsque l'on veut traiter de longues séquences en une seule fois.
1 avr. 2021
🤝 Roman Castagné a rejoint ALMAnaCH en tant que stagiaire de Master 2
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, il va travailler sur des modèles de langue neuronaux multi-niveaux dans le but de diminuer l'impact du bruit dans les données d'entrée sur les performances de tels modèles.
1 avr. 2021
🤝 Julien Abadji a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, il va travailler à améliorer quantitativement (taille, nombre de langues) et qualitativement (précision de la classification par langues, filtrage des contenus offensants) de notre très grand corpus multilingue OSCAR qui s'appuie sur Common Crawl. Il travaillera également sur la production de nouvelles versions d'OSCAR à intervalles réguliers.
8 mars 2021
🤝 Manon Ovide a rejoint ALMAnaCH en tant que stagiaire de Master 2
Elle travaillera sur la chaîne d’édition scientifique numérique mis en place pour le projet DAHN, et notamment sur la phase de publication, dans le respect des directives de la TEI.
11 févr. 2021
Conférence Cap'FALC
Le Centre Inria de Paris, l'Unapei et Facebook Artificial Intelligence Research présentent Cap'FALC, un projet dont le but est d'améliorer l'accessibilité de l'information aux personnes en situation de handicap intellectuel, par le développement d'un outil d'aide à la production de contenus en FALC (« Facile à Lire et à Comprendre »)
1 févr. 2021
🤝 Thibault Charmet a rejoint ALMAnaCH en tant qu'ingénieur d'études
Il travaillera en collaboration avec la Cour de Cassation sur l'aide à la détection de divergences, dans le cadre du Lab IA, initiative placée au sein de la DINUM (Direction Interministérielle du Numérique et des Systèmes d'Information et de communication, rattachée au Premier Ministre) pour aider les administrations publiques de l'État à bénéficier des avancées récentes en IA.
13 janv. 2021
Lancement du nouveau site web d'ALMAnaCH
19 nov. 2020
Article sur la collaboration entre ALMAnaCH et la start-up Winespace sur le site internet d'Inria
16 nov. 2020
📣 Benoît Sagot à « France is AI »
Benoît Sagot a participé à un panel avec François Yvon à la conférence « France is AI », le plus grand événement français en intelligence artificielle.
1 nov. 2020
🥂 Benoît Sagot été nommé "Directeur de Recherches"
1 nov. 2020
🤝 Rachel Bawden a rejoint ALMAnaCH en tant que Chargée de Recherches Inria
Elle travaille sur la traduction automatique et du TAL multilingue.
1 nov. 2020
🤝 Arij Riabi a rejoint ALMAnaCH en tant qu'ingénieure d'études
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, elle va travailler sur le TAL pour les langues peu dotées et non normalisées, notamment pour l'arabe dialectal d'Afrique du nord écrit en alphabet latin (Arabizi)
1 nov. 2020
🤝 Lucas Terriel a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre des projets EHRI, DAHN et NER4archives, il travaillera à l'interface entre TAL et humanités numériques sur les documents d'archives, et notamment sur la reconnaissance des entités nommées dans les instruments de recherche.
8 oct. 2020
🎓 Soutenance de thèse de Jack Bowers
Jack Bowers a soutenu sa thèse, dirigée par Laurent Romary, sur la documentation linguistique et les normes en humanités numériques, et plus précisément sur l'utilisation de la TEI pour la documentation du Mixtepec-Mixtec
1 oct. 2020
🎓 Soutenance de thèse de Mohamed Khemakhem
Mohamed Khemakhem a soutenu sa thèse, dirigée par Laurent Romary, sur des modèles lexicaux normalisés pour la structuration automatique de dictionnaires électroniques.
1 sept. 2020
🤝 Yves Tadjo a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre du projet DAHN, il développera des outils pour les humanités numériques appliquées aux documents d'archives.
15 juil. 2020
🎓 Soutenance de thèse de Loïc Grobol
Loïc Grobol a soutena sa thèse, dirigée par Isabelle Tellier†, Frédéric Landragin, Marco Dinarelli et Éric de la Clergerie, sur la résolution de coréférences pour le français.
25 mai 2020
Article sur l'initiative Cap'FALC sur le site internet d'Inria
Cap'FALC est une collaboration impliquant le FAIR (Facebook) et l'UNAPEI, visant le développement d'un algorithme de simplification de textes et d'un outil accessible facilitant la production de textes en FALC (« Facile à Lire et à Comprendre ») à destination des personnes souffrant de handicap mental
4 mai 2020
Interview de Laurent Romary sur le site internet d'Inria
19 nov. 2019
📰 France Culture parle de CamemBERT
18 nov. 2019
📰 Le journal Le Monde publie un article sur CamemBERT
1 juil. 2019
ALMAnaCH est désormais une équipe-projet Inria
1 janv. 2017
Création d'ALMAnaCH comme équipe Inria