1 offre d'emploi !

Équipe-projet ALMAnaCH

L'équipe de recherche en TAL d'Inria Paris

Recherche en Intelligence Artificielle combinant Traitement Automatique des Langues et Humanités Computationnelles
Recherche en Intelligence Artificielle combinant Traitement Automatique des Langues et Humanités Computationnelles
Actualités
17 nov. 2022
🎓 Soutenance de thèse de Benjamin Muller
Benjamin Muller a soutenu sa thèse, dirigée par Djamé Seddah et Benoît Sagot, sur le traitement de la variation et de la diversité linguistiques dans les modèles de langue neuronaux, avec un accent sur les langues à faibles ressources.
3 oct. 2022
🤝 Niyati Bafna rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur les modèles de langues inspirés par la linguistique pour les langues proches, encadrée par Benoît Sagot, Rachel Bawden et (du DFK) Cristina España-Bonet et Josef van Genabith.
26 sept. 2022
🎓 Soutenance de thèse de Clémentine Fourrier
Clémentine Fourrier a soutenu sa thèse, dirigée par Benoît Sagot, Rachel Bawden et Laurent Romary sur des approches neuronales pour la reconstruction de mots historiques.
27 juil. 2022
🎓 Soutenance de thèse de Pedro Ortiz Suarez
Pedro Ortiz Suarez a soutenu sa thèse, dirigée par Laurent Romary et Benoît Sagot sur une approche basée sur les données pour le traitement automatique du langage naturel en français contemporain et historique.
31 mars 2022
🤝 Anna Chepaikina rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur la génération de commentaires œnologiques, encadrée par Benoît Sagot et en collaboration avec la startup Winespace.
9 mars 2022
Nous sommes très heureux d'annoncer la publication d'une nouvelle version de notre très gros corpus multilingue OSCAR, la version 22.02
Principaux changements : corpus orienté-documents avec des annotations sur lesquelles vous pouvez filtrer, identification de la langue au niveau du document, un nouveau sous-corpus multilingue pour les documents multilingues, et plus encore !
1 mars 2022
🤝 Wissam Antoun rejoint ALMAnaCH en tant qu'ingénieur de recherche
Il travaillera sous la direction de Djamé Seddah et Benoît Sagot sur les modèles de langage pour les langues présentant une variabilité élevée, en particulier sur les dialectes arabes que l'on trouve dans le contenu généré par les utilisateurs sur les médias sociaux.
1 févr. 2022
🤝 Jesujoba Alabi rejoint ALMAnaCH en tant qu'ingénieur de recherche
Il travaillera sous la direction de Rachel Bawden sur l'adaptation de domaine pour la traduction neuronale dans le contexte du projet DadaNMT.
17 janv. 2022
🤝 Rua Ismail a rejoint ALMAnaCH en tant qu'ingénieur de recherche
Elle travaillera sous la direction de Benoît Sagot sur le corpus OSCAR, et notamment sur l'identification de la langue d'un document, et sur la description de deux langues nubiennes.
1 déc. 2021
🤝 Nathan Godey rejoint ALMAnaCH en tant que doctorant
Il travaillera sous la direction de Benoît Sagot et d'Éric de la Clergerie sur l'amélioration des modèles de langue, notamment par l'utilisation de techniques relevant du transport optimal.
27 oct. 2021
🎓 Soutenance de thèse de Louis Martin
Louis Martin a soutenu sa thèse, dirigée par Benoît Sagot, Éric de La Clergerie, Antoine Bordes (FAIR Paris), sur la simplification de phrases au moyen de méthodes contrôlables et non supervisées.
1 oct. 2021
🤝 Lydia Nishimwe a rejoint ALMAnaCH en tant que doctorante
Dans le cadre de la chaire PRAIRIE de Rachel Bawden, elle travaillera sur les modèles de traduction neuronaux robustes pour les contenus générés par les utilisateurs.
1 oct. 2021
🤝 You Zuo a rejoint ALMAnaCH en tant qu'ingénieure de recherche
Elle travaillera sur la classification fine de brevets en collaboration avec l'INPI.
1 oct. 2021
🤝 Roman Castagné est désormais un doctorant ALMAnaCH.
Il travaillera sous la direction de Benoît Sagot et d'Éric de la Clergerie sur l'amélioration des modèles de langue par une meilleure compréhension de ce qu'ils apprennent et de quand ils l'apprennent.
20 sept. 2021
🤝 Camille Rey a rejoint ALMAnaCH en tant que stagiaire de Master 2
Elle étudiera les erreurs produites par les systèmes de traduction automatique neuronale.
15 mai 2021
🤝 Paul-Ambroise Duquenne a rejoint ALMAnaCH en tant que doctorant
Il travaillera sur les espaces de représentation des phrases de type LASER sous la double direction de Benoît Sagot, pour ALMAnaCH, et Holger Schwenk, pour FAIR (le laboratoire de recherche en IA de Facebook à Paris) dans le cadre d'une thèse CIFRE.
4 mai 2021
Nous sommes heureux d'annoncer la publication de PAGnol, un nouveau membre de notre famille de modèles de langue
PAGnol est un nouveau modèle de langue génératif libre pour le français, dont l'architecture est similaire à celle de GPT-3. Il est le résultat d'une collaboration avec l'entreprise LightOn.
3 mai 2021
🤝 Matthieu Futeral-Peter a rejoint ALMAnaCH en tant que stagiaire de Master 2
Son travail est en collaboration avec l'équipe-projet Willow à Inria, le but étant de construire de meilleurs word embeddings à la fois multilingues et multimodaux.
19 avr. 2021
🤝 Tú Anh Nguyễn a rejoint ALMAnacH en tant que doctorant
Il travaillera sur l'apprentissage non supervisé de représentations linguistiques à partir de données de parole (audio) sous la double direction de Benoît Sagot, pour ALMAnaCH, et Emmanuel Dupoux, pour FAIR (le laboratoire de recherche en IA de Facebook à Paris) dans le cadre d'une thèse CIFRE.
5 avr. 2021
🤝 Hugo Scheithauer a rejoint ALMAnaCH en tant que stagiaire de Master 2
Il travaillera sur l'ajout de technologies NER dans l'environnement open-source eScriptorium pour la transcription automatique, en s'appuyant le cas d'usage fourni par le projet LECTAUREP.
1 avr. 2021
🤝 Syrielle Montariol a rejoint ALMAnaCH en tant que post-doc
Elle travaillera au sein du projet H2020 CounteR sous la direction principale de Djamé Seddah sur la détection des changements sémantiques dans les publications sur les réseaux sociaux au niveau individuel, afin de contribuer à la détection et à l'analyse de différents types de processus de radicalisation.
1 avr. 2021
🤝 Thomas Wang a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, il va travailler sur de nouvelles architectures pour les modèles de langue neuronaux qui nécessitent moins de puissance de calcul, moins de mémoire et/ou moins de données pour leur entraînement. Il travaillera notamment sur la réduction de l'impact computationnel et mémoire des mécanismes d'attention, en particulier lorsque l'on veut traiter de longues séquences en une seule fois.
1 avr. 2021
🤝 Roman Castagné a rejoint ALMAnaCH en tant que stagiaire de Master 2
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, il va travailler sur des modèles de langue neuronaux multi-niveaux dans le but de diminuer l'impact du bruit dans les données d'entrée sur les performances de tels modèles.
1 avr. 2021
🤝 Julien Abadji a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, il va travailler à améliorer quantitativement (taille, nombre de langues) et qualitativement (précision de la classification par langues, filtrage des contenus offensants) de notre très grand corpus multilingue OSCAR qui s'appuie sur Common Crawl. Il travaillera également sur la production de nouvelles versions d'OSCAR à intervalles réguliers.
8 mars 2021
🤝 Manon Ovide a rejoint ALMAnaCH en tant que stagiaire de Master 2
Elle travaillera sur la chaîne d’édition scientifique numérique mis en place pour le projet DAHN, et notamment sur la phase de publication, dans le respect des directives de la TEI.
11 févr. 2021
Conférence Cap'FALC
Le Centre Inria de Paris, l'Unapei et Facebook Artificial Intelligence Research présentent Cap'FALC, un projet dont le but est d'améliorer l'accessibilité de l'information aux personnes en situation de handicap intellectuel, par le développement d'un outil d'aide à la production de contenus en FALC (« Facile à Lire et à Comprendre »)
1 févr. 2021
🤝 Thibault Charmet a rejoint ALMAnaCH en tant qu'ingénieur d'études
Il travaillera en collaboration avec la Cour de Cassation sur l'aide à la détection de divergences, dans le cadre du Lab IA, initiative placée au sein de la DINUM (Direction Interministérielle du Numérique et des Systèmes d'Information et de communication, rattachée au Premier Ministre) pour aider les administrations publiques de l'État à bénéficier des avancées récentes en IA.
13 janv. 2021
Lancement du nouveau site web d'ALMAnaCH
19 nov. 2020
Article sur la collaboration entre ALMAnaCH et la start-up Winespace sur le site internet d'Inria
16 nov. 2020
📣 Benoît Sagot à « France is AI »
Benoît Sagot a participé à un panel avec François Yvon à la conférence « France is AI », le plus grand événement français en intelligence artificielle.
1 nov. 2020
🥂 Benoît Sagot été nommé "Directeur de Recherches"
1 nov. 2020
🤝 Rachel Bawden a rejoint ALMAnaCH en tant que Chargée de Recherches Inria
Elle travaille sur la traduction automatique et du TAL multilingue.
1 nov. 2020
🤝 Arij Riabi a rejoint ALMAnaCH en tant qu'ingénieure d'études
Dans le cadre de la chaire PRAIRIE de Benoît Sagot, elle va travailler sur le TAL pour les langues peu dotées et non normalisées, notamment pour l'arabe dialectal d'Afrique du nord écrit en alphabet latin (Arabizi)
1 nov. 2020
🤝 Lucas Terriel a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre des projets EHRI, DAHN et NER4archives, il travaillera à l'interface entre TAL et humanités numériques sur les documents d'archives, et notamment sur la reconnaissance des entités nommées dans les instruments de recherche.
8 oct. 2020
🎓 Soutenance de thèse de Jack Bowers
Jack Bowers a soutenu sa thèse, dirigée par Laurent Romary, sur la documentation linguistique et les normes en humanités numériques, et plus précisément sur l'utilisation de la TEI pour la documentation du Mixtepec-Mixtec
1 oct. 2020
🎓 Soutenance de thèse de Mohamed Khemakhem
Mohamed Khemakhem a soutenu sa thèse, dirigée par Laurent Romary, sur des modèles lexicaux normalisés pour la structuration automatique de dictionnaires électroniques.
1 sept. 2020
🤝 Yves Tadjo a rejoint ALMAnaCH en tant qu'ingénieur d'études
Dans le cadre du projet DAHN, il développera des outils pour les humanités numériques appliquées aux documents d'archives.
15 juil. 2020
🎓 Soutenance de thèse de Loïc Grobol
Loïc Grobol a soutena sa thèse, dirigée par Isabelle Tellier†, Frédéric Landragin, Marco Dinarelli et Éric de la Clergerie, sur la résolution de coréférences pour le français.
25 mai 2020
Article sur l'initiative Cap'FALC sur le site internet d'Inria
Cap'FALC est une collaboration impliquant le FAIR (Facebook) et l'UNAPEI, visant le développement d'un algorithme de simplification de textes et d'un outil accessible facilitant la production de textes en FALC (« Facile à Lire et à Comprendre ») à destination des personnes souffrant de handicap mental
4 mai 2020
Interview de Laurent Romary sur le site internet d'Inria
19 nov. 2019
📰 France Culture parle de CamemBERT
18 nov. 2019
📰 Le journal Le Monde publie un article sur CamemBERT
1 juil. 2019
ALMAnaCH est désormais une équipe-projet Inria
1 janv. 2017
Création d'ALMAnaCH comme équipe Inria