Projets de recherche

Projets européens

EHRI “European Holocaust Research Infrastructure”

EHRI “European Holocaust Research Infrastructure”

Approches computationnelles pour la recherche archivistique sur l'Holocauste.

DARIAH

DARIAH

Digital Research Infrastructure for the Arts and Humanities.

CounteR

CounteR

Plateforme de veille axée sur la protection de la vie privée destinée à la prédiction du terrorisme violent et de la criminalité, à la contre-radicalisation et à la protection des citoyens.

Projets ANR

ParSiTi

ParSiTi

Analyse syntaxique et traduction automatique contextuelles de contenus produits par les utilisateurs (User-generated content).

BASNUM

BASNUM

Analyse computationnelle du dictionnaire encyclopédique d’Henri Basnage de Beauval (1701).

PARSE-ME

PARSE-ME

Prise en compte des expressions polylexicales en analyse syntaxique.

TIME-US

TIME-US

Analyse computationnelle des salaires et des budgets-temps dans le secteur textile aux XVIIIème et XIXème siècles.

Autres projets nationaux

PRAIRIE

PRAIRIE

Institut interdisciplinaire de recherche en intelligence artificiel fondé par 5 partenaires académiques et 16 partenaires industriels.

Cap'FALC

Cap'FALC

Développement d'un algorithme de simplification de textes et d'un outil accessible facilitant la production de textes en FALC (« Facile à Lire et à Comprendre »).

LECTAUREP

LECTAUREP

Développement d'une plateforme de transcription, lecture et analyse automatique des actes notariés présents dans les Archives nationales.

DAHN

DAHN

Numérisation et exploitation informatique de documents d'archives présentant un intérêt historique.

NER4archives

NER4archives

Reconnaissance d'entités nommées dans dans les instruments de recherche XML-EAD, une norme d’encodage des instruments de recherche archivistiques.

EFL

EFL

Linguistique empirique au sens large, y compris la linguistique computationnelle et le TAL.

LiLT

LiLT

Problématiques linguistiques dans les technologies du langage.

Huma-Num

Huma-Num

Très grande infrastructure de recherche (TGIR) visant à faciliter le tournant numérique de la recherche en sciences humaines et sociales.

Matériaux Anciens et Patrimoniaux

Matériaux Anciens et Patrimoniaux

Le DIM « Matériaux anciens et patrimoniaux » (MAP) est le réseau de recherche francilien dédié à l’étude des matériaux anciens et patrimoniaux.

Nénufar

Nénufar

Numérisation et exploitation des premières éditions du Petit Larousse.

Projets internationaux

Universal Dependencies Project

Universal Dependencies Project

Le projet Universal Dependencies est un effort communautaire ouvert avec plus de 300 contributeurs produisant près de 200 jeux de données annotés en syntaxe dans plus de 100 langues.

Anciens Projets

Projets européens
  • enCollect (COST, 2017-2020): Associer apprentissage des langues et crowdsourcing pour le développement de matériel pédagogique pour l'enseignement des langues et des ressources linguistiques pour le TAL.
  • DESIR (H2020, 2017-2019): Le projet DESIR vise à contribuer à la pérennité de l'infrastructure DARIAH dans toutes ses dimensions: diffusion, croissance, technologie, robustesse, confiance et éducation. Inria est responsable de la fourniture d'un portefeuille de services d'analyse textuelle s'appuyant sur GROBID et entity-fishing.
  • HIRMEOS (H2020, 2017-2019): Intégration des manuscrits de recherche dans l'infrastructure européenne pour la science ouverte.
  • Parthenos (H2020, 2015-2019): Renforcer la coordination de la recherche dans le large périmètre couvrant la linguistique, les humanités, le patrimoine culturel, l'histoire, l'archéologie et les disciplines connexes grâce à un réseau thématique d'infrastructures européennes de recherche, d'e-infrastructures et d'autres infrastructures de classe mondiale, et par la construction de ponts entre ces domaines différents et pourtant fortement reliés.
  • Iperion CH (H2020, 2015-2019): Coordonner les initiatives relatives aux infrastructures pour le domaine du patrimoine culturel.
Projets ANR
  • Profiterole (ANR, 2017-2021): Modélisation et analyse automatique du français médiéval.
  • SoSweet (ANR, 2015-2020): Étude de la variabilité sociolinguistique sur Twitter, en comparant des approches linguistiques/TAL et des approches reposant sur la structure en graphe du réseau.
  • VerDI (ANR RAPID, 2015-2018): Identification automatique de la dissimulation d’information sur internet.
Autres projets nationaux
  • OPALINe (PIA, 2017-2020): Développement d'outils pour l’accessibilité des livres numériques aux personnes malvoyantes.
Projets internationaux
  • NLP Resources for Analyzing Reactions to Major Events in Hebrew and French Social Media (PHC Maïmonide, 2018-2019): Construction de ressources TAL pour l'analyse des réactions aux événements majeurs en hébreu et en français sur les réseaux sociaux.
  • MCM-NL (ANR-NSF, 2016-2020): Explorer les corrélations entre données issues de la neuro-imagerie (IRMf, EEG) et données issues d'outils de TAL (principalement des analyseurs syntaxiques). Les données proviennent de la lecture du « Petit Prince » en français et en anglais, analysées par plusieurs analyseurs syntaxiques.