Mega-lexique linguistique

Objectif

Unifier plusieurs ressources linguistiques (Lexique383, Morphalou, Wikidata, Wiktionary) en une base réutilisable pour les projets Lectura.

Description

Base lexicale structurée servant de socle à :

  • la tokenisation ;
  • les lecteurs augmentés ;
  • les futurs outils de Lectura.

L’objectif est d’obtenir une base de données structurée, notamment destinée à servir de fondation à une tokenisation plus robuste.

État d’avancement

En cours de consolidation

Ce travail est principalement porté par Ying.

Lien GitHub

À préciser.


← Retour aux projets