Ressources

Corpus, donnees linguistiques et modeles pre-entraines pour le traitement du francais. Ces ressources sont utilisees par les modules Lectura et peuvent etre obtenues independamment.

LeXiK

Base lexicale de 1,35 million d'entrees et 25 colonnes : orthographe, morphologie, phonetique IPA, frequences, synonymes, definitions.

Details Module Lexique

Kit G2P / P2G

Corpus annote (22K phrases + 1,16M mots alignes), scripts d'entrainement PyTorch et modeles ONNX pre-entraines.

Details Module G2P Module P2G