Modules

Six packages Python autonomes pour le traitement linguistique du francais, distribues sur PyPI. Installez tout d’un coup avec pip install lectura ou chaque module independamment. Zero dependance sur les modules de base, type hints complets (Python 3.10+).

Tokeniseur

Normalisation et tokenisation du francais, detection de 15+ types de formules.

pip install lectura-tokeniseur

G2P — Grapheme vers Phoneme

Modele unifie BiLSTM : phonemisation IPA (98.5%), POS-tagging, morphologie, liaison.

pip install lectura-g2p

P2G — Phoneme vers Grapheme

Conversion IPA → orthographe avec word feedback (93.1%), POS-tagging, morphologie.

pip install lectura-p2g

Aligneur-Syllabeur

Pivot central : alignement grapheme-phoneme, groupes de lecture, syllabation avec attaque/noyau/coda.

pip install lectura-aligneur

Lexique

Outil generique d'acces a un lexique francais (Lexique383, GLAFF, LeXiK...) : conjugaison, rimes, synonymes, anagrammes.

pip install lectura-lexique

Formules

Lecture des nombres, dates, heures, sigles, monnaies, fractions — avec phonetique IPA.

pip install lectura-formules

Installation rapide

# Tous les modules d'un coup
pip install lectura

# Un seul module
pip install lectura-tokeniseur

# G2P — fonctionne immediatement via l'API (zero config)
pip install lectura-g2p

Par defaut, les modules G2P, P2G et Aligneur-Syllabeur utilisent l’API Lectura (api.lec-tu-ra.com) — aucune configuration necessaire. Pour l’inference locale, installez les modeles et les backends optionnels (lectura-g2p[onnx]).