VC Locuteurs
Lectura VC Locuteurs
Conversion vocale RVC vers 6 voix francaises pre-entrainees — ONNX pur
Presentation
Sous-module de conversion vocale base sur RVC (Retrieval-based Voice Conversion) avec 6 voix francaises pre-entrainees. Chaque voix dispose de son propre modele synthesizer, entraine sur un corpus de haute qualite.
| Caracteristique | Valeur |
|---|---|
| Voix | 6 speakers (3F + 3M) : Ezwa, Nadine, Siwis, Bernard, Gilles, Zeckou |
| Backend | HuBERT + RMVPE + Synthesizer — ONNX Runtime pur |
| Modeles | 8 fichiers ONNX (~1.4 Go total) |
| Sortie | Audio @ 48000 Hz |
| Controles | protect, pitch_modification |
| Auto-adaptation | Pitch et protection ajustes selon le genre du speaker |
Voix disponibles
| Speaker | Genre | Caractere |
|---|---|---|
| siwis | F | Voix feminine claire, studio |
| ezwa | F | Voix feminine douce, chaleureuse |
| nadine | F | Voix feminine naturelle |
| bernard | M | Voix masculine posee |
| gilles | M | Voix masculine grave |
| zeckou | M | Voix masculine dynamique |
Exemple de code
from lectura_vc_locuteurs import creer_engine, RVC_SPEAKERS
engine = creer_engine()
# Conversion vers Bernard
audio, sr = engine.convert(
audio="input.wav",
speaker="bernard",
)
# sr == 48000
# Liste des speakers
print(RVC_SPEAKERS)
# ['ezwa', 'nadine', 'bernard', 'gilles', 'zeckou', 'siwis']
# Avec ajustement de pitch
audio, sr = engine.convert(
audio="input.wav",
speaker="nadine",
pitch_modification=2, # monter de 2 demi-tons
)
# Fonction de commodite (cree un engine ephemere)
from lectura_vc_locuteurs import convertir
audio, sr = convertir("input.wav", speaker="siwis")
Architecture
Audio source --> HuBERT (features vocales) --> RMVPE (estimation F0)
|
Synthesizer_{speaker} (ONNX)
|
Audio converti @ 48000 Hz
Les 8 modeles ONNX :
hubert.onnx(361 Mo) — extraction de features vocalesrmvpe.onnx(345 Mo) — estimation de frequence fondamentale (F0)- 6x
synthesizer_{speaker}.onnx(~116 Mo chacun) — synthesizers RVC par voix
Installation
pip install lectura-vc-locuteurs # module public (~7 Ko)
Le module public utilise l’API Lectura pour l’inference. Le backend local ONNX necessite les modeles pre-entraines (~1.4 Go), disponibles sous licence commerciale.
Caracteristiques techniques
- RVC ONNX : HuBERT + RMVPE + Synthesizer, 6 voix pre-entrainees
- Auto-adaptation : detection automatique du pitch source, ajustement selon le speaker cible
- Lazy loading : chaque synthesizer charge a la demande (premier appel)
- ONNX Runtime pur : pas de dependance PyTorch
- Python 3.10+ avec type hints complets (PEP-561)
- Licence : AGPL-3.0 (code) — les modeles sont sous licence commerciale