VC Locuteurs

Lectura VC Locuteurs

Conversion vocale RVC vers 6 voix francaises pre-entrainees — ONNX pur

Presentation

Sous-module de conversion vocale base sur RVC (Retrieval-based Voice Conversion) avec 6 voix francaises pre-entrainees. Chaque voix dispose de son propre modele synthesizer, entraine sur un corpus de haute qualite.

Caracteristique Valeur
Voix 6 speakers (3F + 3M) : Ezwa, Nadine, Siwis, Bernard, Gilles, Zeckou
Backend HuBERT + RMVPE + Synthesizer — ONNX Runtime pur
Modeles 8 fichiers ONNX (~1.4 Go total)
Sortie Audio @ 48000 Hz
Controles protect, pitch_modification
Auto-adaptation Pitch et protection ajustes selon le genre du speaker

Voix disponibles

Speaker Genre Caractere
siwis F Voix feminine claire, studio
ezwa F Voix feminine douce, chaleureuse
nadine F Voix feminine naturelle
bernard M Voix masculine posee
gilles M Voix masculine grave
zeckou M Voix masculine dynamique

Exemple de code

from lectura_vc_locuteurs import creer_engine, RVC_SPEAKERS

engine = creer_engine()

# Conversion vers Bernard
audio, sr = engine.convert(
    audio="input.wav",
    speaker="bernard",
)
# sr == 48000

# Liste des speakers
print(RVC_SPEAKERS)
# ['ezwa', 'nadine', 'bernard', 'gilles', 'zeckou', 'siwis']

# Avec ajustement de pitch
audio, sr = engine.convert(
    audio="input.wav",
    speaker="nadine",
    pitch_modification=2,    # monter de 2 demi-tons
)
# Fonction de commodite (cree un engine ephemere)
from lectura_vc_locuteurs import convertir

audio, sr = convertir("input.wav", speaker="siwis")

Architecture

Audio source --> HuBERT (features vocales) --> RMVPE (estimation F0)
                                                      |
                                         Synthesizer_{speaker} (ONNX)
                                                      |
                                               Audio converti @ 48000 Hz

Les 8 modeles ONNX :

  • hubert.onnx (361 Mo) — extraction de features vocales
  • rmvpe.onnx (345 Mo) — estimation de frequence fondamentale (F0)
  • 6x synthesizer_{speaker}.onnx (~116 Mo chacun) — synthesizers RVC par voix

Installation

pip install lectura-vc-locuteurs   # module public (~7 Ko)

Le module public utilise l’API Lectura pour l’inference. Le backend local ONNX necessite les modeles pre-entraines (~1.4 Go), disponibles sous licence commerciale.


Caracteristiques techniques

  • RVC ONNX : HuBERT + RMVPE + Synthesizer, 6 voix pre-entrainees
  • Auto-adaptation : detection automatique du pitch source, ajustement selon le speaker cible
  • Lazy loading : chaque synthesizer charge a la demande (premier appel)
  • ONNX Runtime pur : pas de dependance PyTorch
  • Python 3.10+ avec type hints complets (PEP-561)
  • Licence : AGPL-3.0 (code) — les modeles sont sous licence commerciale