Retour au feed
Reddit r/LocalLLaMA·

Open source: cloned Rocky's voice from Project Hail Mary in two days, full pipeline + 2:10 of training audio + trained RVC v2 model

Signal
72
Hype
28
En 3 lignesClonage de la voix de Rocky (Project Hail Mary) en deux jours via pipeline open-source. Extraction audio (ffmpeg + demucs), transcription (Whisper), diarization (pyannote), puis entraînement RVC v2 sur 2:10 min audio. Modèle .pth (55MB) et code publics. Comparaison XTTS v2 / YourTTS / RVC v2 / OpenVoice v2.
Lire la source
Ton avis ?
VoixOpen sourceGénération de codeOutils

Résumé généré par Claude — vérifié par l'humain