OSFRIA Découvrir les outils

OSIALab · Audio & musique

AudioCraft / MusicGen — générer de la musique localement

AudioCraft est la suite de génération audio de Meta Research. Son modèle phare, MusicGen, crée de la musique originale à partir d'une description textuelle — en local, sans abonnement ni cloud.

Cette page est informative et sans valeur de conseil. Vérifiez la licence du logiciel et des modèles avant tout usage, notamment commercial. La musique générée par IA soulève des questions de droit d'auteur : lisez les précautions ci-dessous.

À quoi ça sert

AudioCraft regroupe plusieurs modèles de génération audio de Meta : MusicGen (musique à partir de texte), AudioGen (bruitages et sons d'ambiance), et EnCodec (compression audio par IA). MusicGen est le plus utilisé : on lui décrit le style voulu en quelques mots et il génère un extrait musical original. C'est un outil de prototypage, de création expérimentale ou d'illustration sonore.

Pour qui

Pour les créatifs, développeurs et musiciens qui veulent expérimenter la génération musicale par IA sans dépendre d'un service en ligne. Un GPU est recommandé pour des temps de génération raisonnables. Python et pip sont nécessaires.

Installation

Prérequis

Python 3.9+, pip, PyTorch. GPU NVIDIA (8 Go VRAM recommandés pour les modèles medium/large). Fonctionne sur CPU mais lentement.

Installer AudioCraft

pip install audiocraft

Générer de la musique avec MusicGen

from audiocraft.models import MusicGen
from audiocraft.data.audio import audio_write

# Charger un modèle (small, medium, large, melody)
model = MusicGen.get_pretrained('facebook/musicgen-small')
model.set_generation_params(duration=8)  # durée en secondes

# Décrire la musique souhaitée
descriptions = ["une mélodie de piano relaxante, tempo lent, style classique"]
wav = model.generate(descriptions)

# Sauvegarder
audio_write("sortie_musicale", wav[0].cpu(), model.sample_rate, strategy="loudness")

Modèles disponibles

# Modèles MusicGen (du plus léger au plus performant)
# facebook/musicgen-small   — ~300 Mo, rapide sur CPU
# facebook/musicgen-medium  — ~1.5 Go, meilleure qualité
# facebook/musicgen-large   — ~3.3 Go, qualité maximale
# facebook/musicgen-melody  — conditionné par une mélodie de référence

Générer à partir d'une mélodie existante

from audiocraft.models import MusicGen
from audiocraft.data.audio import audio_read, audio_write

model = MusicGen.get_pretrained('facebook/musicgen-melody')
model.set_generation_params(duration=8)

# Charger un audio de référence
melody, sr = audio_read("ma_melodie.wav")

descriptions = ["arrangement jazz inspiré de cette mélodie"]
wav = model.generate_with_chroma(descriptions, melody.unsqueeze(0), sr)
audio_write("sortie", wav[0].cpu(), model.sample_rate, strategy="loudness")

Précautions d'usage

  • Statut du droit d'auteur de la musique générée. La question du droit d'auteur sur les œuvres générées par IA est encore en cours de clarification dans la plupart des pays. En France, seules les œuvres de l'esprit humain sont protégées. Avant tout usage commercial de musique générée, consultez un avis juridique.
  • La licence des modèles MusicGen. Les modèles MusicGen de Meta sont publiés sous licence CC-BY-NC 4.0 — usage non commercial uniquement. Vérifiez la licence actuelle sur Hugging Face avant tout projet commercial.
  • Entraînement sur des œuvres protégées. Comme beaucoup de modèles génératifs, MusicGen a été entraîné sur des corpus musicaux. Des débats existent sur les implications en matière de droit d'auteur. Utilisez ces outils avec discernement.
  • Ne présentez pas la musique générée comme originale sans le préciser. La transparence sur l'origine IA est une bonne pratique, et pourrait devenir une obligation légale.
  • Ressources nécessaires. Les modèles medium et large nécessitent un GPU conséquent. Sur CPU, la génération peut prendre plusieurs minutes pour quelques secondes d'audio.

Matrice de risque

Risque Niveau Mitigation
Fuite de données vers le cloud 🟢 Faible — génération 100% locale Utiliser les modèles téléchargés localement
Usage commercial avec licence CC-BY-NC 🔴 Élevé si non respecté Vérifier la licence du modèle ; ne pas utiliser commercialement sans accord
Ambiguïté sur le droit d'auteur du résultat 🟡 Moyen Consulter un avis juridique avant usage commercial ; indiquer l'origine IA
Saturation GPU / temps de génération long 🟡 Moyen Utiliser le modèle « small » pour tester, « large » en production sur GPU adapté

Sécurité

AudioCraft fonctionne localement. Points d'attention :

  • Installez depuis PyPI et Hugging Face officiels. Les modèles sont téléchargés automatiquement depuis Hugging Face au premier lancement.
  • Mettez à jour régulièrement. pip install --upgrade audiocraft pour les correctifs.
  • Stockez vos créations. Les fichiers audio générés restent sur votre machine — gérez-les comme n'importe quel fichier de travail.

Aller plus loin

  • Demucs — séparer les pistes d'une chanson existante.
  • Bark — générer des voix et de l'audio expressif.
  • FFmpeg — convertir et traiter vos fichiers audio générés.
  • OSIALab — tous les outils audio et musique.

Sources