Cos’è AudioCraft, l’AI di Meta che crea musica
Meta ha annunciato il rilascio di AudioCraft, un’intelligenza artificiale generativa open source che crea audio dal testo. Si tratta di un nuovo passo nel mondo dell’AI, ma soprattutto in quello della musica.
AudioCraft ha tre modelli, MusicGen per comporre musica, AudioGen per creare effetti sonori ed EnCodec, che utilizza l’intelligenza artificiale per assistere nella compressione audio che supera il formato MP3.
MusicGen non incappa in alcun tipo di problema di copyright, perché è stato addestrato sulla musica di proprietà di Meta. Per addestrare questo strumento, l’azienda ha utilizzato “20.000 ore di musica di proprietà di Meta o concesse in licenza appositamente per questo scopo”.
AudioGen permette di creare suoni realistici da semplici istruzioni scritte, simulando qualsiasi cosa si voglia, come il latrato di un cane o il rumore dei passi. EnCodec permette agli utenti di creare suoni con minori artefatti, per ottenere suoni più naturali e realistici.
AudioCraft è stato progettato pensando a musicisti e sound designer per “fornire ispirazione, aiutare le persone a fare rapidamente brainstorming e usare le loro composizioni in modi nuovi“, afferma l’annuncio di Meta.
Gran parte dei recenti sviluppi dell’IA generativa si sono concentrati sulla generazione di testo e immagini, in quanto si tratta di un processo più semplice. Invece Meta con AudioCraft ha optato per lavorare sul text-to-audio.
I media hanno potuto ascoltare alcuni esempi di audio realizzati con AudioCraft. Emilia David di The Verge sostiene che i rumori suonano naturali, mentre suoni come le corde della chitarra risultano ancora artificiali.
L’azienda ha spinto in per portare agli utenti strumenti basati sull’intelligenza artificiale in competizione con OpenAI, Google e Microsoft. A luglio ha rilasciato il suo Llama 2 open source. Ci sono anche voci secondo cui Meta lancerà delle personalità AI, ovvero chatbot per Instagram, Facebook e WhatsApp.