Home » La startup Resemble AI promet de restaurer les vieux sons en générant de la voix

La startup Resemble AI promet de restaurer les vieux sons en générant de la voix

by v

Alors que de nombreuses entreprises spécialisées dans l’IA s’efforcent de trouver des moyens d’utiliser la technologie pour améliorer ou même créer des vidéos, Resemble AI se concentre sur la fidélité audio. La startup, qui propose également un générateur de voix d’IA que les entreprises peuvent utiliser pour créer des voix off réalistes et humaines, a lancé « Resemble Enhance », un outil open-source conçu pour améliorer de manière significative la qualité de l’audio historique.

Le nouveau service peut prendre un enregistrement déformé et flou d’un discours historique perdu depuis longtemps et appliquer l’IA pour le faire sonner comme s’il avait été enregistré ou diffusé hier.

Selon la société canadienne, Resemble Enhance se distingue par son approche à double module, combinant un débruiteur sophistiqué – qui élimine les bourdonnements et les sifflements statiques de fond – et un améliorateur de la parole alimenté par l’IA. Cette combinaison permet non seulement de supprimer les bruits indésirables, mais aussi d’enrichir la qualité globale de l’audio.

Même s’il existe d’autres produits de restauration audio sur le marché, la combinaison des techniques de Resemble pourrait être un facteur de différenciation significatif.

Comment ça marche?

Le débruiteur Resemble AI utilise UNet, un modèle d’IA qui aide à séparer les différents types de sons qui apparaissent sur un enregistrement. Il excelle à filtrer les bruits indésirables des pistes audio, pour ne conserver que la parole.

Une fois que l’UNet a fait son travail, le module d’amélioration entre en action, élargissant la bande passante audio et corrigeant les distorsions. Selon l’entreprise, cette double fonctionnalité garantit que le résultat final est non seulement exempt de bruit, mais qu’il possède également la richesse des enregistrements contemporains.

En tant qu’outil à code source ouvert, Resemble Enhance est accessible gratuitement, ce qui constitue une option intéressante sur le marché traditionnellement onéreux des services de restauration de médias. Les principaux bénéficiaires de Resemble Enhance sont les industries qui dépendent d’une qualité audio claire, telles que le podcasting, le divertissement et l’éducation. En outre, cet outil offre une nouvelle vie aux enregistrements historiques, ce qui pourrait permettre de mieux comprendre le passé.

La sortie de cet outil intervient alors que la demande de contenu numérique de haute qualité n’a jamais été aussi forte. Par ailleurs, la nature open-source de Resemble Enhance le positionne comme une force potentiellement perturbatrice sur un marché actuellement dominé par des solutions propriétaires coûteuses.

La convergence de l’IA dans l’amélioration de l’audio et de la vidéo ouvrira probablement la voie à des solutions de restauration de médias plus complètes.

En combinant cet outil avec d’autres outils d’amélioration vidéo qui utilisent l’IA générative ou d’autres modèles pour améliorer les images et les visages, comme le GPEN ou le célèbre GFPGan, les utilisateurs peuvent désormais obtenir des résultats professionnels avec leur propre ordinateur pour un investissement minimal.

Pour expérimenter Resemble Enhance, les utilisateurs peuvent visiter le site officiel de Resemble AI ou télécharger leurs modèles à partir de la page Github officielle du projet.

Related Posts

Leave a Comment