Home » Das stimmgenerierende Startup Resemble AI verspricht, altes Audio wiederherzustellen

Das stimmgenerierende Startup Resemble AI verspricht, altes Audio wiederherzustellen

by Tim

Während viele KI-Firmen nach Möglichkeiten suchen, die Technologie zur Verbesserung oder sogar Erstellung von Videos zu nutzen, konzentriert sich Resemble AI auf die Audiokompatibilität. Das Startup, das auch einen KI-Stimmengenerator für Unternehmen anbietet, um realistische, menschenähnliche Sprecher zu erstellen, hat „Resemble Enhance“ auf den Markt gebracht, ein Open-Source-Tool, das die Qualität historischer Audiodaten erheblich verbessern soll.

Der neue Dienst kann eine verzerrte, unscharfe Aufnahme einer lange verschollenen historischen Rede nehmen und dann KI anwenden, um sie so klingen zu lassen, als wäre sie gestern aufgenommen oder gesendet worden.

Nach Angaben des kanadischen Unternehmens zeichnet sich Resemble Enhance durch seinen zweimoduligen Ansatz aus, der einen hochentwickelten Denoiser – der statisches Hintergrundbrummen und -zischen entfernt – mit einer KI-gestützten Sprachverbesserung kombiniert. Diese Kombination entfernt nicht nur unerwünschte Geräusche, sondern verbessert auch die Gesamtqualität des Audios.

Auch wenn es andere Produkte zur Audiorestauration auf dem Markt gibt, könnte die Kombination der Techniken von Resemble ein bedeutendes Unterscheidungsmerkmal sein.

Wie funktioniert es?

Der Resemble AI Denoiser verwendet UNet, ein KI-Modell, das hilft, die verschiedenen Arten von Klängen, die in einer Aufnahme vorkommen, zu trennen. Es zeichnet sich dadurch aus, dass es unerwünschte Geräusche aus den Audiospuren herausfiltert, so dass nur noch die Sprache im Mittelpunkt steht.

Sobald UNet seine Arbeit getan hat, kommt das Enhancer-Modul zum Einsatz, das die Audiobandbreite erweitert und Verzerrungen korrigiert. Diese Doppelfunktionalität stellt nach Angaben des Unternehmens sicher, dass die endgültige Ausgabe nicht nur rauschfrei ist, sondern auch den Reichtum zeitgenössischer Aufnahmen besitzt.

Als Open-Source-Tool ist Resemble Enhance kostenlos erhältlich, was auf dem traditionell teuren Markt der Medienrestaurierungsdienste eine überzeugende Option darstellt. Resemble Enhance kommt in erster Linie Branchen zugute, die auf eine klare Audioqualität angewiesen sind, wie Podcasting, Unterhaltung und Bildung. Darüber hinaus verleiht dieses Tool historischen Aufnahmen ein neues Leben und ermöglicht möglicherweise klarere Einblicke in die Vergangenheit.

Die Veröffentlichung des Tools erfolgt zu einem Zeitpunkt, an dem die Nachfrage nach hochwertigen digitalen Inhalten so hoch ist wie nie zuvor. Der Open-Source-Charakter von Resemble Enhance macht es zu einer potenziell bahnbrechenden Kraft in einem Markt, der derzeit von teuren proprietären Lösungen beherrscht wird.

Die Konvergenz von KI in der Audio- und Videoverbesserung wird wahrscheinlich den Weg für umfassendere Lösungen zur Medienwiederherstellung ebnen.

Durch die Kombination dieses Tools mit anderen Video-Enhancern, die generative KI oder andere Modelle zur Hochskalierung und Verbesserung von Bildern und Gesichtern verwenden – wie GPEN oder das bekannte GFPGan -, können Benutzer nun mit ihrem eigenen Computer professionelle Ergebnisse bei minimaler Investition erzielen.

Um mit Resemble Enhance zu experimentieren, können Nutzer die offizielle Resemble AI-Website besuchen oder ihre Modelle von der offiziellen Github-Seite des Projekts herunterladen

Related Posts

Leave a Comment