Home » Uma decisão acertada: Meta lança Audiobox alimentada por IA

Uma decisão acertada: Meta lança Audiobox alimentada por IA

by Thomas

A empresa-mãe do Facebook, Meta, lançou a primeira demonstração de sua nova plataforma de gerador de áudio alimentada por IA, Audiobox, na segunda-feira. O gigante da mídia social disse que o Audiobox permite que os usuários criem vozes e efeitos sonoros personalizados usando entradas de voz e prompts.

O Audiobox, disse Meta, baseia-se na tecnologia desenvolvida para sua plataforma Voicebox lançada no início deste ano, mas supera o Voicebox em qualidade e inclui marca d’água automática para “uso responsável”.

“Audiobox, o sucessor do Voicebox, está a avançar ainda mais a IA generativa para áudio, unificando as capacidades de geração e edição de fala, efeitos sonoros (sons curtos e discretos como um latido de cão, buzina de carro, um estalo de trovão, etc.) e paisagens sonoras, com uma variedade de mecanismos de entrada para maximizar a controlabilidade para cada caso de uso “, disse a equipa Audiobox da Meta.

A Audiobox, explicou a equipa, utiliza “solucionadores personalizados”, o que, segundo a equipa, torna o processo de geração mais de 25 vezes mais rápido do que os modelos anteriores, sem perda de desempenho.

Em junho, a Meta anunciou o Voicebox, uma ferramenta de IA generativa que, segundo a Meta, pode produzir áudio em seis línguas, incluindo inglês, francês, alemão, espanhol, polaco e português, e pode fazê-lo mais próximo da forma como as pessoas falam naturalmente no mundo real.

Na altura, com o aumento das preocupações sobre as falsificações profundas baseadas em IA, a Meta afirmou que não iria disponibilizar o Voicebox ao público, reconhecendo o potencial de utilização indevida. Para combater a utilização indevida com o Audiobox, a Meta incluiu a marca de água.

“Os recentes avanços na qualidade e fidelidade do modelo generativo de áudio permitiram novas aplicações e casos de utilização do modelo. No entanto, ao mesmo tempo, há muitas pessoas… que se preocupam com os riscos de utilização indevida”, afirmou a equipa da Audiobox no seu relatório. “Portanto, a capacidade de reconhecer qual áudio é gerado ou real é crucial para evitar o [uso indevido] da tecnologia e permitir que certas [plataformas] cumpram sua política.

“Tanto o modelo Audiobox como a nossa demonstração interactiva incluem uma marca de água de áudio automática, pelo que qualquer áudio criado com o Audiobox pode ser rastreado com precisão até à sua origem”, afirmou Meta. “O nosso método de marca de água incorpora um sinal no áudio que é impercetível para o ouvido humano, mas que pode ser detectado até ao nível do fotograma, utilizando um modelo capaz de encontrar segmentos gerados por IA no áudio. “

“Concebemos um sistema de alerta baseado em descrições e exemplos para melhorar a controlabilidade e unificar os paradigmas de geração de fala e som”, afirmou a equipa. “Permitimos que a transcrição, a voz e outros estilos de áudio sejam controlados de forma independente ao gerar a fala.”

Embora possa ser mais rápido, Meta reconheceu que os modelos de IA geradores de áudio como o Audiobox são limitados pela quantidade de dados de treinamento – neste caso, sons – rotulados e alimentados no modelo de IA, enfatizando a importância de rotular corretamente os dados.

Por exemplo, segundo os investigadores, é preferível rotular os sons de um chihuahua e de um labrador a ladrar como o tipo específico de cão do que simplesmente rotulá-los como “cães a ladrar”. O Meta diz que o mesmo se aplica a padrões de discurso como sotaques e dialectos regionais.

Um porta-voz da Meta não quis fazer mais comentários.

Tal como a Google, a Microsoft e a Amazon, a Meta investiu fortemente em inteligência artificial. No início deste mês, a Meta anunciou mais de 20 novos recursos baseados em IA para seu conjunto de plataformas, incluindo Facebook, Instagram e WhatsApp.

Defensora do desenvolvimento responsável da IA, a Meta estabeleceu recentemente uma parceria com a IBM para lançar a AI Alliance, um consórcio de mais de 50 empresas, universidades e grupos de reflexão centrados na inovação e no desenvolvimento de IA de código aberto.

“A AI Alliance reúne investigadores, programadores e empresas para partilhar ferramentas e conhecimentos que nos podem ajudar a progredir, quer os modelos sejam partilhados abertamente ou não”, afirmou o Presidente dos Assuntos Globais da Meta, Nick Clegg. “Estamos ansiosos por trabalhar com parceiros para fazer avançar o estado da arte da IA e ajudar todos a construir de forma responsável. “

Related Posts

Leave a Comment