Pular para o conteúdo

VALL-E usa IA para copiar voz para textos e preocupa sobre fakenews e demais golpes

Compartilhe:

VALL-E é um modelo que usa inteligência artificial com aprendizado de máquina e síntese de voz de forma muito eficaz encabeçado pela Microsoft. As possibilidades são inúmeras, podendo ser utilizado em textos publicitários com vozes conhecidas, porém preocupou muita gente devido as possibilidades de criação de notícias falsas.

VALL-E modelo que copia voz com 3 segundos por IA
VALL-E copia vozes por trechos de apenas 3 segundos

Plataformas que utilizam esses recursos já existem, porém o VALL-E chamou a atenção pela fidelidade que as vozes ganham durante a dublagem dos textos.

Plataformas com esses recursos são implementadas já há muitos anos e inclusive existem projetos que pretendem armazenar as vozes de dubladores famosos para serem usadas para “sempre”, mesmo após o falecimento dos mesmos.

Em exemplo disso, podemos citar a Respeecher, empresa que usa inteligência artificial para fazer cópia fidedigna de vozes. Ela fez parceria com Earl Jones, ator e dublador responsável pela icônica voz de Darth Vader e que autorizou a gravação de sua voz para ser replicada e utilizada para futuras obras pois ele aposentou.

O VALL-E teve seu código apresentado semana passada no GitHub e realmente é incrível. Ele é um modelo de linguagem de codec neural e suas possibilidades de treino fazem com que seja possível copiar uma voz com apenas 3 segundos de áudio da voz original.

Confira vozes copiadas pelo VALL-E

A Microsoft disponibilizou alguns trechos com vozes originais e as cópias feitas pelo VALL-E. Os trechos com as vozes originais são curtíssimos e mesmo assim o VALL-E foi capaz de captar timbre de voz, entonação e demais características, criando cópias que resultaram em dublagens muito semelhantes. Confira:

Voz feminina original disponibilizada pela Microsoft:

Texto dublado com a cópia da voz feminina pelo VALL-E:

Voz masculina original disponibilizada pela Microsoft:

Texto dublado com a cópia da voz masculina pelo VALL-E:

O fato de necessitar de apenas 3 segundos da voz original para criar cópias praticamente iguais pode deixar muita gente preocupada quanto a possibilidade de criação de fakenews e aplicação de demais golpes. Essa preocupação quanto a capacidade da inteligência artificial não é vista exclusivamente nas cópias de vozes. Muitos artistas ficaram preocupados e alguns até indignados com a inteligência artificial usada em plataformas como o DALL-E, que possibilita a criação de artes digitais sem conhecimento profundo das plataformas de edição.

Consequências de modelos como o VALL-E

O VALL-E realmente é surpreendente e pode ser usado de muitas maneiras tanto positivas, quanto negativas. James Betker, engenheiro que trabalhou no Tortoise-TTS, que é um sistema de conversão de texto em fala disse ao Techcrunch que o VALL-E “É um modelo grande, como ChatGPT ou Stable Diffusion; tem algum entendimento inerente de como a fala é formada pelos humanos. Você pode ajustar o Tortoise e outros modelos em alto-falantes específicos, e isso os torna muito, muito bons. Não “meio que soa como” bom”.

As possibilidades positivas de plataformas com o VALL-E talvez superem as negativas para muitas pessoas. Além dos casos de pessoas famosas que poderão utilizar os seus recursos, pessoas comuns poderão ter suas vozes eternizadas, e inclusive em casos de incidentes onde elas percam a capacidade de falarem, poderão utilizar trechos curtos das vozes originais para serem usadas em aplicativos de dublagem.

As possibilidades negativas também existem, como em quase tudo. As vozes originais de pessoas que conhecemos podem ser copiadas via trechos curtos e serem usadas para passar confiança em golpes, por exemplo. Além disso, pessoas famosas podem ter suas vozes copiadas por pessoas má intencionadas para espalhar notícias falsas com mais chance de convencer pessoas desatentas. Infelizmente coisas assim podem acontecer, isso porque quem deseja aplicar golpes utiliza ferramentas úteis e convencionais para enganar.

Ainda é cedo para decretar se modelos como o VALL-E serão majoritariamente positivos ou negativos, porém é inegável que tenha muitas qualidades.


Compartilhe:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *