Google garante que voz gerada por inteligência artificial é igual à humana

Google Deep Mind

Inteligência artificial e o Google

A Google vem investindo pesado em aplicações envolvendo inteligências artificiais. E uma delas, chamada Tacotron 2, converte textos em voz de maneira que o ouvinte sequer desconfie que aquela gravação foi feita por uma máquina, pois a voz, pronúncias e entonações são praticamente idênticas às humanas.

O sistema conta com redes neurais que traduzem o conteúdo escrito em um espectrograma (gráfico que organiza as ondas sonoras em uma linha do tempo). Dessa maneira, a pronúncia é praticamente perfeita, considerando vírgulas, pontos e palavras em destaque com caixa alta. Então, o resultado é analisado por um segundo sistema de IA chamado WaveNet, que traduz, enfim, o espectrograma em voz.

Se você está duvidando, é só acessar esta página da gigante no GitHub para conferir algumas amostras em áudio mostrando o potencial do Tacotron 2 com o WaveNet, que são desenvolvidos pela DeepMind, subsidiária da Alphabet.

Em breve, pode ser que o sistema chegue ao Google Assistente, tornando o assistente pessoal da gigante ainda mais “humano” – ao menos no que diz respeito à sua eloquência.

Tacotron 2

É uma rede neural para síntese de textos. Esse sistema é composto por uma rede de predição de sequencial que mapeia para espectrogramas na escala Mel (em inglês) seguido por um modelo WaveNet modificado que atua como um vocoder para sintetizar timbres desses espectrogramas. Nosso modelo atinge Mean Opinion Score (MOS) de 4,53.

Veja mais notícias:

Curta: @CebolaVerde
Acesse: https://CebolaVerde.com.br
Siga: https://instagram.com/cebolaverdebr

Fontes: CanalTech