É o momento que todos esperaram o ano todo: Spotify embrulhado tempo. Embora tenha sido lançado mais tarde do que o previsto inicialmente, o resumo anual personalizado está disponível para os assinantes verem onde seus gostos musicais chegaram durante o ano. O que também está disponível é um podcast personalizado, cortesia de NotebookLM do Googleapresentando dois apresentadores de IA que lutam para pronunciar qualquer música ou artista que não seja do tipo anglo-saxão.
A inteligência artificial não é perfeita. Mesmo com as demonstrações mais convincentes em conferências de desenvolvedores, a conversão de texto em fala por IA sempre soa um pouco forçada em comparação com a forma como os humanos falam. O melhor exemplo é Podcast Wrapped AI do Spotifyque lembra a demonstração do Google no início deste ano no Google I/O. Os apresentadores são certamente convincentes, mas quanto mais você ouve o podcast elaborado sinteticamente, mais óbvio se torna que você está ouvindo um par de robôs recapitulando suas estatísticas de audição.
O podcast produzido por IA começa como padrão. Parece que eu e meu parceiro de podcasting estamos em um episódio de nosso show. Primeiro, os anfitriões destacam o dia mais longo em que você ouviu Spotify durante o ano. Tudo começou em um dia particularmente emocionante, quando eu ouvia horas de música triste. Os anfitriões da IA se perguntaram em voz alta se era porque eu estava em uma viagem naquele dia. (Eu não estava. Eu estava chorando!) Esta é uma oportunidade em que a IA poderia ter evitado fazer suposições. Como um amigo que não pensa no impacto de suas palavras, a IA me fez relembrar um dia de desconforto significativo. Comportamento rude!
Em seguida, os anfitriões da IA leem os artistas e músicas mais tocados do ano. Eu ainda preferiria ouvir uma tentativa humana real de pronunciar o nome do meu artista holandês favorito, Joost Klein, do que o NotebookLM do Google. Seu nome é pronunciado “Yost”, mas o podcast se refere a ele como “suco”. É ainda pior quando tentam pronunciar as músicas holandesas. Minha música mais tocada este ano se chama “Wachtmuziek”, e os anfitriões do NotebookLM do Google a pronunciam exatamente como você tentaria lê-la para quem não fala holandês, sem o sorte do falcão isso é enunciado com o “cht”.
Os falantes de espanhol também descobrirão que o NotebookLM do Google tem dificuldades com a língua latina. Meu editor compartilhou seu podcast personalizado comigo, e eu me encolho sempre que eles tentam identificar uma música de Bad Bunny. Não me fale sobre a pronúncia massacrada de “ray-gay-ton”, que é não como o reggaeton é dito em voz alta. Eu diria que pronunciar a palavra com a entonação apropriada é o gênero. O fator de constrangimento é alto com este.
Isso me leva a perguntar: isso não é algo que a IA deveria perceber? A música é categorizada de acordo com o idioma em que é apresentada. Imagino que um bot possa ser programado para extrair esses dados e se ajustar de acordo. Para crédito de seus desenvolvedores, o Google cobriu suas bases mencionando que seus hosts de IA ocasionalmente pronunciam palavras incorretamente. Mas a magia da IA desaparece quando você percebe que o bot é tão falho por não praticar a pronúncia quanto o resto de nós.
O podcast Wrapped AI do Spotify com as proezas do Google está disponível para usuários gratuitos e premium nos EUA, Reino Unido, Austrália, Nova Zelândia, Canadá, Irlanda e Suécia por tempo limitado.