No início deste mês, um novo trailer de filme foi lançado no X, a plataforma anteriormente conhecida como Twitter, de um filme francês estrelado pela vice-presidente Kamala Harris, Elon Musk, o presidente Joe Biden e o ex-presidente Donald Trump, entre outros. Jack Dorsey interpreta um padeiro que empunha uma baguete, e Tim Cook também faz uma participação especial como um passageiro vertiginoso de bonde.
Este trailer é falso, claro. A paródia gerada por IA, intitulada La Baye Aréa (The Bay Area) e criada por um usuário chamado @trbdrkutilizou uma combinação de ferramentas generativas de IA, incluindo Midjourney 6, Runway Gen-3 e Udio. Muitos usuários comentaram que inicialmente foram enganados pelos impressionantes efeitos de IA.
Comerciais e trailers de filmes gerados por IA têm sido um estímulo popular para usuários que estão experimentando a tecnologia geradora de texto para vídeo. Mas quando comparado com a aparência de um ano atrás, a qualidade da produção melhorou consideravelmente em quase todos os aspectos. Este vídeo é claramente uma paródia, mas não seria exagero imaginar os usuários gerando vídeos que reproduzem circunstâncias realistas, uma habilidade que inspira novas possibilidades – mas que também poderia ter consequências reais.
Como criador em tempo integral que vem mexendo com ferramentas de IA nos últimos anos, aprendi como detectar inteligência artificial em estado selvagem, bem como quais ferramentas provavelmente foram usadas para gerar o conteúdo. Veja como um vídeo como La Baye Aréa pode ser criado e como ficar atento a informações erradas enquanto você navega na Internet.
Vozes
Conheça criadores do setor, colaboradores e líderes emergentes que se uniram à premiada equipe editorial da CNET para fornecer conteúdo exclusivo de diferentes perspectivas.
Ferramentas de IA usadas para criar um vídeo como La Baye Aréa
Um vídeo como La Baye Aréa poderia ser produzido com três ferramentas generativas de IA que os usuários podem acessar agora:
- Pista Gen-3: Runway gera vídeos a partir de linguagem natural e prompts de imagem, e Gen-3 saiu em junho. A Runway fechou um acordo com a Lionsgate no início deste mês.
- Meio da jornada 6. Midjourney é uma plataforma generativa de IA que converte avisos de linguagem natural em imagens. Pode ser útil fazer o storyboard de um vídeo primeiro com imagens e, em seguida, fornecer essas imagens em um prompt para algo como Runway para garantir melhor que você está obtendo o resultado desejado.
- Compartilhar: Ao contrário de Midjourney (imagens) e Runway Gen-3 (vídeo), Compartilhar é especializada na criação musical gerada por IA.
Eu me perguntei como eu faria pessoalmente para recriar um vídeo como este. Aqui está minha tentativa de desconstruir o processo:
- Crie um conceito e um storyboard usando Midjourney.
- Use Runway Gen-3 para transformar essas imagens estáticas em sequências de vídeo.
- Identifique lacunas e transições no conteúdo do vídeo e gere cenas adicionais com Runway Gen-3.
- Use o Udio para criar a trilha sonora e os efeitos sonoros necessários.
- Combine todos os elementos em um software de edição de vídeo escolhido, sincronizando o áudio com o vídeo e produzindo o produto final.
Estas etapas podem parecer simples, mas La Baye Aréa era provavelmente mais sofisticada. Vale destacar também que o vídeo não traz nenhum diálogo, o que teria aumentado o esforço.
Como detectar vídeos gerados por IA
Agora que falamos sobre as ferramentas usadas para criar o vídeo e o possível processo de produção, é hora de treinar nossos olhos e ouvidos para detectar vídeos gerados por IA.
Primeiro, procure sinais visuais, como inconsistências nas expressões faciais, movimentos físicos não naturais ou artefatos e falhas em primeiro plano, plano de fundo ou transição. Você pode identificar facilmente falhas enquanto esses personagens piscam os olhos ou movem os lábios. Por falhas, quero dizer o movimento não natural na forma como eles piscam os olhos, ou as transições entre as piscadas, bem como a forma como movem seus corpos, que às vezes parecem robóticos e inconsistentes. À medida que o vídeo e o áudio da IA melhoram com o tempo, essas falhas serão mais sutis e difíceis de detectar.
Às vezes, você será capaz de detectar uma falha mesmo que não consiga colocá-la em palavras – isso é comum. Um artigo na revista científica Human Movement Science descobriu que os movimentos humanos naturais são criados a partir de uma interação complexa de controle neuromotor, biomecânica e adaptabilidade. Em termos leigos, o movimento humano é sutil e nossos olhos muitas vezes identificam mais do que somos capazes de expressar em palavras.
Em seguida, procure sinais de áudio, como sincronização labial incompatível, ruído de fundo inconsistente ou entonação não natural em padrões ou sotaques de voz. Acho que a entonação costuma ser a pista mais óbvia para mim. A entonação refere-se especificamente à subida e descida do tom da fala. É uma forma de transmitir significado, como distinguir uma pergunta de uma afirmação, e existe em todas as línguas faladas, não apenas no inglês. Os padrões de voz referem-se a uma gama mais ampla de elementos, que podem incluir entonação, mas também coisas como ritmo, tom e pausas para respiração. Depois de notar essas diferenças óbvias e às vezes sutis, será fácil identificar um vídeo gerado por IA.
Por último, você tem dicas contextuais, os elementos que vão além das inconsistências sonoras e visuais. Muitas vezes distinguimos conteúdo falso através da nossa própria experiência, conhecimento e lógica. Em La Baye Aréa, o elenco é absurdo e claramente uma paródia. Mas observe também a diferença de idade entre um personagem e a idade dessa pessoa na vida real. Uma razão para isso é que a IA costuma ser treinada em fotos ou vídeos de anos atrás.
Eventualmente, os vídeos de IA ficarão tão bons que teremos que verificar se tais atores apareceram em certos filmes e outras produções. O IMDB e a pesquisa do Google são recursos disponíveis para muitos de nós para verificação e geralmente é uma boa ideia coletar informações de várias fontes.
Por que é importante detectar vídeos gerados por IA?
Você já deve ter ouvido falar do termo IA responsável, que se refere a um conjunto de princípios que ajudam a orientar o design, o desenvolvimento, a implantação e o uso da IA. Embora La Baye Aréa tenha sido fácil de identificar como um vídeo gerado por IA, o criador também o rotulou claramente como conteúdo de IA. Este reconhecimento é útil para os espectadores sem suposições e especulações.
Mas e se os criadores, organizações e entidades políticas optarem por não divulgar conteúdo de IA? Pode ser um problema real. Como vimos nos últimos anos, a IA não divulgada e os conteúdos fabricados podem levar à erosão da confiança pública, à propagação de desinformação manipulativa e a graves preocupações éticas e jurídicas.
Quanto mais pudermos nos educar sobre o que a IA é atualmente capaz, melhor será para nós como uma comunidade de pensadores instruídos. Tal como as empresas precisam de praticar uma IA responsável, também somos responsáveis por conhecer as suas capacidades e limitações.
Fique por dentro da IA
A boa notícia é que existem maneiras multifacetadas de se manter conectado e informado. Considere aprender algumas ferramentas de IA para sua vida diária. Utilize ferramentas acessíveis e gratuitas como ChatGPT, Perplexity, Claude e Google Gemini para tirar dúvidas e buscar respostas. Além disso, se você é um criador como eu, saiba quais ferramentas de IA os criadores já estão usando.
Espero que este artigo seja útil à medida que continuamos a navegar no mundo crescente da IA. Venha dizer olá no meu Canal do YouTube se quiser saber mais sobre essas ferramentas e serviços no futuro.
As opiniões expressas pelos colaboradores do CNET Voices são próprias.