Gemini Live já consumiu Google Assistantcorpo e alma. Agora, a IA que fala com você deverá estar disponível para todos os usuários a partir de terça-feira. EUSe você não se importa com um assistente de IA baseado em telefone, a Microsoft está oferta recursos semelhantes no Windows 11 por meio do Copilot. Se você está ansioso para replicar o filme de Spike Jonze Dela com seu telefone ou computador, esses programas podem oferecer sua primeira – mas provavelmente não a última – oportunidade de ficar um pouco íntimo demais com seus dispositivos.
Gemini Live pode ser acessado no Android pressionando longamente o botão liga / desliga. Em vez de receber o ícone normal do Assistente, os usuários agora verão o ícone da estrela azul Gemini aparecer. O Gemini já é capaz de compreender o que está acontecendo na tela, caso você queira fazer perguntas sobre um vídeo do YouTube que está assistindo. Também é capaz de gerar rapidamente imagens de IA em qualquer aplicativo de texto que você esteja usando no momento. O Google exibiu pela primeira vez o Gemini Live ao lado de seu Linha do Pixel 9 em agosto, durante seu Evento feito pelo Google.
Anteriormente, o Gemini Live estava disponível apenas para quem pagava pelo Gemini Advanced. Esse serviço é gratuito no primeiro mês, mas custa US$ 20 por mês depois. Se você segurar o botão liga / desliga, verá um pop-up com um ícone no canto inferior direito permitindo usar o Gemini Live. Você precisa aceitar um tutorial de uma página e escolher uma voz em uma seleção de dialetos ingleses com sons masculinos e femininos antes de começar a incomodar seu telefone com suas perguntas fúteis.
O Live agora está disponível para todos os usuários do Gemini em inglês no aplicativo Android. Mal podemos esperar para você experimentar.
– Aplicativo Google Gemini (@GeminiApp) 30 de setembro de 2024
Através da interface, você poderá falar “naturalmente” ao telefone e não precisará se preocupar com erros de fala, frases estranhas ou sotaques que possam ter atrapalhado o Google Assistente. O Gemini Live deve ter acesso a uma ampla variedade de tarefas em seu telefone, incluindo a interação entre vários aplicativos, como mensagens e e-mail.
Na terça-feira, a Microsoft declarou que o Copilot está recebendo atualizações significativas e semelhantes que permitirão compreender o que está acontecendo na sua tela. Esse recurso é chamado de Copilot Vision e, na atualização mais recente do Windows, ele reconhecerá o texto ou vídeo que você está vendo na tela, permitindo que os usuários façam mais perguntas sobre esse conteúdo. Ou, como no vídeo promocional da Microsoft, você pode ter uma conversa muito estranha sobre fotos da sua avó com um chatbot de IA indiferente e inabalável.
“Sua avó tem um estilo tão atemporal”, diz o Copilot AI da Microsoft a Andrew, soando de alguma forma insincero, mesmo para uma IA. “Parece que ela é… uhh… uma pessoa bastante notável.”
Depois, há o Copilot Voice, um recurso semelhante ao Gemini Live que pode ser acessado em seu telefone por meio do aplicativo Copilot. Em seu blog, a Microsoft mostrou como você pode solicitar ao Copilot conselho sobre comprar azeites sofisticados. Infelizmente, não detalha os aspectos muito matizados dos azeites, sobre as importações, como as diferentes marcas podem na verdade ser misturas de exportações de vários países, sobre os tipos de azeites mais utilizados para temperar e não para cozinhar.
Você também precisa considerar as implicações de segurança de ambos os recursos de IA. Gemini Live liga automaticamente o microfone do seu telefone. Você precisa manter pressionados os botões Hold ou End ou dizer “Stop” para sair da gravação automática. O processamento do Gemini é salvo em sua atividade no Gemini Apps e essas conversas são salvas por 72 horas, de acordo com o Google página de privacidade.
A Microsoft disse que o Copilot Vision não salva nenhum dado na nuvem ou no seu computador e “no momento em que você encerra a sessão, os dados são descartados permanentemente”. Para começar, ele também funcionará com uma lista limitada de sites e não funcionará em nenhum conteúdo contido atrás de um acesso pago. A Microsoft provavelmente não quer ser criticada novamente por suas más decisões de privacidade, como aconteceu com Copiloto + recall ou negociar com editores on-line e alguns membros do Congresso chateado porque a Big Tech descartou seu conteúdo para desenvolver seus modelos de IA.
Ambos os recursos do Google e da Microsoft são gratuitos, pelo menos por enquanto. O Copilot Voice está sendo lançado lentamente para os usuários a partir de terça-feira, mas o Copilot Vision pode estar restrito a um número limitado de usuários beta do Copilot Labs.