O novo modelo o1 da OpenAI é mais lento, de propósito


OpenAI tem revelado seu mais recente modelo de inteligência artificial chamado o1, que, segundo a empresa, pode executar tarefas complexas de raciocínio de forma mais eficaz do que seus predecessores. O lançamento acontece no momento em que a OpenAI enfrenta uma competição cada vez maior na corrida para desenvolver sistemas de IA mais sofisticados.

O O1 foi treinado para “passar mais tempo pensando nos problemas antes de responder, assim como uma pessoa faria”, disse a OpenAI em seu site. “Por meio do treinamento, [the models] aprendam a refinar seu processo de pensamento, tentem estratégias diferentes e reconheçam seus erros.” A OpenAI prevê que o novo modelo será usado por pesquisadores da área da saúde para anotar dados de sequenciamento de células, por físicos para gerar fórmulas matemáticas e por desenvolvedores de software.

Os sistemas de IA atuais são essencialmente versões mais sofisticadas do autocompletar, gerando respostas por meio de estatísticas em vez de realmente “pensar” em uma pergunta, o que significa que eles são menos “inteligentes” do que parecem ser. Quando o Engadget tentou fazer com que o ChatGPT e outros chatbots de IA resolvessem o New York Times No Spelling Bee, por exemplo, eles se atrapalharam e produziram resultados sem sentido.

Com o o1, a empresa afirma que está “reiniciando o contador de volta para 1” com um novo tipo de modelo de IA projetado para realmente se envolver em resolução de problemas complexos e pensamento lógico. Em um postagem de blog detalhando o novo modelo, a OpenAI disse que ele tem desempenho similar ao de alunos de doutorado em tarefas de benchmark desafiadoras em física, química e biologia, e se destaca em matemática e codificação. Por exemplo, seu modelo principal atual, GPT-4o, resolveu corretamente apenas 13 por cento dos problemas em um exame de qualificação para a Olimpíada Internacional de Matemática, em comparação com o o1, que resolveu 83 por cento.

O novo modelo, no entanto, não inclui recursos como navegação na web ou a capacidade de carregar arquivos e imagens. E, de acordo com A Beiraé significativamente mais lento no processamento de prompts em comparação ao GPT-4o. Apesar de ter mais tempo para considerar suas saídas, o o1 não resolveu o problema das “alucinações” — um termo para modelos de IA que criam informações. “Não podemos dizer que resolvemos alucinações”, disse o diretor de pesquisa da empresa, Bob McGrew A Beira.

O O1 ainda está em estágio inicial. A OpenAI o chama de “prévia” e o está disponibilizando apenas para clientes pagantes do ChatGPT a partir de hoje, com restrições sobre quantas perguntas eles podem fazer por semana. Além disso, a OpenAI também está lançando o o1-mini, uma versão simplificada que a empresa diz ser particularmente eficaz para codificação.



Source link