A Nvidia lançou seu poderoso modelo de inteligência artificial de código aberto que pode superar modelos como o GPT-4 da OpenAI.
A nova família NVLM 1.0 de modelos de linguagem grande multimodais (LLMs) de código aberto da empresa, com seu modelo principal, NVLM-D-72B, tem cerca de 72 bilhões de parâmetros.
De acordo com a equipe de pesquisa da Nvidia, o novo modelo de IA se destaca em tarefas de linguagem de visão, ao mesmo tempo que mantém e até melhora o desempenho somente de texto em comparação com seus backbones LLM. Em seu papelos pesquisadores afirmam: “Apresentamos o NVLM 1.0, uma família de modelos de linguagem multimodais de classe de fronteira que alcançam resultados de última geração em tarefas de linguagem de visão, rivalizando com os principais modelos proprietários (por exemplo, GPT-4o) e modelos de acesso aberto.”
Ao contrário de alguns outros modelos proprietários, onde há um declínio significativo no desempenho do texto ao longo do tempo, o NVLM-D-72B supostamente aumentou sua precisão em uma média de 4,3 pontos nos principais benchmarks de texto.
O LLM também foi capaz de interpretar gráficos e tabelas, analisar imagens, entender memes, codificar softwares, bem como resolver problemas matemáticos. Os pesos do modelo estão disponíveis publicamente no Hugging Face e a Nvidia diz que eventualmente lançará o código de treinamento.
O que a comunidade de IA pensa do modelo NVLM da Nvidia
Os pesquisadores de IA do X chamaram o lançamento de “selvagem” e elogiaram sua capacidade de compreender dados visuais. Um usuário escreveu: “Uau! A Nvidia acaba de publicar um modelo 72B que está no mesmo nível do lhama 3.1 405B em avaliações matemáticas e de codificação e também tem visão?
NVLM da NVIDIA é incrível. E aberto. Confira. pic.twitter.com/r9V8uamGVf
– Alex Zhavoronkov, PhD (também conhecido como Alexander Zavoronkov) (@biogerontology) 2 de outubro de 2024
Uau. Novo modelo NVIDIA 72B rivaliza com o 405B da Llama!
pic.twitter.com/TUZ378S4tz
-Jeremy Howard (@jeremyphoward) 1º de outubro de 2024
Uau, a nvidia acaba de publicar um modelo 72B que está no mesmo nível do lhama 3.1 405B em avaliações matemáticas e de codificação e também tem visão
pic.twitter.com/c46DeXql7s
-Phil (@phill__1) 1º de outubro de 2024
Dito isto, a própria Nvidia supostamente usou recursos de código aberto para desenvolver o NVLM 1.0, obtendo insights de outros modelos de IA e vários dados de treinamento. No entanto, o modelo NVLM-D-72B é restrito pelos termos de licenciamento. Não pode ser usado para fins comerciais ou modificado para revenda. Essencialmente, a Nvidia está fornecendo o modelo exclusivamente para fins de pesquisa e para amadores ansiosos por testar os limites de suas placas gráficas de última geração.
O uso do termo “aberto” pelos pesquisadores é, portanto, bastante intencional. Embora as descobertas da Nvidia agreguem valor, as restrições ao uso comercial significam que ele não pode ser considerado verdadeiramente de código aberto, o que exigiria a liberdade de usar, modificar e distribuir o modelo sem quaisquer limitações.
ReadWrite entrou em contato com a Nvidia para comentar.
Imagem em destaque: meio da jornada
O posto Nvidia revela seu novo modelo NVLM 1.0 AI, rivalizando com modelos como o GPT-4 da OpenAI, apareceu pela primeira vez no ReadWrite.