Uncategorized

IA entende melhor o mundo físico e ajuda carros autônomos

11/06/2025

Tudo sobre Inteligência Artificial

Nesta quarta-feira (11), a Meta anunciou novo “modelo mundial” de inteligência artificial (IA) que pode entender melhor o ambiente ao nosso redor e movimentos dos objetos físicos. O modelo, de código aberto, se chama V-JEPA 2 e, segundo a big tech, é capaz de entender, prever e, até, planejar no mundo físico.

Janela do Meta AI aberta no Safari num Mac — IA mundial pode auxiliar veículos autônomos (Imagem: Tada Images/Shutterstock)

Como funciona o “modelo mundial” de IA?

Um modelo mundial, como esse novo da Meta, se inspira na lógica aplicada ao mundo físico para construir sua própria simulação;
Isso permite à IA aprender a planejar e tomar decisões no mundo físico como se fosse um ser humano;
No caso do V-JEPA 2, treinado com mais de um milhão de horas de vídeo e um milhão de imagens, ele consegue reconhecer que uma bola rolando de uma mesa irá cair, ou que um objeto que esteja fora do campo de visão não desapareceu;
Segundo a Meta, o modelo de IA também é capaz de ser usado para o planejamento de robôs de disparo zero, visando interagir com objetos desconhecidos em novos ambientes.

O sistema conta com 1,2 milhão de parâmetros, construído com o uso da Meta Joint Embedding Predictive Architecture (JEPA) e “melhora a previsão de ação e os recursos de modelagem mundial que permitem que os robôs interajam com objetos e ambientes desconhecidos para concluir uma tarefa”.

Robô de entregas na rua — Robôs e veículos podem ser beneficiados pela tecnologia (Imagem: miss.cabul/Shutterstock)

Leia mais:

Agentes de inteligência artificial podem se beneficiar dessa tecnologia? E outros sistemas?

Na visão da Meta, os modelos mundiais abrirão caminho para os agentes de IA planejarem e raciocinarem no mundo físico. Além disso, segundo a empresa, o modelo mundial pode beneficiar máquinas, como robôs de entrega e carros autônomos. Tais máquinas precisam ter noção do que ocorre ao seu redor para conseguirem navegar.

Para conseguir isso, o V-JEPA 2 não precisa de grandes quantidades de dados rotulados ou imagens de vídeo, pois ele raciocina em espaço “latente” simplificado com vistas a compreender a movimentação, interação e resposta de objetos em nosso mundo físico.

Em vídeo na conferência Viva Tech, em Paris (França), Yann LeCunn, cientista-chefe de IA da Meta, afirmou que “permitir que as máquinas entendam o mundo físico é muito diferente de permitir que elas entendam a linguagem”.

Nova IA da Meta se baseia em milhões de horas de vídeo e milhões de imagens (Imagem: Algi Febri Sugita/Shutterstock)

“Um modelo mundial é como um gêmeo digital abstrato da realidade que uma IA pode fazer referência para entender o mundo e prever as consequências de suas ações e, portanto, seria capaz de planejar um curso de ação para realizar uma determinada tarefa“, prosseguiu.

Ativistas sobre segurança na internet estão preocupados com planos da Meta que envolvem inteligência artificial (IA). Isso porque a big tech de Mark Zuckerberg estaria planejando usar a tecnologia para automatizar verificações de riscos nas suas plataformas (Facebook, Instagram, Threads).

Leia a matéria completa aqui