Nova geração multimodal promete respostas mais precisas, recursos visuais avançados e agentes capazes de executar tarefas complexas, do e-mail ao desenvolvimento de software.
Editoria de Tecnologia da Plataforma Nacional do Facetubes.
O Google apresentou o Gemini 3, descrito pela empresa como sua inteligência artificial mais poderosa até aqui e desenhada para disputar protagonismo direto com modelos como o GPT-5. A nova geração aprofunda a aposta em compreensão multimodal — interpretando, ao mesmo tempo, texto, imagem, áudio e código — e traz um foco declarado em raciocínio de alto nível, com respostas mais precisas, enxutas e livres de bajulação, numa linha semelhante à adotada pela OpenAI em seus modelos mais recentes.
No topo da linha, o Gemini 3 Pro é o modelo pensado para tarefas mais exigentes. Segundo o Google, ele supera com folga o Gemini 2.5 Pro em praticamente todos os testes internos e externos de desempenho em IA, alcançando pontuação recorde de 1.501 pontos e demonstrando raciocínio “em nível de PhD” em benchmarks como o Humanity’s Last Exam e o GPQA Diamond. Na prática, isso se traduz em maior capacidade para resolver problemas complexos em ciência, matemática e cenários que exigem encadeamento lógico sofisticado.
A big tech também reforça o caráter cada vez mais “visual” da plataforma. Em vez de apenas devolver links para vídeos ou artigos, o Gemini 3 é capaz, por exemplo, de transformar um pedido de estudo em flashcards interativos, organizando conteúdo em blocos visuais que aceleram a curva de aprendizado. O mesmo princípio vale para planejamento de tarefas: ao montar um roteiro de viagem, o sistema não se limita ao texto; ele apresenta o itinerário em versões com imagens, vídeos e tabelas, facilitando a tomada de decisão.
Outro eixo estratégico é o avanço dos agentes autônomos. O recurso Gemini Agent surge como um laboratório de agente de IA capaz de, entre outras funções, organizar automaticamente a caixa de entrada de e-mail do usuário. Em um nível ainda mais sofisticado, a plataforma Google Antigravity permite que agentes baseados no Gemini planejem e executem, de ponta a ponta, tarefas complexas de software: eles acessam editor, terminal e navegador, escrevem e validam o próprio código, abrindo caminho para fluxos de desenvolvimento cada vez menos manuais.
No ecossistema de busca, o chamado “modo IA” do Google Search incorpora a função “thinking”, concebida para oferecer raciocínios mais profundos em consultas que exigem síntese, comparação de fontes ou montagem de planos de ação. Com o Gemini 3, o Google tenta sinalizar que a disputa entre grandes modelos de linguagem entra em uma nova fase: menos centrada em demonstrações pontuais de brilho e mais na entrega consistente de agentes digitais capazes de compreender contexto, tomar decisões e executar tarefas em nome do usuário.
Foto: prompts MHL c/ginAI do Facetubes

Mín. 13° Máx. 20°