A Google tem outro sucesso em mãos: como o Gemini 2.5 Pro Experimental está a redefinir os limites das ferramentas de produtividade de IA

I. Introdução

Pequim, 26 de março, o recém-lançado Gemini 2.5 Pro Experimental da Google acaba de ser aclamado como o modelo de IA mais avançado até à data. Como membro inaugural da muito aguardada série "Thinking Models" da Google, traz uma janela de contexto de até um milhão de tokens e uma série de melhorias de desempenho impressionantes. Isto traduz-se na capacidade de processar o equivalente a dois livros do Sonho da Câmara Vermelha de uma só vez.

No teste "Last Human Exam", obteve a pontuação mais elevada de 18,81 TP3T, que é de longe a melhor pontuação de qualquer modelo de grande dimensão não utilizado (com ferramentas externas). O "Last Human Exam" é um teste de referência multimodal concebido por cerca de 1000 peritos de todo o mundo para avaliar os limites das capacidades dos modelos de linguagem de grande dimensão. O teste consiste em 3000 perguntas de ponta que abrangem uma vasta gama de domínios, incluindo a matemática, as ciências humanas e as ciências naturais.

O Gemini 2.5 Pro também ficou em primeiro lugar no teste Big Model Arena por uma margem recorde, dando o maior salto de pontuação da história, superando o Grok-3 e o GPT-4.5 em mais de 40 pontos.

 

Jeff Dean, cientista-chefe da Google Deepmind, escreveu num blogue: "O nosso modelo Gemini 2.5 Pro é uma melhoria significativa em relação à série Gemini 2.0. É ótimo vê-lo a liderar as tabelas do LiveBench por uma margem considerável".

Em segundo lugar, que aspectos do vantajoso Gemini 2.5 Pro Experimental representam um salto em frente?

1) Reasoning Power Pro Max Edition

O sítio Web oficial da Google afirma que o Gemini 2.5 Pro é líder numa série de testes de referência que requerem raciocínio avançado. Sem técnicas de custo acrescido em tempo de exame, como a votação por maioria, o 2.5 Pro lidera em testes de matemática e ciências, como o GPQA e o AIME 2025.

Por exemplo, podemos construir uma derivação da DEQ com sugestões de texto e notas de estudo pormenorizadas:

Outro exemplo é quando quer ser preguiçoso e deixar que o 2.5 Pro o ajude a escrever o seu trabalho com menos esforço:
@Dr.Novo:O Gemini 2.5 pro acabou de me ajudar a terminar o meu trabalho de investigação de 15 páginas sobre "Modelos híbridos para compreender as transformações neurais contínuas para discretas" em LaTex, literalmente! Isso me poupou horas de suor!Tentei todos os outros modelos e todos falharam no progresso da missão 20% ......

2) Capacidade de codificação da versão Pro Max

Oficialmente, o Google diz que o Gemini 2.5 Pro Experimental dá um grande salto em relação à versão 2.0, com mais melhorias por vir. O 2.5 Pro se destaca na criação de aplicativos da Web visualmente atraentes e aplicativos de código de agente, bem como na transformação e edição de código. No SWE-Bench Verified, o padrão do setor para avaliação de código proxy, o Gemini 2.5 Pro obteve 63,8% com configurações de proxy personalizadas.

Especificamente, o 2.5 Pro é capaz de utilizar as suas capacidades de raciocínio para criar jogos de vídeo, gerando código executável a partir de uma única linha de comando.

Jeff Dean também postou no Twitter mostrando o código escrito pelo modelo Gemini 2.5 Pro no prompt "p5js exploring the Mandelbrot set":

III. 2.5 Manual do utilizador do Pro One-Click

Em geral, o 2.5 Pro capta comandos explícitos e executa-os com precisão, com a capacidade de construir arquitecturas completas de sítios Web.

Para utilizar o 2.5 Pro de forma fácil e eficiente, pode seguir diretamente os três caminhos seguintes:

1, Google Oficial:http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

2. IA da camisola:https://www.myshirtai.com/signup

3. chamada API:https://api.mygptmeta.com/

Coincidentemente, o Deepseek v3.1 e o 2.5 Pro foram lançados com quase 30 horas de diferença. Muitos internautas fizeram comparações:

Pedimos também a ambos os modelos que "escrevessem um script html que ilustrasse uma bola a saltar num tesseract 4D em rotação. Quando a bola tocar num lado, realce esse lado". Em termos de apresentação real, ambos os modelos têm as suas próprias caraterísticas e ambos são capazes de cumprir com precisão as instruções do utilizador. Mas, em comparação, o 2.5 Pro tem um estilo mais minimalista e fará um melhor trabalho de visibilidade.
Diferentes cenários de trabalho e de aprendizagem têm requisitos diferentes, e podemos escolher o modelo mais adequado de acordo com os pormenores para melhorar a produtividade.

Se quiser utilizar a conta exclusiva paga oficial Gemini 2.5 Pro, GPT Plus, Claude Pro, Grok Super, pode contactar a nossa equipa de profissionais se não souber como carregar a sua conta (wx: f15303420735).

Para mais produtos, consultar

Ver mais em

ShirtAI - Inteligência penetrante O Grande Modelo do AIGC: inaugurando uma era de dupla revolução na engenharia e na ciência - Penetrating Intelligence
1:1 Restauração de Claude e GPT Site oficial - AI Cloud Native Aplicação de jogos em direto Leitor de visualização de desporto HD global (recomendado) - Blueshirt Technology
Serviço de trânsito baseado na API oficial - API GPTMeta Ajuda, alguém pode dar algumas dicas sobre como fazer perguntas no GPT? - Conhecimento
Loja digital de bens virtuais globais - Global SmarTone (Feng Ling Ge) Quão poderosa é a funcionalidade Claude airtfacts que o GPT instantaneamente não cheira bem? -BeepBeep