У Google есть еще один хит в руках: как Gemini 2.5 Pro Experimental пересматривает границы инструментов для повышения производительности с помощью искусственного интеллекта

I. Введение

Пекин, 26 марта. Недавно выпущенная компанией Google модель Gemini 2.5 Pro Experimental была названа самой передовой моделью искусственного интеллекта на сегодняшний день. Будучи первым представителем долгожданной серии "Мыслящих моделей" Google, она обеспечивает контекстное окно до 1 миллиона жетонов и ряд впечатляющих улучшений производительности. Это означает способность обрабатывать одновременно эквивалент двух книг "Сна в Красной палате".

В тесте "Последний экзамен для человека" он показал наивысший результат - 18,81 TP3T, что является лучшим показателем среди всех неиспользуемых (внешних) больших моделей. "Последний экзамен для человека" - это мультимодальный эталонный тест, разработанный почти 1 000 экспертов со всего мира для оценки пределов возможностей больших языковых моделей. Тест состоит из 3 000 передовых вопросов, охватывающих широкий спектр областей, включая математику, гуманитарные и естественные науки.

Gemini 2.5 Pro также занял первое место в тесте Big Model Arena с рекордным отрывом, совершив самый большой скачок в истории, опередив Grok-3 и GPT-4.5 более чем на 40 очков.

 

Джефф Дин, главный научный сотрудник Google Deepmind, написал в своем блоге: "Наша модель Gemini 2.5 Pro значительно улучшена по сравнению с серией Gemini 2.0. Приятно видеть, что она со значительным отрывом возглавляет чарты LiveBench".

Во-вторых, какие аспекты преимущества Gemini 2.5 Pro Experimental делают скачок вперед?

1. Reasoning Power Pro Max Edition

На официальном сайте Google говорится, что Gemini 2.5 Pro лидирует в ряде тестов, требующих глубоких рассуждений. Не требуя дополнительных затрат на проведение экзаменов, таких как голосование по большинству голосов, Gemini 2.5 Pro лидирует в таких математических и естественно-научных тестах, как GPQA и AIME 2025.

Например, мы можем построить вывод QED с помощью текстовых подсказок и подробных заметок:

Другой пример - когда вы хотите не лениться и позволить 2.5 Pro помочь вам написать работу с меньшими усилиями:
@Dr.Novo:Gemini 2.5 pro только что помог мне закончить 15-страничную научную работу "Гибридные модели для понимания нейронных преобразований из непрерывных в дискретные" в LaTex, дословно! Это сэкономило мне несколько часов пота!Я попробовал все другие модели, и все они потерпели неудачу на 20% mission progress .......

2. Возможность кодирования версии Pro Max

Официально Google заявляет, что Gemini 2.5 Pro Experimental - это огромный скачок вперед по сравнению с версией 2.0 и еще больше улучшений. 2.5 Pro отлично справляется с созданием визуально привлекательных веб-приложений и приложений с агентским кодом, а также с преобразованием и редактированием кода. В SWE-Bench Verified, отраслевом стандарте оценки прокси-кода, Gemini 2.5 Pro набрал 63,8% с пользовательскими настройками прокси.

В частности, 2.5 Pro может использовать свои мыслительные способности для создания видеоигр, генерируя исполняемый код из однострочного запроса.

Джефф Дин также опубликовал в Twitter код, написанный моделью Gemini 2.5 Pro по запросу "p5js exploring the Mandelbrot set":

III. 2.5 Pro One-Click Руководство пользователя

В целом, 2.5 Pro захватывает явные команды и выполняет их с точностью, позволяющей создавать полноценные архитектуры сайтов.

Чтобы просто и эффективно использовать 2.5 Pro, вы можете воспользоваться тремя следующими способами:

1, Google Official:http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

2. Рубашка AI:https://www.myshirtai.com/signup

3. вызов API:https://api.mygptmeta.com/

По совпадению, Deepseek v3.1 и 2.5 Pro были выпущены с разницей всего в 30 часов. Многие пользователи сети провели сравнение:

Мы также попросили обеих моделей "написать html-скрипт, иллюстрирующий прыгающий мяч во вращающемся 4D-тессеракте. Когда мяч касается какой-либо стороны, выделите эту сторону". С точки зрения фактического представления обе модели имеют свои особенности, и обе способны точно выполнить инструкции пользователя. Но в сравнении с ними 2.5 Pro имеет более минималистичный стиль и лучше справляется с задачей наглядности.
Различные сценарии работы и обучения имеют разные требования, и мы можем выбрать наиболее подходящую модель в соответствии с деталями, чтобы повысить производительность.

Если вы хотите использовать Gemini 2.5 Pro, GPT Plus, Claude Pro, Grok Super официальный платный эксклюзивный аккаунт, вы можете связаться с нашей профессиональной командой, если вы не знаете, как пополнить счет (wx: f15303420735).

Для получения дополнительной продукции, пожалуйста, ознакомьтесь с

См. подробнее

ShirtAI - проникающий интеллект Большая модель AIGC: начало эры двойной революции в инженерном деле и науке - Проникающая разведка
1:1 Восстановление Клода и GPT Официальный сайт - AI Cloud Native Приложение для просмотра прямых трансляций матчей Global HD Sports Viewing Player (рекомендуется) - Blueshirt Technology
Транзитный сервис на основе официального API - GPTMeta API Помогите, может ли кто-нибудь из вас дать несколько советов о том, как задавать вопросы на GPT? - знание
Глобальный цифровой магазин виртуальных товаров - Global SmarTone (Feng Ling Ge) Насколько мощной является функция Claude airtfacts, что GPT мгновенно перестает хорошо пахнуть? -BeepBeep