10 июля по пекинскому времени, после часа ожидания, Маск наконец раскрыл тайну новейшего шедевра xAI - Grok 4, который Маск назвал "самым умным в мире ИИ". Эта модель, которую Маск назвал "самым умным в мире ИИ", сразу после выхода установила новые рекорды в основных бенчмарк-тестах и стала первой моделью ИИ, преодолевшей отметку точности 50% в "последнем экзамене человека" (HLE).

Арифметическая шкала: беспрецедентное количество учебных материалов
Масштабы обучения Grok 4 отражают огромные инвестиции xAI в инфраструктуру ИИ с беспрецедентным уровнем распределения вычислительных мощностей:
Конфигурация инфраструктуры
| Конфигурация оборудования | Технические характеристики | Распределение использования |
|---|---|---|
| Кластеры для предварительного обучения | 100 000 графических процессоров H100 | Обучение базовым моделям |
| Кластер расширенного обучения | 200 000 листов смеси H100/A100 | Тонкая настройка RL и оптимизация выводов |
| общая вычислительная мощность (TCP) | Суперкомпьютерный центр "Колосс | Полноценное обучение искусственному интеллекту |
| соотношение продолжительности обучения | В 100 раз лучше, чем Grok 2 | Итерация глубокого обучения |
| Коэффициент расчета RL | 10-кратное улучшение по сравнению с Grok 3 | Специализированный для интенсивного обучения |
Маск рассказал, что xAI вкладывает в обучение с подкреплением почти столько же арифметики, сколько в предварительное обучение, - такой подход к обучению, основанный на "двух двигателях", крайне редок в индустрии. Команда обучила модель думать, рассуждать и самокорректироваться на основе первых принципов, что является основным источником способности серии Grok к рассуждениям.

Эволюция архитектуры обучения
Парадигма обучения семейства Grok претерпела значительную эволюцию:
| версия модели | Основные технологические парадигмы | Распределение вычислительных ресурсов | Основные прорывы |
|---|---|---|---|
| Грок 2 | Предсказание следующего токена | Основное внимание уделяется базовой предварительной подготовке | Увеличение масштаба |
| Грок 3 | Предварительное обучение + предварительная RL | 10-кратное увеличение арифметических навыков до обучения | Введение навыков рассуждения |
| Грок 4 | Слияние родных инструментов + крупномасштабный RL | Арифметика RL увеличилась еще в 10 раз | Использование инструментов и мультиинтеллектуальность |

Основная технологическая архитектура: инновационный дизайн для интеграции
Механизм обучения интеграции инструментов
Самым большим технологическим новшеством Grok 4 является интеграция возможностей использования инструментов непосредственно в процесс обучения, а не традиционный подход "после интеграции":
| Технические характеристики | Традиционные программы | Программа Grok 4 | повышение производительности |
|---|---|---|---|
| Метод вызова инструмента | Интеграция Post API | Интеграция родного обучения | Повышение эффективности в 3-5 раз |
| кривая обучения | Период резкой адаптации | плавный рост | Лучшая согласованность |
| масштабируемость | ограниченный интерфейсом | бесшовная интеграция | Поддержка сложных цепочек инструментов |
| последовательность рассуждений | с лёгкими ошибками | Сплошная оптимизация | Снижение коэффициента ошибок 40% |
Такая конструкция позволяет Grok 4 изучать, когда, как и зачем использовать конкретные инструменты во время обучения, а не просто вызывать внешние API.
Мультиразведывательная система взаимодействия
Grok 4 Heavy использует параллельный режим работы с несколькими интеллектами и имеет следующие технические характеристики:
| Параметры совместной работы | техническая спецификация | Рабочие механизмы |
|---|---|---|
| Количество параллельных интеллектов | До 32 | Одновременное лечение одной и той же проблемы |
| Стратегии ветвления в рассуждениях | дерево глубокого поиска | Каждая ветвь исследуется независимо |
| Механизмы совместной проверки | Алгоритмы перекрестной валидации | Межведомственная проверка |
| выбор оптимального решения | Интегрированное обучение Fusion | Генерация глобальных оптимальных ответов |
| Расчет расширений во время тестирования | Регулируется от 1× до 32× | Динамически подстраивается под сложность задачи |
Эта "команда аспирантов, работающих в группах", увеличила точность одного умного тела 40% до более чем 50%.

Параметры работы модели
| Основные показатели | Технические характеристики Grok 4 | Сравнение отраслей |
|---|---|---|
| Длина контекста | 256K токенов | Стандарты корпоративных приложений |
| Номер версии API | grok-4-0709 | Последняя стабильная версия |
| скорость вывода | 75 жетонов/секунду | За Клодом 4 Опус (66 жетонов/секунду) |
| Оптимизация задержки | Сокращение вдвое | Голосовое взаимодействие в режиме реального времени |
| одновременная обработка | Поддержка многопользовательского режима с высокой степенью параллелизма | Готовность к коммерциализации |
| эпоха моделирования | Инфраструктура 7-го поколения | Новейший стек технологий xAI |


Бенчмаркинг производительности: ведущий интеллект во всем мире
Академические навыки и навыки рассуждения
Grok 4 доказывает свой "постдокторский уровень" интеллекта, показывая высокие результаты в самых престижных тестах:
| Категория испытаний | Конкретные контрольные показатели | Оценка Grok 4 | Grok 4 Heavy | Сравнение уровней докторской степени для людей |
|---|---|---|---|---|
| общая тема | HLE (Human Legacy Examination) | 38.6% | 44.4% | Больше, чем большинство аспирантов |
| математический конкурс | AIME25 | 100% | 100% | уровень полной отметки |
| Команда по математике | HMMT25 | 96.7% | 96.7% | Высший уровень соревнований |
| Вопросы и ответы аспирантов | GPQA | 88.9% | 88.9% | Докторантура начального уровня |
| олимпиада по математике | USAMO25 | 61.9% | 61.9% | Международный уровень соревнований |
| конкурс программистов | LCB (январь-май) | 79.4% | 79.4% | Уровень профессионального программиста |

Оценка основных компетенций AGI
Grok 4 также преуспел в ключевом тесте General AI:
| Предметы теста AGI | Производительность Grok 4 | техническое значение | Сравнение с конкурентами |
|---|---|---|---|
| ARC-AGI-2 | 15.9% | Первая коммерческая модель, разбившая 10% | В 12 раз выше, чем у DeepSeek R1 |
| ARC-AGI-1 | 66.7% | Способность обобщать известные закономерности | Превзошел GPT-4 почти на 6 процентных пунктов |
| коэффициент экономической эффективности | оптимальный | Самый умный в пересчете на доллар | Лучшее в отрасли соотношение цены и качества |

Специальные сценарии испытаний
В ряде уникальных тестовых сценариев Grok 4 продемонстрировал способность превзойти традиционный ИИ:
| тестовый сценарий | конкретное выражение | Технические последствия |
|---|---|---|
| Бизнес-тест с вендинговым стендом | Чистая стоимость в два раза больше, чем у второго места | Способность принимать долгосрочные бизнес-решения |
| RKG Drug Discovery | Единственная модель, которая разбила 10% | биомедицинские рассуждения |
| Сложное физическое моделирование | Успешное моделирование столкновений черных дыр | Развитые навыки научных вычислений |

Стратегия ценообразования и коммерциализации
У xAI есть четкая стратегия позиционирования Grok 4 на высоком уровне:
| уровень обслуживания | Ежемесячное ценообразование | Цены на годовую плату | Основные функциональные различия |
|---|---|---|---|
| SuperGrok | $30 | $300 | Одноместный интеллектуальный кузов Стандартная версия |
| SuperGrok Heavy | $300 | $3,000 | Мультиинтеллектуальное издание для совместной работы |
Такая ценовая стратегия позиционирует Grok 4 как высококлассный сервис искусственного интеллекта для корпоративных и профессиональных пользователей: годовая плата за Heavy-версию составляет до 21 500 китайских юаней.

Перспективы применения и интеграция в промышленность
Grok 4 будет быстро интегрирован в промышленную экосистему Маска: голосовой помощник был интегрирован в последнюю прошивку Tesla, а робот Optimus будет оснащен Grok как мозгом ИИ. xAI планирует выпустить специальные модели программирования, мультимодальные агенты и модели генерации крупномасштабного видео один за другим в течение следующих нескольких месяцев, чтобы создать полную матрицу продуктов ИИ.
Grok 4 занял лидирующие позиции в соревнованиях по искусственному интеллекту благодаря арифметическому преимуществу 200 000 кластеров GPU и технологической инновации слияния нативных инструментов. Его ошеломляющая производительность в бенчмарках, особенно в сложных задачах, требующих глубоких рассуждений, знаменует собой значительный шаг на пути к "сверхчеловеческому интеллекту". Хотя высокая цена ограничивает его популярность, Grok 4 предлагает самый мощный вариант на рынке на сегодняшний день для профессиональных пользователей, стремящихся к максимальной мощности ИИ.

Если вы хотите использовать официальный платный эксклюзивный аккаунт GPT Plus, Claude Pro, Grok Super, вы можете связаться с нашей профессиональной командой (wx: f15303420735), если вы не знаете, как пополнить счет.