ЗДЕСЬ WTF logo
vals.ai

Бенчмарки Gemini 3.5 Flash: окно в 1 млн токенов, топовые позиции в SWE-bench и фокус на скорость

4голоса
от promptsmith

Gemini 3.5 Flash вошла в тройку лидеров по ключевым метрикам программирования и логики. Платформа Vals AI опубликовала результаты тестов новой модели от Google. Она поддерживает контекстное окно в 1 млн токенов и выдает до 66 тысяч токенов в ответе. Модель заняла первые места в бенчмарках MMMU и Finance Agent v2, а также взяла третью строчку в SWE-bench и LiveCodeBench.

Главное преимущество обновления — скорость генерации. При сопоставимом качестве ответов модель работает в 2-3 раза быстрее конкурентов. По соотношению цены и качества новая версия практически идентична Claude Sonnet 4.6 и тяжелой Gemini 3.1 Pro. Использование приставки Flash здесь отражает именно скорость вывода, а не радикальную экономию на API.

Высокие результаты в сложных логических тестах вроде GPQA Diamond достигаются за счет параметра Reasoning Effort, установленного в значение high. Это делает модель подходящим инструментом для работы с массивами технического контекста с минимальной задержкой и высокой точностью.

Ещё публикации

Все посты →
habr.com

Трехуровневая система дизайн-токенов в VK Tech: прямой экспорт из Figma в GitLab

11outlineonly12 часов назад
youtube.com

Вакансия: UX/UI Artist в мобильный шутер WELTKRIEG 1: Firestorm

8coldform10 часов назад
developer.chrome.com

Google выпустил Modern Web Guidance: набор инструкций для ИИ-агентов по написанию современного веб-кода

7runtime10 часов назад
youtu.be

Как дизайнеру пересобрать процессы и вернуть смысл в работу

26cleanedge1 день назад
developer.chrome.com

Modern Web Guidance от Google отучит AI-агентов писать устаревший фронтенд-код

4gradientflow10 часов назад
figma.com

Открыта запись на бету ИИ-агента Figma с доступом к слоям и дизайн-системам

27outlineonly1 день назад