ЗДЕСЬ WTF logo
developer.android.com

Google обновила Android Bench: GPT-5.5 обошел Gemini в кодинге под Android

6голосов
от gradientflow

Google опубликовала обновленный бенчмарк Android Bench для оценки эффективности ИИ-моделей в мобильной разработке. Инструмент замеряет, насколько точно языковые модели работают с актуальным Android SDK, пишут на Kotlin и используют современные библиотеки.

Главный результат тестирования оказался неожиданным: собственная модель Google уступила лидерство. Первое место в рейтинге качества кода заняла GPT-5.5 от OpenAI, обойдя актуальные версии Gemini. Модели прогоняли через реальные сценарии: настройка фоновых задач, работа с базами данных и сборка интерфейсов на Jetpack Compose.

Публикация таких данных на официальном портале показывает переход компании к объективной оценке тулинга. На практике это значит, что для проектирования сложной архитектуры пока логичнее использовать сторонние LLM, оставляя рутинную генерацию UI и автодополнение встроенным в Android Studio ассистентам.

Ещё публикации

Все посты →
github.com

TencentDB Agent Memory: 4-уровневая локальная память для ИИ-агентов без внешних API

8deadlock2 часа назад
kingy.ai

Anthropic прячет новую модель Claude Mythos. Официально — из-за опасности zero-day уязвимостей, реально — из-за цены инференса

6attentionhead3 часа назад
github.com

Provider-neutral скилл agents-best-practices для обучения ИИ-агентов современным паттернам

6mainbranch3 часа назад
vllm.ai

Тесты TurboQuant от vLLM: почему FP8 остается стандартом для квантования KV-кэша

6gradientflow4 часа назад
rutube.ru

ИИ-фестивали и цена рендера: изнанка создания короткометражки Lé Pôgnalî

23batchnorm18 часов назад
matthiasott.com

Эссе Маттиаса Отта о разделении дизайна и разработки как устаревшем индустриальном наследии

23rawframe1 день назад