ИИ в смартфонах 2024-го не оправдал ожиданий. Изменится ли это?

Уходящий год запомнился активной «ИИ-фикацией» мобильных гаджетов. На презентациях бренды много говорили о нейросетях, выделяя их как ключевую инновацию. Но в итоге стало ясно, что пользу нововведений на практике несколько преувеличивали. Приводим громкие примеры.

Потенциал и реализация

Безусловно, фишки искусственного интеллекта способны упростить повседневную жизнь. Автоматизировать действия вроде отправки письма или заказа еды через голосового помощника, навести камеру на плакат и спросить, свободен ли этот день в расписании календаря, попросить найти нужные сведения в почтовой рассылке, не помня их точного расположения, — всё это весьма интересные сценарии. Однако на сегодня смартфоны ещё не готовы дать полноценный опыт такого рода.

То, что есть сейчас, нередко напоминает попытки эксплуатировать волну хайпа на тему ИИ, начавшуюся с ChatGPT. Ведь даже самого чат-бота от OpenAI интегрировали в операционки Apple как отдельный режим Siri. Идея тем не менее неплохая, ведь ассистент стал гораздо умнее. Ещё в системах имеются средства для редактирования текста. ИИ способен сделать формулировки дружелюбнее или профессиональнее, сократить заметки, применить форматирование и исправить опечатки. Всё функционирует офлайн, причём так, как заявлено. Впрочем, стоит ограничение по длине, что не даёт, например, оформить крупный документ в виде таблицы.

«Writing Tools мне не пригодились в профессиональной работе с текстами. Да и нужен приветливый пресет для переписок, если можно изначально так изъясняться?» — отмечает блогер Маркес Браунли в обзоре Apple Intelligence.

Среди прочего есть опция создания уникальных эмодзи по описанию, как и штатный генератор картинок. Для определённой демографики и энтузиастов эти сервисы могут представлять интерес, хотя бы для развлечения. Для распознавания предметов и поиска по фото предусмотрен Visual Intelligence. Резюмирование уведомлений — механизм, известный не столько своей полезностью, сколько смешными ошибками. Локальная LLM может неправильно понимать контекст переписки или обобщать несвязанные между собой сообщения. К тому же не так часто приходят длинные тексты, требующие сжатия. Но иногда это выручает при суммаризации однообразных оповещений вроде открытия и закрытия умной двери гаража, а также когда забился групповой чат.

Под другим крупным брендом — Galaxy AI — тоже дебютировали любопытные новшества. Перевод речи в реальном времени во время звонков на Galaxy S24 — действительно удобная фишка. Правда, идеальной точности от неё ждать пока не стоит. Ещё есть Sketch to image, позволяющая нанести простой набросок стилусом и превратить его в детализированную иллюстрацию. В том числе можно реалистично дорисовать к фотографии то, чего там не было. «Многие из этих опций пользователи пробуют один раз и забывают, когда проходит эффект новизны», — считает Эллисон Джонсон из The Verge.

Наконец, Google в моделях Pixel предлагает ворох инструментов для обработки изображений в Magic Editor. Генеративный ИИ здесь помогает добавлять или вырезать объекты, менять фон с помощью Reimagine. Помощник Gemini берёт на себя все функции «Google Ассистента», добавляя к этому возможности уровня ChatGPT с поиском в сети, а также синхронизацию с сервисами Google. Внедрили утилиту Screenshots с умным поиском по снимкам экрана и Pixel Studio для генерации картинок. Call Notes суммирует телефонные разговоры текстом. Доступна и сводка погодных условий AI Weather Report в соответствующем приложении.

Чего ждать в 2025-м?

Хотя нельзя сказать, что всё вышеупомянутое никому не пригодится, стало очевидно: революцией, обещанной в рекламных материалах, здесь и не пахнет. По данным аналитиков SellCell, меньше половины потребителей считают ИИ важным фактором при покупке нового iPhone. Пренебрегли подобными инновациями и 87% обладателей гаджетов Samsung. Закономерно выяснилось, что немногие готовы платить за использование нейросетевой функциональности.

Тем не менее направление будут активно развивать в ближайшие годы. Некоторые компании уже поделились планами. Та же Apple следующей весной представит апдейт, позволяющий Siri выполнять действия в приложениях. В том числе это будет применяться в сторонних сервисах — скажем, получится заказать пиццу голосовой командой. Аналогичный механизм разрабатывают в Google для ОС Android 16. Отвечать за взаимодействие с софтом будет мультимодальная Gemini 2.0 с ИИ-агентами для специфических сценариев.

Конкуренция в этой области продолжает усиливаться, и кто знает, насколько переменится ситуация через год. А что вы думаете про ИИ-функции в смартфонах?