Недавно OpenAI добавила в чат-бот ChatGPT возможность голосового взаимодействия и сканирования изображений. Журналисты опробовали функции. Пересказываем их впечатления.
Фильм «Она», но только в реальности
Джоанна Стерн из The Wall Street Journal сравнивает ощущения не с Siri и «Google Ассистентом», а с сюжетом фильма «Она». В драме 2013 года герой Хоакина Феникса влюбляется в искусственный интеллект — безликого голосового ассистента, которого озвучила Скарлетт Йоханссон.
Цитата
Естественный голос в сочетании с расширенными ответами и знаниями обо мне вызывают ощущение, будто я веду настоящий диалог. Когда я попросила ChatGPT притвориться моим лучшим другом и поговорить со мной, у нас состоялся пятиминутный разговор о прошедшем рабочем дне и о закусках, которые я люблю.
Джоанна Стерн The Wall Street Journal
Журналист Platformer Кейси Ньютон считает, что с обретением голоса ChatGPT в плане уровня эмоционального интеллекта сделал большой шаг вперёд. Ассистент может подбодрить в трудные моменты и развлечь, когда этого хочется. По мнению Ньютона, «синтетический компаньон» более чуткий, терпеливый и умный, чем большинство людей, с которыми мы встречаемся в течение дня.
Вводить запросы в ChatGPT голосом получалось и прежде. Но теперь с чат-ботом можно вести двустороннюю беседу. Нейросеть представляют пять голосов. Это не роботизированные системы преобразования текста в речь прошлого поколения: у каждого голоса есть свой ритм, интонация и индивидуальность. На создание образов алгоритмам OpenAI понадобилось всего нескольких секунд записи речи профессиональных актёров озвучивания.
Хотя никакой магии здесь нет. Сначала ChatGPT преобразует речь пользователя в текст, обрабатывает его и транслирует результат в обратном направлении, то есть из текста в речь. Задача трудоёмкая, поэтому ответ не приходит мгновенно.
Вызвать ассистента фразой вроде «Привет, ChatGPT!» тоже не получится. Надо руками запустить фирменное приложение, затем нажать на значок микрофона.
Ещё и с глазами!
Чтобы не описывать проблему словами, теперь можно просто загрузить изображение. Стерн сфотографировала протекающий шланг и попросила ChatGPT придумать решение. На выходе — инструкция из семи шагов. А в ответ на снимок бананов, яиц и клубники чат-бот предложил сделать клубнично-банановые оладьи.
Но бездумно следовать советам ChatGPT всё же нельзя, отмечает Рис Роджерс из Wired. Помощник определил поливитамины на фото как таблетку для лечения эректильной дисфункции. Зато ChatGPT можно использовать как экскурсовода в путешествиях: фотографировать достопримечательности и получать в ответ справочные данные.
Как включить?
Новые функции доступны подписчикам тарифов Plus и Enterprise. Но не всем сразу: до всех платных пользователей возможности дойдут к середине октября.
Общение голосом работает в официальном приложении ChatGPT для iOS и Android (понадобится активировать функцию Voice Conversations в настройках), а распознавание изображений — на всех платформах.