Новый GPT-4o от OpenAI стал вирусным благодаря видео, демонстрирующему «видящий» ИИ, помогающий своему «слепому» коллеге, зрелище, которое действительно нужно увидеть, чтобы поверить.

Новый GPT-4o от OpenAI стал вирусным благодаря видео, демонстрирующему «видящий» ИИ, помогающий своему «слепому» коллеге, зрелище, которое действительно нужно увидеть, чтобы поверить.


Добро пожаловать в уголок, где империи рушатся, а ваши миниатюры страдают от кривых покрасов! Присоединяйся к официальному телеграм-каналу Warhammer 40,000, где мы обсуждаем, как в очередной раз проиграть из-за одного несчастного кубика. Ждём твоего вступления с таким же нетерпением, с каким Император ждёт новую модель!

Warhammer 40k Telegram


Что тебе нужно знать

  • OpenAI только что выпустила свою новую флагманскую модель GPT-4o.
  • Он может анализировать звук, изображение и текст в режиме реального времени, что делает взаимодействие с ChatGPT более плавным.
  • OpenAI также представила собственное приложение ChatGPT для Mac, игнорирующее Windows.
  • Вирусная демонстрация ChatGPT продемонстрировала аудио- и визуальные возможности GPT-4o для взаимодействия с другой моделью искусственного интеллекта.

Как поклонник технологии искусственного интеллекта и ее достижений, я просто потрясен последней версией флагманской модели GPT-4o от OpenAI. Возможность рассуждать с помощью звука, изображения и текста в режиме реального времени меняет правила игры, делая взаимодействие с ChatGPT более интуитивным и естественным.


OpenAI представила свою последнюю усовершенствованную модель под названием GPT-4o, которая представляет собой обновление предыдущей версии GPT-4. Хотя я не единственный, кто озадачен этими постоянными обновлениями, GPT-4o, по сути, так же интеллектуален, как и его предшественник. Эта новая модель имеет более интуитивный характер и способна обрабатывать и анализировать данные в реальном времени из аудио, зрительных и текстовых источников. В результате взаимодействие с ChatGPT станет более естественным и плавным.

Спорные чудеса недавно завершившегося мероприятия OpenAI Spring Update демонстрируются посредством впечатляющих демонстраций, циркулирующих в социальных сетях. Перевод с итальянского на английский в режиме реального времени — это удивительная задача, эффективно устраняющая препятствия в общении, такие как языковой барьер.

Однако меня это озадачило, когда президент и соучредитель OpenAI Грег Брокман продемонстрировал видео на X (ранее Twitter). Мне не приходило в голову, что в конечном итоге мы достигнем стадии, когда два помощника по искусственному интеллекту смогут вести долгий разговор с небольшим количеством вопросов.

See more

Проще говоря, презентация начинается с того, что человек описывает двум диалоговым агентам искусственного интеллекта, что они будут общаться друг с другом. Человек направляет чат-ботов через предполагаемое взаимодействие. Один из этих ботов оснащен камерой для наблюдения за окружающей средой, а другой может генерировать вопросы или давать задания с некоторой помощью пользователя.

«Как раз в тот момент, когда я собирался прийти к выводу, что ничего более интригующего уже быть не может», — игриво пошутил первый чат-бот. Взаимодействуя с ИИ, наделенным зрительным восприятием, этот момент произвел неожиданный поворот в мире искусственного интеллекта». Прежде чем ИИ смог согласиться с условиями, пользователь попросил его подождать на мгновение, пока он передаст инструкции другому ИИ. .

С самого начала пользователь инициирует общение со вторым ИИ-помощником, сообщая, что ему будет предоставлена ​​возможность наблюдать за миром вокруг нас. Я предполагаю, что это косвенная инструкция помощнику активировать камеру на устройстве, которую он будет использовать как глаза, чтобы осматривать мир. Следовательно, интерфейс мгновенно отображает камеру (в режиме селфи) и представляет яркое изображение того, что одет пользователь, и окружающей среды.

Начиная с этого момента, пользователь указывает, что первоначальная модель ИИ будет участвовать в разговоре и задавать вопросы, например, направлять камеру и описывать ее наблюдения. Его основная роль – быть полезным, обеспечивая точность и достоверность ответов.

Новый GPT-4o от OpenAI стал вирусным благодаря видео, демонстрирующему «видящий» ИИ, помогающий своему «слепому» коллеге, зрелище, которое действительно нужно увидеть, чтобы поверить.

Процесс начинается с ИИ, который может «видеть мир», объясняя, что находится в его поле зрения, включая пользователя, а также дополнительную информацию о его дресс-коде и дизайне здания. Интересно, что создается впечатление, будто два человека разговаривают по FaceTime, поскольку первый ИИ дает обратную связь на основе предоставленной информации. Кроме того, ИИ, похоже, четко понимает, что делает пользователь, его выражение лица и даже его стиль в зависимости от того, что он делает.

Я был удивлен, когда пользователь жестом предложил кому-то подойти ближе и оказаться в поле зрения ИИ. ИИ быстро распознал это действие и предположил, что пользователь может готовиться к презентации или обсуждению на основе его взаимодействия с камерой.

Любопытно, что присутствие дополнительной стороны не прервало диалог между двумя искусственными интеллектами. При случайном наблюдении кажется, что один ИИ не заметил человека, который вошел в комнату и встал позади пользователя с телефоном.

Будучи исследователем, наблюдающим за взаимодействием двух искусственных интеллектов, я заметил интригующий поворот событий. Разговор был на мгновение приостановлен, когда пользователь спросил о чем-то неожиданном. Затем ИИ, оснащенный визуальными возможностями, сообщил о беззаботном и неожиданном инциденте: второй человек вошел на сцену позади первого и игриво имитировал глаза кролика, прежде чем исчезнуть из поля зрения.

Как аналитик, я наблюдал за демонстрацией и постоянно поражался обширным возможностям GPT-4o. Пользователь попросил обе модели сочинить песню о недавних событиях и по очереди спеть текст. Это напоминало директора хора, готовящего свой хор к большому выступлению в церкви.

Стоит отметить, что большинство демонстраций, с которыми мне приходилось сталкиваться, проводились на устройствах Apple, таких как iPhone и MacBook. Возможно, именно поэтому OpenAI изначально выпустила собственное приложение ChatGPT для пользователей Mac, прежде чем сделать его доступным для пользователей Windows. Кроме того, генеральный директор OpenAI Сэм Альтман выразил уверенность, что «iPhone является самым выдающимся технологическим достижением человечества на сегодняшний день».

Смотрите также

2024-05-14 22:20