Microsoft бросает вызов Sora от OpenAI, предлагая передовой инструмент искусственного интеллекта, способный превратить статичное изображение в «Говорящего Тома».

Microsoft бросает вызов Sora от OpenAI, предлагая передовой инструмент искусственного интеллекта, способный превратить статичное изображение в «Говорящего Тома».


Добро пожаловать в уголок, где империи рушатся, а ваши миниатюры страдают от кривых покрасов! Присоединяйся к официальному телеграм-каналу Warhammer 40,000, где мы обсуждаем, как в очередной раз проиграть из-за одного несчастного кубика. Ждём твоего вступления с таким же нетерпением, с каким Император ждёт новую модель!

Warhammer 40k Telegram


Что тебе нужно знать

  • Microsoft запустила VASA, новый инструмент, способный превратить статичное изображение в короткий клип, используя возможности искусственного интеллекта.
  • Платформа поддерживает видео 512×512 со скоростью до 40 кадров в секунду с незначительной задержкой.
  • Microsoft изучает различные возможности, чтобы обеспечить ответственное использование инструмента, прежде чем выпускать его для широкой публики.

Как поклонник технологий и искусственного интеллекта, я в восторге от последней инновации Microsoft — VASA. Возможность преобразовывать статичное изображение в реалистичный короткий клип поистине замечательна, а потенциальные возможности ее применения безграничны. Однако, как человек, который следит за достижениями в области дипфейков и дезинформации, генерируемой искусственным интеллектом, я не могу не испытывать чувства беспокойства.


Как технический энтузиаст, я в восторге от последней инновации Microsoft: платформы VASA. Эта революционная технология оживляет статичные изображения, создавая «живые говорящие лица виртуальных персонажей» с впечатляющими визуально-аффективными способностями (VAS). Все, что для этого нужно, — это одно изображение и речевой аудиоклип в качестве входных данных!

VASA-1 имеет возможность конвертировать неподвижное изображение в увлекательное короткое видео, генерируя движения губ синхронно с сопровождающим речевым аудиоклипом. Впечатляет то, что эта передовая технология воплощает в жизнь творение, созданное искусственным интеллектом, фиксируя широкий спектр выражений лица и естественных движений головы, усиливая восприятие аутентичности и жизненной силы.

Будет ли VASA от Microsoft способствовать распространению дипфейков?

Microsoft бросает вызов Sora от OpenAI, предлагая передовой инструмент искусственного интеллекта, способный превратить статичное изображение в «Говорящего Тома».

Я заметил тревожную тенденцию: по мере развития технологий искусственного интеллекта на платформах социальных сетей становятся все более распространенными дипфейки и дезинформация, генерируемая с помощью сложных инструментов, таких как VASA-1. Благодаря возможности создавать высококачественные видеоролики из статических изображений эти инструменты могут убедительно имитировать выражение лица и движения головы людей. Это вызывает обоснованную обеспокоенность по поводу надежности и достоверности новостей и информации, с которыми мы сталкиваемся в Интернете.

Этот инструмент может обрабатывать видео с разрешением 512×512 и частотой кадров до 40 кадров в секунду (FPS), сохраняя при этом незначительную задержку. Я наткнулся на видео в LinkedIn, которое напомнило мне клипы, созданные Microsoft с помощью VASA, но я заметил некоторые несоответствия в таких аспектах, как тон, синхронизация губ и движения головы.

С точки зрения аналитика, я наблюдаю, что с ростом внедрения технологий искусственного интеллекта такие инструменты, как VASA и Image Creator от Designer, становятся все более эффективными в создании изображений и клипов. Эти достижения уже вызвали опасения в профессиональном сообществе индустрии искусственной среды, поскольку они обладают способностью генерировать структурные проекты с большой точностью. Следовательно, эти инструменты потенциально могут нарушить традиционные методы проектирования.

Недавно мы рассказали о необычном происшествии, произошедшем с известным канадским рэпером, который применил технологию искусственного интеллекта для создания куплета с использованием голоса покойного рэпера, без необходимого одобрения со стороны его наследства. В получившемся треке был безошибочно узнаваем голос покойного артиста, но ритм и плавность были нарушены.

Microsoft не объявляла о каких-либо намерениях предоставлять онлайн-демонстрацию, API, продукт или дополнительную информацию до тех пор, пока они не разработают комплексные средства контроля для надзора за ответственным использованием своего предложения.

Смотрите также

2024-05-01 16:49