Microsoft anuncia Modelo de IA VASA-1 para conversão de imagens em vídeos

A Microsoft revelou recentemente o VASA-1, seu novo modelo de inteligência artificial desenvolvido para criar faces falantes realistas para personagens virtuais, que se destacam pelas suas habilidades visuais afetivas impressionantes. Utilizando apenas uma única imagem estática e um clipe de áudio, o VASA-1 é capaz de produzir vídeos curtos que simulam a vida real. Além disso, o modelo permite que os usuários façam ajustes detalhados no vídeo. Veja o que você precisa saber sobre essa inovação.

A novidade foi anunciada na página de pesquisa da Microsoft, onde foi explicado que o modelo de IA é capaz de sincronizar movimentos de lábios com o áudio, além de capturar expressões faciais e movimentos naturais da cabeça. O VASA-1 promete entregar vídeos de alta qualidade com uma dinâmica facial e de cabeça convincente. O sistema suporta a criação de vídeos de 512 x 512 a até 40 quadros por segundo com praticamente nenhuma latência inicial.

Este modelo pode gerar vídeos de até um minuto, como demonstrado no site oficial da Microsoft. O vídeo de demonstração ilustra o controle detalhado que os usuários têm, permitindo ajustes em elementos como direção do olhar, distância da cabeça, e expressões emocionais. A capacidade de ajustar independentemente a aparência, a pose da cabeça em 3D e as dinâmicas faciais, permite personalizações precisas no resultado final.

O VASA-1 também se mostra capaz de processar entradas de fotos e áudios atípicos que não estavam no conjunto de dados de treinamento, incluindo fotos artísticas, áudios de canto e falas em outros idiomas.

Contudo, a Microsoft anunciou que o VASA-1 não estará disponível para o público. A empresa pretende usar essa tecnologia primariamente para criar personagens virtuais realistas, e não como um produto independente ou API. Essa decisão reflete o compromisso da Microsoft com a ética em IA.

A Microsoft também abordou preocupações sobre o uso indevido dessa tecnologia, afirmando: “Nosso foco de pesquisa é em aplicações positivas para gerar habilidades afetivas visuais em avatares de IA virtuais. Somos contrários a qualquer uso dessa tecnologia para fins enganosos. Embora nosso método possa ser potencialmente usado para personificação, estamos comprometidos em desenvolver técnicas de detecção de fraude para atenuar esses riscos.”

Até que a Microsoft esteja segura de que a tecnologia será usada de maneira responsável e conforme os regulamentos, não haverá lançamento de demos online, APIs ou detalhes adicionais de implementação do VASA.

Teremos o maior prazer em ouvir seus pensamentos

Deixe uma Comentário

IA Tech Brasil
Logo
Shopping cart