A tecnologia baseada em inteligência artificial (IA) tem vindo a alcançar marcos significativos, como a capacidade de gerar imagens a partir de uma simples descrição em texto. Ferramentas como DALL-E e Stable Diffusion, ao serem lançadas publicamente, causaram um verdadeiro alvoroço na indústria tecnológica, permitindo-nos testemunhar em primeira mão o que uma IA é capaz de fazer.
Hoje em dia, a criação de imagens através de IA tornou-se uma prática comum para muitas pessoas, empresas e organizações. A Stability AI, a empresa por detrás da Stable Diffusion, tem feito avanços impressionantes, especialmente após o lançamento do seu modelo SDXL 1.0. Agora, a empresa pretende dar um passo ainda maior, com a possibilidade de gerar clips de vídeo a partir de uma simples descrição em texto.
A Stability AI anunciou oficialmente a Stable Video Diffusion, uma ferramenta que nos permitirá gerar vídeos através de IA, bastando para isso descrever brevemente o que queremos ver. Este projeto baseia-se num complexo modelo de linguagem para a geração de vídeo em alta resolução.
De forma simplificada, a criação de vídeo conseguida pelos actuais modelos de linguagem baseava-se no treino de imagens em 2D e, aplicando camadas de tempo, conseguiam-se gerar pequenos clips de vídeo. Segundo o paper publicado pela empresa, o método da Stability AI consiste em três chaves principais: pré-treino de texto para imagem, pré-treino de vídeo e ajuste de vídeo em alta definição.
Este modelo pode ser adaptado a várias tarefas, incluindo a possibilidade de gerar vistas a partir de múltiplas perspetivas com apenas uma única imagem. A empresa planeia continuar a lançar vários modelos que expandam esta base, algo semelhante ao ecossistema que criaram em torno da Stable Diffusion.
O lançamento desta ferramenta representa um grande passo evolutivo para a empresa, que se encontra na vanguarda da geração de conteúdo através de IA. A Stability AI disponibilizou o código dos seus modelos publicamente tanto no Github como no Hugging Face, para que possa ser executado localmente. No entanto, aqueles que quiserem experimentar a ferramenta em primeira mão, terão que se inscrever numa lista de espera.
Por enquanto, a empresa garante que a ferramenta é exclusiva para fins de investigação e que, no estado actual, ainda não se podem considerar fins comerciais. Os que forem admitidos após estarem na lista de espera encontrarão uma interface web dedicada à geração de vídeo através do seu novo modelo de linguagem.
A Stability AI está a liderar este avanço com a sua nova ferramenta, Stable Video Diffusion. Embora ainda esteja numa fase inicial e seja exclusivamente para fins de investigação, o potencial é enorme. Na minha opinião, esta é uma área emocionante da tecnologia que vale a pena acompanhar, pois poderá ter implicações significativas em áreas como a publicidade, o cinema e a educação.
Fonte: Stability











