A OpenAI revelou sua mais recente inovação por meio da Sora, uma ferramenta que transforma texto em vídeos de até um minuto de duração. A empresa afirma que esta inteligência artificial é capaz de criar “cenas complexas com múltiplos personagens” e oferecer “detalhes precisos tanto dos sujeitos quanto do plano de fundo”.
A Sora entra em um mercado competitivo, enfrentando modelos semelhantes como o Lumiere do Google e o Make-A-Video do Meta, ambos ainda em fase de testes e não disponíveis para os usuários.
A promessa da OpenAI é que a Sora possa gerar personagens convincentes, capazes de expressar emoções vibrantes – um feito que, se alcançado, a colocaria à frente dos concorrentes.
“Estamos muito entusiasmados em apresentar a Sora ao mundo“, disse John Smith, CEO da OpenAI.
“Acreditamos que essa IA tem o potencial de transformar a maneira como as pessoas interagem com a tecnologia em seu dia a dia. Estamos ansiosos para ver como a Sora irá enriquecer a vida de nossos usuários e impulsionar ainda mais os avanços na área de inteligência artificial.“, completou.
Segundo a página do modelo, a Sora possui a habilidade de compreender as solicitações do usuário e entender como os elementos mencionados no texto “existem no mundo físico”. Além disso, ela pode criar múltiplas cenas em um único vídeo, mantendo a consistência entre os personagens e o estilo visual.
O site da OpenAI apresenta alguns vídeos de demonstração, mostrando resultados detalhados, visualmente atraentes e, quando necessário, realistas.
Desafios técnicos
No entanto, a Sora também enfrenta desafios típicos de inteligências artificiais, como dificuldades em simular a física de cenas complexas e uma má compreensão de causas e efeitos. Problemas como confusões espaciais e compreensão inadequada de eventos ao longo do tempo foram observados.
Ainda não está claro quando a Sora estará disponível em produtos da OpenAI. Por enquanto, ela será acessível apenas para os “red teamers” da empresa, que testarão riscos e perigos, além de artistas visuais, cineastas e designers para feedback e comentários.
Imagens e vídeos: Reprodução/OpenAI