A IA impactou todas as áreas do conhecimento humano. Uma área promissora que experimenta o impacto da IA generativa é a produção cinematográfica. Gigantes do streaming como Netflix, Amazon Prime, Disney+ Hotstar e YouTube são pioneiros na extensão da tecnologia em suas operações.
Eles não se concentram apenas na redução dos custos de produção, mas também em trazer uma experiência personalizada para programas e filmes, melhorando assim a sua qualidade de uma forma sem precedentes. A partir de agora, o foco na IA generativa na produção de filmes gira principalmente em torno de ferramentas de geração de texto para vídeo.
O desenvolvimento de ferramentas de geração de texto para vídeo com IA gerou uma competição acirrada entre os gigantes da tecnologia. Sora e DALL-E da OpenAI, VASA-1 da Microsoft, Firefly da Adobe e Veo do Google, bem como plataformas independentes como Stable Video, Midjourney, Runway e Pika Labs, estão competindo pelo primeiro lugar neste campo em rápida evolução.
A ascensão da pista
A startup de vídeo AI Runway deixou sua marca na indústria como uma das ferramentas mais populares e de última geração para geração de vídeo AI.
Seu recente lançamento do controle avançado de câmera para Gen-3 Alpha Turbo em 1º de novembro solidificou ainda mais sua posição na indústria. Isto elevou a sua presença no setor de texto para vídeo a um nível totalmente novo.
O Controle Avançado de Câmera já está disponível para Gen-3 Alpha Turbo. Escolha a direção e a intensidade de como você se move nas cenas para obter ainda mais intenção em cada cena.
(1/8) pic.twitter.com/jRE6pC9ULn
– Pista (@runwayml) 1º de novembro de 2024
Isso não é tudo. Em setembro, a Runway fez história ao colaborar com a Lionsgate, criadora de John Wick. Este acordo estabeleceu uma nova referência na indústria do entretenimento, colocando-a muito à frente do Sora da OpenAI. Sob este acordo, a Lionsgate poderia usar as ferramentas de IA da Runway exclusivamente para criar conteúdo.
Curiosamente, este acordo destacou o uso de Runway no filme vencedor do Oscar ‘Everything Everywhere All at Once’ para efeitos especiais, o que economizou muito tempo, reduziu custos e minimizou o esforço manual.
A Runway também criou atualizações que mudaram completamente a confiança dos artistas de produção nos sistemas tradicionais de captura de movimento. Em outubro, MIRAR informou que a Runway anunciou o Act-One, uma nova ferramenta de última geração para gerar performances expressivas de personagens, dentro do Gen-3 Alpha.
Mas outros não estão recuando
Outra ferramenta que ganhou fama é o Midjourney. Em setembro deste ano, deixou sua marca ao lançar seu recurso Niji. Muitos usuários acessaram a internet e compartilharam suas obras de arte personalizadas na plataforma, expressando agradecimento pelo recurso.
Um usuário do X também fez recentemente uma afirmação ousada de que 99% dos vídeos de IA feitos com ferramentas como Luma, Pika e Runway são gerados a partir de imagens originalmente criadas em Midjourney. No mesmo mês, MIRAR também especulou por que os artistas preferem Midjourney a FLUX.
Mas o Midjourney é apenas uma ferramenta de geração de imagem para vídeo ou é um pau para toda obra e mestre de ninguém? MIRAR especulou isso perguntando por que Midjourney está entrando no negócio de hardware.
Meio da viagem para Sora
O lançamento do Sora da OpenAI foi amplamente comparado a um “momento ChatGPT na geração de vídeo”. O modelo era uma ferramenta nova e inteligente de conversão de texto em vídeo que podia criar vídeos de até 60 segundos apresentando cenas detalhadas, movimentos complexos de câmera e vários personagens exibindo emoções vibrantes.
A Índia também entrou neste domínio este ano e desenvolveu ferramentas e soluções para as empresas criarem vídeos de IA. A Phenomenal AI, uma startup indiana, lançou a primeira plataforma de IA de texto para vídeo do país em julho.
Como relatado anteriormente por MIRARUnscript, startup de IA baseada em Bengaluru, é outra plataforma que permite aos usuários criar vídeos com aparência profissional. Unscript competirá com Sora da OpenAI como um grande concorrente. Outra plataforma indiana de criação de vídeo com IA, Rephrase.ai, foi recentemente adquirida pela Adobe.
Não apenas uma alternativa ao Sora, mas mais!
Em meio às crescentes ferramentas de vídeo de IA, como o Sora, a China emergiu como um grande concorrente, ultrapassando as capacidades de várias plataformas existentes.
Kling, empresa concorrente chinesa do TikTok, Kuaishou, uma poderosa ferramenta de vídeo de IA lançada este ano, é popularmente considerada uma alternativa ao Sora.
Este modelo cria movimentos realistas em grande escala que simulam características do mundo físico. Ele também se aprofunda na produção de reconstruções faciais e corporais em 3D, apoiadas pela tecnologia proprietária da empresa. Um criador de conteúdo de IA espanhol, MayorkingAI, mencionou recentemente no X que o dinamismo e os efeitos visuais de Kling “são selvagens”.
Outra usuária do X, Déborah, uma entusiasta da geração de vídeos com IA, expressou sua confusão sobre o que é real e o que não é ao criar mídia usando Kling.
O que é real e o que não é?@Kling_ai animação pic.twitter.com/OLRnV6KspB
—Déborah (@dvorahfr) 7 de novembro de 2024
Kling também possibilitou que os usuários treinassem seus próprios personagens de vídeo de IA. “Enquanto os EUA estão debatendo intensamente sobre a ética da IA e incorporando uma IA responsável, a China parece imperturbável e provavelmente está respondendo a esses especialistas em ética da IA com Kling”, MIRAR anteriormente contemplado, logo após a libertação de Kling.
MiniMax, outro gerador de texto para vídeo lançado por uma startup chinesa, foi recentemente reconhecido pela MIRAR para alguns de seus melhores vídeos gerados por IA. Falando sobre a ascensão de tais ferramentas chinesas, um utilizador do Reddit disse que a China está mais avançada em IA do que muitos de nós fomos levados a acreditar, com base num artigo sobre o boom da investigação em IA.
Independentemente disso, embora sistemas como Sora e Kling tenham apresentado capacidades impressionantes, eles permanecem acessíveis apenas para usuários selecionados.
Da mesma forma, a Dream Machine de Luma apresenta características notáveis, mas é limitada a um público restrito. Independentemente disso, Dream Machine 1.5 criou alguns dos vídeos de IA mais famosos da internet.
Chegou um novo concorrente de Kling e Sora. Pollo AI é uma plataforma que busca democratizar a geração de vídeos com IA. Ele foi desenvolvido pela HIX.AI, um provedor de soluções completas de IA com sede em Cingapura.
Rishabh, cofundador da AI Insights, recentemente acessou o X para mostrar vídeos gerados pelo Pollo AI. Ele disse: “Sora e Kling AI estão com ENORMES problemas”.
Sora e Kling AI estão em apuros ENORMES.
Pollo AI acabou de cair e é alucinante.
Aqui estão 10 exemplos selvagens: pic.twitter.com/RZXiRal6CW
– Rishabh (@Rixhabh__) 5 de novembro de 2024
No futuro, as ferramentas de geração de texto para vídeo também terão impactos visíveis na criação de videogames. Em 2025, os jogos de texto para vídeo provavelmente apagarão os jogos tradicionais para sempre. Com a combinação da IA nesses domínios, é apenas uma questão de tempo até que possamos jogar nossos filmes como jogos e assistir nossos jogos como filmes, limitados apenas pela imaginação.
Esse artigo é uma releitura de: analyticsindiamag.com