O guia completo do Seedance 2.0: criacao de video com IA multimodal do zero

O Seedance 2.0 e o modelo de video com IA multimodal da ByteDance que gera video cinematografico a partir de texto, imagens, clipes de video e audio. Oferece dois modos de criacao, um sistema de referencias @ para controle preciso de recursos e geracao de audio nativo — tudo em um unico fluxo de trabalho. Veja como usar cada funcionalidade.

Dois modos de criacao

O Seedance 2.0 oferece dois pontos de entrada, cada um adequado a diferentes fluxos de trabalho:

Modo Primeiro/Ultimo Quadro

  • Envie uma imagem como quadro de abertura ou encerramento
  • Adicione uma descricao de texto do movimento e da cena desejados
  • Ideal para: animacoes simples, conversoes de imagem para video, testes rapidos

Modo de Referencia Tudo em Um (Recomendado)

  • Combine imagens + clipes de video + audio + texto em uma unica geracao
  • Suporta ate 12 arquivos de referencia simultaneamente
  • Ideal para: producoes complexas com multiplos recursos, videoclipes musicais, narrativas baseadas em personagens

Especificacoes de entrada

Tipo de entradaLimiteO que controla
ImagensAte 9Aparencia de personagens, estilo da cena, detalhes do produto
Clipes de videoAte 3 (total ≤15s)Movimento de camera, ritmo da acao, efeitos de transicao
Arquivos de audioAte 3 MP3 (total ≤15s)Musica de fundo, efeitos sonoros, tom da narracao
TextoLinguagem naturalDescricao da cena, instrucoes de acao, atmosfera

Limite total de arquivos: 12 arquivos de referencia por geracao.

O sistema de referencias @

Esta e a funcionalidade mais importante a aprender. O sistema @ permite atribuir uma funcao especifica a cada arquivo enviado — o modelo segue suas atribuicoes com precisao em vez de adivinhar.

Como usar @

  1. Envie seus recursos (imagens, videos, audio)
  2. Na caixa de prompt, digite @ para abrir o seletor de recursos
  3. Selecione um arquivo e descreva sua funcao na geracao

Exemplo de prompt com referencias @

@image1 as the opening frame character,
reference @video1 for camera movement (slow push-in to close-up),
use @audio1 for background music,
@image2 as the environment reference.
The character walks toward the camera under warm sunset lighting.

Regras fundamentais

  • Cada arquivo enviado deve ser atribuido explicitamente com @
  • Passe o cursor sobre os recursos para visualizar e verificar se esta referenciando o arquivo correto
  • O modelo executa exatamente o que voce atribui — sem adivinhar

Tecnicas de escrita de prompts

1. Escreva por linha do tempo

Divida seu prompt em segmentos temporais para um controle preciso:

  • 0-3s: "Plano geral de um horizonte urbano ao amanhecer, panoramica lenta para a direita"
  • 4-8s: "Corte para plano medio, o personagem entra pela esquerda, caminhando"
  • 9-12s: "Aproximacao para primeiro plano do rosto do personagem, fundo com foco suave"

2. Use linguagem de camera especifica

O modelo compreende termos profissionais de cinematografia:

  • Push-in / Pull-out — zoom em direcao ao ou afastando-se do sujeito
  • Pan — movimento horizontal de camera
  • Tilt — movimento vertical de camera
  • Tracking shot — a camera acompanha o movimento do sujeito
  • Orbit — a camera gira ao redor do sujeito
  • One-take — tomada continua sem cortes

3. Descreva as transicoes

Ao criar sequencias com multiplas tomadas, especifique como as cenas se conectam:

  • "Fade da cena externa para primeiro plano interno"
  • "Match cut da moeda girando para o globo girando"
  • "Transicao com panoramica rapida para a proxima cena"

4. Distinga entre referencia e instrucao

  • Referencia: "@video1 for camera movement" — o modelo extrai e replica o trabalho de camera
  • Instrucao: "slow push-in from wide to close-up" — o modelo gera o movimento a partir da sua descricao de texto

Capacidades principais

Qualidade de imagem

  • Movimento fisicamente preciso (gravidade, caimento de tecidos, dinamica de fluidos)
  • Movimento humano e animal suave e natural
  • Aderencia precisa ao prompt
  • Estilo visual consistente em todo o video

Combinacao multimodal

  • Extraia o movimento de camera de um video de referencia
  • Extraia a aparencia do personagem de imagens de referencia
  • Extraia o ritmo musical do audio de referencia
  • Combine os tres em uma unica geracao

Consistencia de personagens

  • Preservacao de rosto, vestuario e expressao entre tomadas
  • Consistencia dos elementos de marca (logotipos, cores, tipografia)
  • Consistencia do estilo da cena (iluminacao, atmosfera)

Replicacao de camera e movimento

  • Replique tecnicas cinematograficas especificas de videos de referencia
  • Zoom Hitchcock, tracking orbital, sequencias de plano-sequencia
  • Correspondencia precisa de velocidade e ritmo de movimento

Especificacoes de saida

  • Duracao: 4-15 segundos (selecionavel)
  • Resolucao: Ate 2K / 1080p
  • Proporcoes de tela: 16:9 (paisagem), 9:16 (retrato), 1:1 (quadrado)
  • Audio: Nativo — inclui sincronizacao de dialogo, musica de fundo, efeitos sonoros
  • Velocidade de geracao: ~30 pontos por video de 15 segundos, 10 vezes mais rapido que a geracao anterior

Notas importantes

  • Sem rostos humanos reais — envios com rostos humanos reais claramente visiveis sao bloqueados pela moderacao de conteudo
  • Qualidade acima da quantidade — envie apenas os recursos que tenham maior impacto no resultado desejado
  • Verifique as atribuicoes @ — passe o cursor sobre cada referencia de recurso para confirmar o mapeamento correto do arquivo
  • Aleatoriedade do modelo — os resultados variam entre geracoes; gere multiplas vezes e escolha o melhor
  • Disponivel em: Jimeng, Doubao, Volcano Engine

Perguntas frequentes

Quais sao os dois modos de criacao?

Modo Primeiro/Ultimo Quadro (uma imagem + texto) para geracoes simples, e modo de Referencia Tudo em Um (ate 12 arquivos multimodais) para producoes complexas.

Como funciona o sistema de referencias @?

Digite @ na caixa de prompt, selecione um arquivo enviado e descreva sua funcao. Exemplo: "@image1 como referencia de personagem, @video1 para movimento de camera." O modelo segue suas atribuicoes com precisao.

Quais sao os limites de entrada?

Ate 9 imagens, 3 clipes de video (≤15s no total), 3 arquivos de audio (≤15s no total) e texto. Maximo de 12 arquivos por geracao.

Qual saida ele produz?

De 4 a 15 segundos de video com resolucao de ate 2K com audio nativo, em proporcoes de tela 16:9, 9:16 ou 1:1.

Posso usar fotos de pessoas reais?

Nao. Envios com rostos humanos reais claramente visiveis sao bloqueados pela moderacao de conteudo. Use referencias de personagens estilizados ou ilustrados.


Pronto para comecar a criar? Experimente o Seedance 2.0 agora — teste gratuito disponivel.