O guia completo do Seedance 2.0: criacao de video com IA multimodal do zero
O Seedance 2.0 e o modelo de video com IA multimodal da ByteDance que gera video cinematografico a partir de texto, imagens, clipes de video e audio. Oferece dois modos de criacao, um sistema de referencias @ para controle preciso de recursos e geracao de audio nativo — tudo em um unico fluxo de trabalho. Veja como usar cada funcionalidade.
Dois modos de criacao
O Seedance 2.0 oferece dois pontos de entrada, cada um adequado a diferentes fluxos de trabalho:
Modo Primeiro/Ultimo Quadro
- Envie uma imagem como quadro de abertura ou encerramento
- Adicione uma descricao de texto do movimento e da cena desejados
- Ideal para: animacoes simples, conversoes de imagem para video, testes rapidos
Modo de Referencia Tudo em Um (Recomendado)
- Combine imagens + clipes de video + audio + texto em uma unica geracao
- Suporta ate 12 arquivos de referencia simultaneamente
- Ideal para: producoes complexas com multiplos recursos, videoclipes musicais, narrativas baseadas em personagens
Especificacoes de entrada
| Tipo de entrada | Limite | O que controla |
|---|---|---|
| Imagens | Ate 9 | Aparencia de personagens, estilo da cena, detalhes do produto |
| Clipes de video | Ate 3 (total ≤15s) | Movimento de camera, ritmo da acao, efeitos de transicao |
| Arquivos de audio | Ate 3 MP3 (total ≤15s) | Musica de fundo, efeitos sonoros, tom da narracao |
| Texto | Linguagem natural | Descricao da cena, instrucoes de acao, atmosfera |
Limite total de arquivos: 12 arquivos de referencia por geracao.
O sistema de referencias @
Esta e a funcionalidade mais importante a aprender. O sistema @ permite atribuir uma funcao especifica a cada arquivo enviado — o modelo segue suas atribuicoes com precisao em vez de adivinhar.
Como usar @
- Envie seus recursos (imagens, videos, audio)
- Na caixa de prompt, digite @ para abrir o seletor de recursos
- Selecione um arquivo e descreva sua funcao na geracao
Exemplo de prompt com referencias @
@image1 as the opening frame character,
reference @video1 for camera movement (slow push-in to close-up),
use @audio1 for background music,
@image2 as the environment reference.
The character walks toward the camera under warm sunset lighting.
Regras fundamentais
- Cada arquivo enviado deve ser atribuido explicitamente com @
- Passe o cursor sobre os recursos para visualizar e verificar se esta referenciando o arquivo correto
- O modelo executa exatamente o que voce atribui — sem adivinhar
Tecnicas de escrita de prompts
1. Escreva por linha do tempo
Divida seu prompt em segmentos temporais para um controle preciso:
- 0-3s: "Plano geral de um horizonte urbano ao amanhecer, panoramica lenta para a direita"
- 4-8s: "Corte para plano medio, o personagem entra pela esquerda, caminhando"
- 9-12s: "Aproximacao para primeiro plano do rosto do personagem, fundo com foco suave"
2. Use linguagem de camera especifica
O modelo compreende termos profissionais de cinematografia:
- Push-in / Pull-out — zoom em direcao ao ou afastando-se do sujeito
- Pan — movimento horizontal de camera
- Tilt — movimento vertical de camera
- Tracking shot — a camera acompanha o movimento do sujeito
- Orbit — a camera gira ao redor do sujeito
- One-take — tomada continua sem cortes
3. Descreva as transicoes
Ao criar sequencias com multiplas tomadas, especifique como as cenas se conectam:
- "Fade da cena externa para primeiro plano interno"
- "Match cut da moeda girando para o globo girando"
- "Transicao com panoramica rapida para a proxima cena"
4. Distinga entre referencia e instrucao
- Referencia: "@video1 for camera movement" — o modelo extrai e replica o trabalho de camera
- Instrucao: "slow push-in from wide to close-up" — o modelo gera o movimento a partir da sua descricao de texto
Capacidades principais
Qualidade de imagem
- Movimento fisicamente preciso (gravidade, caimento de tecidos, dinamica de fluidos)
- Movimento humano e animal suave e natural
- Aderencia precisa ao prompt
- Estilo visual consistente em todo o video
Combinacao multimodal
- Extraia o movimento de camera de um video de referencia
- Extraia a aparencia do personagem de imagens de referencia
- Extraia o ritmo musical do audio de referencia
- Combine os tres em uma unica geracao
Consistencia de personagens
- Preservacao de rosto, vestuario e expressao entre tomadas
- Consistencia dos elementos de marca (logotipos, cores, tipografia)
- Consistencia do estilo da cena (iluminacao, atmosfera)
Replicacao de camera e movimento
- Replique tecnicas cinematograficas especificas de videos de referencia
- Zoom Hitchcock, tracking orbital, sequencias de plano-sequencia
- Correspondencia precisa de velocidade e ritmo de movimento
Especificacoes de saida
- Duracao: 4-15 segundos (selecionavel)
- Resolucao: Ate 2K / 1080p
- Proporcoes de tela: 16:9 (paisagem), 9:16 (retrato), 1:1 (quadrado)
- Audio: Nativo — inclui sincronizacao de dialogo, musica de fundo, efeitos sonoros
- Velocidade de geracao: ~30 pontos por video de 15 segundos, 10 vezes mais rapido que a geracao anterior
Notas importantes
- Sem rostos humanos reais — envios com rostos humanos reais claramente visiveis sao bloqueados pela moderacao de conteudo
- Qualidade acima da quantidade — envie apenas os recursos que tenham maior impacto no resultado desejado
- Verifique as atribuicoes @ — passe o cursor sobre cada referencia de recurso para confirmar o mapeamento correto do arquivo
- Aleatoriedade do modelo — os resultados variam entre geracoes; gere multiplas vezes e escolha o melhor
- Disponivel em: Jimeng, Doubao, Volcano Engine
Perguntas frequentes
Quais sao os dois modos de criacao?
Modo Primeiro/Ultimo Quadro (uma imagem + texto) para geracoes simples, e modo de Referencia Tudo em Um (ate 12 arquivos multimodais) para producoes complexas.
Como funciona o sistema de referencias @?
Digite @ na caixa de prompt, selecione um arquivo enviado e descreva sua funcao. Exemplo: "@image1 como referencia de personagem, @video1 para movimento de camera." O modelo segue suas atribuicoes com precisao.
Quais sao os limites de entrada?
Ate 9 imagens, 3 clipes de video (≤15s no total), 3 arquivos de audio (≤15s no total) e texto. Maximo de 12 arquivos por geracao.
Qual saida ele produz?
De 4 a 15 segundos de video com resolucao de ate 2K com audio nativo, em proporcoes de tela 16:9, 9:16 ou 1:1.
Posso usar fotos de pessoas reais?
Nao. Envios com rostos humanos reais claramente visiveis sao bloqueados pela moderacao de conteudo. Use referencias de personagens estilizados ou ilustrados.
Pronto para comecar a criar? Experimente o Seedance 2.0 agora — teste gratuito disponivel.