Quali sono le due modalita di creazione in Seedance 2.0?

Seedance 2.0 offre due modalita: modalita Primo/Ultimo Fotogramma (carica un'immagine + descrizione testuale per generazioni semplici) e modalita Riferimento Tutto in Uno (combina fino a 12 file tra immagini, video, audio e testo per il massimo controllo creativo).

Come funziona il sistema di riferimenti @ in Seedance 2.0?

Digita @ nella casella del prompt per aprire la lista delle risorse, poi assegna a ogni file caricato un ruolo specifico. Ad esempio: '@image1 come fotogramma iniziale, riferimento @video1 per il movimento della camera, usa @audio1 per la musica di sottofondo'. Il modello segue le tue assegnazioni con precisione invece di indovinare.

Quali sono i limiti di input di Seedance 2.0?

Fino a 9 immagini, 3 clip video (totale ≤15 secondi), 3 file audio in formato MP3 (totale ≤15 secondi) e prompt testuali. Massimo 12 file di riferimento per generazione.

Quale output video produce Seedance 2.0?

Da 4 a 15 secondi di video con risoluzione fino a 2K, con audio nativo (dialoghi, musica, effetti sonori). Rapporti d'aspetto supportati: 16:9, 9:16 e 1:1.

Posso caricare foto di volti umani reali su Seedance 2.0?

No. Seedance 2.0 non consente il caricamento di contenuti con volti umani reali chiaramente visibili: vengono bloccati dal sistema di moderazione dei contenuti. Usa invece riferimenti di personaggi illustrati o stilizzati.

La guida completa a Seedance 2.0: creazione video con IA multimodale da zero

February 12, 2026

Seedance 2.0 e il modello di video IA multimodale di ByteDance che genera video cinematografici da testo, immagini, clip video e audio. Offre due modalita di creazione, un sistema di riferimenti @ per il controllo preciso delle risorse e la generazione di audio nativo, il tutto in un unico flusso di lavoro. Ecco come utilizzare ogni funzionalita.

Due modalita di creazione

Seedance 2.0 offre due punti di accesso, ciascuno adatto a flussi di lavoro diversi:

Modalita Primo/Ultimo Fotogramma

Carica un'immagine come fotogramma di apertura o chiusura
Aggiungi una descrizione testuale del movimento e della scena desiderati
Ideale per: animazioni semplici, conversioni da immagine a video, test rapidi

Modalita Riferimento Tutto in Uno (Consigliata)

Combina immagini + clip video + audio + testo in un'unica generazione
Supporta fino a 12 file di riferimento contemporaneamente
Ideale per: produzioni complesse con risorse multiple, video musicali, narrazioni basate su personaggi

Specifiche di input

Tipo di input	Limite	Cosa controlla
Immagini	Fino a 9	Aspetto dei personaggi, stile della scena, dettagli del prodotto
Clip video	Fino a 3 (totale ≤15s)	Movimento della camera, ritmo dell'azione, effetti di transizione
File audio	Fino a 3 MP3 (totale ≤15s)	Musica di sottofondo, effetti sonori, tono della voce fuori campo
Testo	Linguaggio naturale	Descrizione della scena, istruzioni di azione, atmosfera

Limite totale di file: 12 file di riferimento per generazione.

Il sistema di riferimenti @

Questa e la funzionalita piu importante da imparare. Il sistema @ ti permette di assegnare un ruolo specifico a ogni file caricato: il modello segue le tue assegnazioni con precisione invece di indovinare.

Come usare @

Carica le tue risorse (immagini, video, audio)
Nella casella del prompt, digita @ per aprire il selettore delle risorse
Seleziona un file e descrivi il suo ruolo nella generazione

Esempio di prompt con riferimenti @

@image1 as the opening frame character,
reference @video1 for camera movement (slow push-in to close-up),
use @audio1 for background music,
@image2 as the environment reference.
The character walks toward the camera under warm sunset lighting.

Regole chiave

Ogni file caricato deve essere assegnato esplicitamente con @
Passa il cursore sulle risorse per visualizzarne l'anteprima e verificare di fare riferimento al file corretto
Il modello esegue esattamente cio che assegni, senza indovinare

Tecniche di scrittura dei prompt

1. Scrivi per linea temporale

Suddividi il prompt in segmenti temporali per un controllo preciso:

0-3s: "Campo largo di uno skyline cittadino all'alba, panoramica lenta verso destra"
4-8s: "Stacco su piano medio, il personaggio entra da sinistra, camminando"
9-12s: "Avvicinamento al primo piano del volto del personaggio, sfondo con messa a fuoco morbida"

2. Usa un linguaggio di camera specifico

Il modello comprende i termini professionali della cinematografia:

Push-in / Pull-out — zoom verso o lontano dal soggetto
Pan — movimento orizzontale della camera
Tilt — movimento verticale della camera
Tracking shot — la camera segue il movimento del soggetto
Orbit — la camera ruota attorno al soggetto
One-take — ripresa continua senza interruzioni

3. Descrivi le transizioni

Quando crei sequenze con piu inquadrature, specifica come le scene si collegano:

"Dissolvenza dalla scena esterna al primo piano interno"
"Match cut dalla moneta che gira al globo che ruota"
"Transizione con panoramica rapida alla scena successiva"

4. Distingui tra riferimento e istruzione

Riferimento: "@video1 for camera movement" — il modello estrae e replica il lavoro di camera
Istruzione: "slow push-in from wide to close-up" — il modello genera il movimento dalla tua descrizione testuale

Capacita principali

Qualita dell'immagine

Movimento fisicamente accurato (gravita, drappeggio dei tessuti, dinamica dei fluidi)
Movimento umano e animale fluido e naturale
Aderenza precisa al prompt
Stile visivo coerente in tutto il video

Combinazione multimodale

Estrai il movimento della camera da un video di riferimento
Estrai l'aspetto del personaggio da immagini di riferimento
Estrai il ritmo musicale dall'audio di riferimento
Combina tutti e tre in un'unica generazione

Coerenza dei personaggi

Preservazione di volto, abbigliamento ed espressione tra le inquadrature
Coerenza degli elementi del brand (loghi, colori, tipografia)
Coerenza dello stile della scena (illuminazione, atmosfera)

Replicazione di camera e movimento

Replica tecniche cinematografiche specifiche da video di riferimento
Zoom Hitchcock, tracking orbitale, sequenze in piano-sequenza
Corrispondenza precisa di velocita e ritmo del movimento

Specifiche di output

Durata: 4-15 secondi (selezionabile)
Risoluzione: Fino a 2K / 1080p
Rapporti d'aspetto: 16:9 (orizzontale), 9:16 (verticale), 1:1 (quadrato)
Audio: Nativo — include sincronizzazione dei dialoghi, musica di sottofondo, effetti sonori
Velocita di generazione: ~30 punti per video di 15 secondi, 10 volte piu veloce della generazione precedente

Note importanti

Nessun volto umano reale — i caricamenti con volti umani reali chiaramente visibili vengono bloccati dalla moderazione dei contenuti
Qualita prima della quantita — carica solo le risorse che hanno il maggiore impatto sul risultato desiderato
Verifica le assegnazioni @ — passa il cursore su ogni riferimento per confermare la corretta mappatura del file
Casualita del modello — i risultati variano tra le generazioni; genera piu volte e scegli il migliore
Disponibile su: Jimeng, Doubao, Volcano Engine

Domande frequenti

Quali sono le due modalita di creazione?

Modalita Primo/Ultimo Fotogramma (un'immagine + testo) per generazioni semplici, e modalita Riferimento Tutto in Uno (fino a 12 file multimodali) per produzioni complesse.

Come funziona il sistema di riferimenti @?

Digita @ nella casella del prompt, seleziona un file caricato e descrivi il suo ruolo. Esempio: "@image1 come riferimento del personaggio, @video1 per il movimento della camera." Il modello segue le tue assegnazioni con precisione.

Quali sono i limiti di input?

Fino a 9 immagini, 3 clip video (≤15s totali), 3 file audio (≤15s totali) e testo. Massimo 12 file per generazione.

Quale output produce?

Da 4 a 15 secondi di video con risoluzione fino a 2K con audio nativo, in rapporti d'aspetto 16:9, 9:16 o 1:1.

Posso usare foto di persone reali?

No. I caricamenti con volti umani reali chiaramente visibili vengono bloccati dalla moderazione dei contenuti. Usa riferimenti di personaggi stilizzati o illustrati.

Pronto per iniziare a creare? Prova Seedance 2.0 ora — prova gratuita disponibile.