From 1f2429c7ff97669ea2942ed6b87219aef66e4169 Mon Sep 17 00:00:00 2001 From: ptt Date: Wed, 5 Dec 2007 19:06:12 +0000 Subject: initial submit for revision... 24% synced with r22753 git-svn-id: svn://svn.mplayerhq.hu/mplayer/trunk@25307 b3059339-0415-0410-9bf9-f77b7e298cf2 --- DOCS/xml/it/encoding-guide.xml | 5326 ++++++++++++++++++++++++++++++++++++++++ 1 file changed, 5326 insertions(+) create mode 100644 DOCS/xml/it/encoding-guide.xml (limited to 'DOCS') diff --git a/DOCS/xml/it/encoding-guide.xml b/DOCS/xml/it/encoding-guide.xml new file mode 100644 index 0000000000..136ee17da4 --- /dev/null +++ b/DOCS/xml/it/encoding-guide.xml @@ -0,0 +1,5326 @@ + + + +La codifica con <application>MEncoder</application> + + +Produrre un rip di un film da DVD in un + MPEG-4 ("DivX") di alta qualità + + +Una domanda frequente è "Come posso generare il rip con la migliore quallità +per una dimensione data?". Un'altra domanda è "Come posso fare il rip da DVD +migliore in assoluto? Non mi interessa la dimensione del file, voglio solo la +più alta qualità." + + + +L'ultima domanda è perlomeno forse posta malamente. Dopo tutto, se non ti +interessa la dimensione del file, perché non ti copi semplicemente l'intero +flusso video MPEG-2 dal DVD? Certo, avrai un AVI di 5GB, prendere o lasciare, +ma se vuoi la miglior qualità e non ti importa della dimensione, è +sicuramente la scelta migliore. + + + +Invero, la ragione per cui vuoi codificare un DVD in MPEG-4 è proprio perché +ti interessa davvero la dimensione del file. + + + +E' difficile offrire una ricetta da libro su come generare un rip da DVD in +qualità molto alta. Bisogna considerare vari fattori, e dovresti comprendere +questi dettagli, altrimenti alla fine probabilmente sarai insoddisfatto del +risultato. Più sotto evidenziamo alcuni di questi argomenti e poi passiamo ad +esaminare un esempio. Partiamo dal principio che per codificare il video tu +stia usando libavcodec anche se la +teoria si applica allo stesso modo agli altri codec. + + + +Se questo ti sembra troppo, dovresti probabilmente usare una delle belle +interfacce elencate nella +sezione su MEncoder +nella pagina dei progetti collegati (related projects). +In tal modo riuscirai ad ottenere rip di alta qualità senza pensarci troppo, +dato che la maggior parte di questi strumenti sono progettati per prendere +decisioni sagge al tuo posto. + + + + + +Prepararsi alla codifica: identificare il materiale sorgente e la frequenza fotogrammi (framerate) + + +Prima ancora di pensare a codificare un film, devi fare alcuni passi +preliminari. + + + +Il primo e più importante passo prima della codifica dovrebbe essere +determinare il tipo di contenuto che stai trattando. +Se il tuo materiale di partenza arriva da un DVD o da TV in +broadcast/via cavo/satellite, sarà salvato in uno dei due formati: NTSC per +il Nord America e il Giappone, PAL per l'Europa, etc... +E' importante tuttavia comprendere che questo è solo il formato per la +trasmissione in televisione, e spesso non +corrisponde al formato originario del film. +L'esperienza insegna che il materiale NTSC è molto più difficile da +codificare, perché ci sono più elementi da identificare nel sorgente. +Per generare una codifica adeguata, devi sapere il formato originario. +Il non tenerne conto porterà a molti __flaws__ nella tua codifica, inclusi +artefatti orrendi __combing__ (interlacing) e fotogrammi duplicati o addirittura +perduti. +Oltre ad essere brutti, gli artefatti influenzano negativamente l'efficenza +della codifica: otterrai una peggior qualità a parità di bitrate. + + + + +Identificare la frequenza fotogrammi (framerate) del sorgente + + +C'è qui un elenco di tipi comuni di materiale sorgente, dove facilmente si +trovano e le loro proprietà: + + + + + Film standard: prodotti per la visione + su schermi da cinema a 24fps. + + + Video PAL: registrati con una videocamera + PAL a 50 campi al secondo. + Un campo è composto dalle sole linee pari o dispari di un fotogramma. + La televisione è stata progettata per aggiornarle alternativamente come un + metodo economico di compressione analogica. + L'occhio umano teoricamente compensa la cosa, ma una volta che capisci come + funziona l'interlacciatura imparerai a vederla anche in TV e non ti piacerà + più la TV. + Due campi non fanno un fotogramma intero, + poiché sono registrati a 1/50 di secondo di distanza nel tempo e quindi non + si allineano a meno che non ci sia movimento alcuno. + + + Video NTSC: registrati con una videocamera + NTSC a 60000/1001 campi al secondi, o 60 campi al secondo nell'era precedente + al colore. + Per il resto sono simili ai PAL. + + + Animazione: solitamente disegnati a 24fps, + ma se ne trovano anche in tipologie con frequenza di fotogrammi mista. + + + Computer Graphics (CG): possono essere con + qualsiasi frequenza di fotogrammi, ma alcuni sono più comuni di altri; + sono tipici 24 e 30 fotogrammi al secondo per NTSC e 25fps per PAL. + + + Vecchi Film: varie e più basse frequenze di + fotogrammi. + + + + + + +Identificare il materiale sorgente + + +I film composti da fotogrammi sono indicati come "progressivi", mentre quelli +composti da campi indipendenti sono chiamati "interlacciati" o video - anche se +quest'ultimo termine è ambiguo. + + + +Per complicare ulteriormente le cose, alcuni film possono essere un misto di +molti dei suddetti. + + + +La più importante distinzione da farsi tra tutti questi formati è che alcuni +sono basati su fotogrammi mentre gli altri sono basati su campi. +Ogniqualvolta un film viene preparato per la +visualizzazione in televisione (DVD inclusi), viene convertito in un formato +basato su campi. +I vari metodi con cui si può fare sono conosciuti nel loro insieme come +"telecine", di cui il tristemente famoso "3:2 pulldown" NTSC è una tipologia. +A meno che il materiale originale sia anch'esso basato su campi (e con la stessa +frequenza di campi) otterrai un filmato in un formato diverso da quello che è +in origine. + + + +Ci sono vari tipi usuali di "pulldown": + + Pulldown PAL 2:2: il più bello di tutti. + Ciascun fotogramma viene mostrato per la durata di due campi, estraendo le + linee pari e dispari e mostrandole alternativamente. + Se il materiale di origine è a 24fps questo processo velocizza il filmato + del 4%. + + + Pulldown PAL 2:2:2:2:2:2:2:2:2:2:2:3: + Ogni dodicesimo fotogramma viene mostrato per la durata di tre campi, invece + che solamente per due. + Questo evita il problema dell'aumento del 4% di velocità, ma rende il + processo molto più difficile da __reversare__. + Solitamente viene usato nelle produzioni musicali, dove modificare del 4% la + velocità rovinerebbe pesantemente la colonna sonora. + + + Telecine NTSC 3:2: i fotogrammi vengono + mostrati alternativamente per la durata di 3 o 2 campi. + Questo porta ad una frequenza di campi di 2.5 volte la frequenza orginaria. + Il risultato viene anche leggermente rallentato da 60 campi al secondo fino a + 60000/1001 campi al secondo, per mantenere la frequenza dei campi di NTSC. + + + Pulldown NTSC 2:2: utilizzato per mostrare + materiale a 30fps su NTSC. + Carino, proprio come il pulldown PAL 2:2. + + + + +Ci sono anche alcuni metodi per convertire tra video NTSC e PAL, ma gli +arogmenti relativi non sono obiettivo di questa guida. +Se ti trovi di fronte a un film di questo genere e lo vuoi codificare, la tua +scelta migliore è cercarne una copia nel formato originale. +La conversione tra questi due formati è altamente distruttiva e non può +essere __reversed__ in maniera pulita, perciò la tua codifica __soffrirà__ +molto se eseguita da una sorgente convertita. + + + +Quando il video viene salvato du un DVD, coppie consecutive di campi sono +raggruppati in un fotogramma, anche se non sono pensati per esser mostrati +nello stesso momento. +Lo standard MPEG-2 usato sui DVD e per la TV digitale fornisce un modo sia per +codificare i fotogrammi progressivi originali, che uno per memorizzare +nell'intestazione del fotogramma il numero dei campi per cui il fotogramma +stesso debba essere mostrato. +Se viene usato questo metodo il filmato verrà spesso indicato come +"soft telecine", visto che il procedimento indica semplicemente al lettore DVD +di applicare il pulldown al film, invece che modificare il film stesso. +Questa situazione è decisamente preferibile, dato che può essere facilmente +__reversed__ (__actually ignored__) dal condificatore, e dato che mantiene la +massima qualità. +Tuttavia, molti studi di produzione DVD e di trasmissione non usano tecniche di +codifica appropriate, ma al contrario producono filmati con "hard telecine", in +cui i campi sono sotanzialmente duplicati nell'MPEG-2 codificato. + + + +Le modalità per gestire questi casi verranno descritte +più avanti in questa guida. +Per adesso ti lasciamo alcune indicazioni su come identificare il tipo di +materiale che stai trattando: + + + +Regioni NTSC: + + Se MPlayer dice che la frequenza fotogrammi passa + a 24000/1001 durante la visione del film e non ritorna come prima, è quasi + sicuramente un qualche contenuto progressivo che è stato modificato in + "soft telecine". + + + Se MPlayer dice che la frequenza fotogrammi va + avanti e indietro tra 24000/1001 e 30000/1001 e ogni tanto vedi delle "righe", + allora ci sono varie possibilità. + Le parti a 24000/1001 fps sono quasi certamente contenuto progressivo, in + "soft telecine", ma le parti a 30000/1001 fps possono essere sia contenuto in + "hard telecine" a 24000/1001 fps che video NTSC a 60000/1001 campi al secondo. + Usa le stesse linee guida dei due casi seguenti per determinare quale. + + + Se MPlayer non mostra mai una modifica alla + frequenza dei fotogrammi e ogni singolo fotogramma con del movimento appare + "rigato", il tuo filmato è video NTSC a 60000/1001 campi al secondo. + + + Se MPlayer non mostra mai una modifica alla + frequenza dei fotogrammi e due fotogrammi ogni cinque sono "rigati", il tuo + film è contenuto a 24000/1001fps in "hard telecine". + + + + +Regioni PAL: + + Se non vedi mai alcuna "riga", il tuo film è pulldown 2:2. + + + Se vedi delle "righe" che vanno e vengono ogni mezzo secondo, + allora il tuo film è pulldown 2:2:2:2:2:2:2:2:2:2:2:3. + + + Se vedi sempre "righe" durante il movimento, allora il tuo film è video + PAL a 50 campi al secondo. + + + +Consiglio: + + MPlayer può rallentare la riproduzione del film + con l'opzione -speed o riprodurlo fotogramma per fotogramma. + Prova ad usare 0.2 per guardare molto lentamente il + film o premi ripetutamente il tasto "." per riprodurre un + fotogramma per volta ed identificare la sequenza, se non riesci a vederla a + velocità normale. + + + + + + + + +Quantizzatore costante vs. multipassaggio + + +E' possibile codificare il filmato in un'ampia gamma di qualità. +Con i codificatori video moderni e un pelo di compressione pre-codec +(ridimensionando e ripulendo), è possibile raggiungere una qualità molto +buona in 700 MB, per un film di 90-110 minuti in widescreen. +Inoltre tutti i film tranne i più lunghi possono essere codificati con una +qualità pressoché perfetta in 1400 MB. + + + +Ci sono tre approcci per codificare il video: bitrate costante (CBR), +quantizzatore costante, e multipassaggio (ABR, o bitrate medio). + + + +La complessità dei fotogrammi di un filmato, e di conseguenza il numero di +bit necessari per comprimerli, può variare molto da una scena ad un'altra. +I codificatori video moderni possono adattarsi via via a queste necessità +e cambiare il bitrate. +In modalità semplici come CBR, tuttavia, i codificatori non sanno il bitrate +necessario alle scene venture e perciò non possono stare sopra al bitrate +richiesto per lunghi periodi di tempo. +Modalità più avanzate, come la codifica in multipassaggio, possono tener +conto delle statistiche del passo precedente; questo corregge il problema +suddetto. + + +Nota: + +La maggior parte dei codec che gestisce la codifica in ABR può usare solo la +codifica a due passaggi mentre altri come +x264, +Xvid e +libavcodec gestiscono il +multipassaggio, che migliora leggermente la qualità ad ogni passo, anche se +tale moglioramento non è più misurabile né visibile veramente oltre il +quarto passo o giù di lì. +Perciò in questa sezione due passaggi e multipassaggio avranno lo stesso +significato. + + + + +In ambedue i modi, il codec video (come +libavcodec) spezza il fotogramma video +in macroblocchi da 16x16 pixel e poi applica un quantizzatore a ciascun +macroblocco. Più basso è il quantizzatore, migliore sarà la qualità e +più alto il bitrate. +Il metodo usato dal codificatore del filmato per determinare quale quantizzatore +utilizzare per un dato macroblocco varia ed è altamente configurabile. +(Questa è una semplificazione estrema del vero processo, ma il concetto di base +è comodo per capire.) + + + +Quando specifichi un bitrate constante, il codec video codificherà il video, +scartando dettagli tanto quanto è necessario e il meno possibile, in modo da +rimanere al di sotto del bitrate voluto. Se non ti interessa davvero la +dimensione del file, potresti anche usare CBR e specificare un bitrate +infinito. (In pratica, questo significa un valore abbastanza alto da non porre +limiti, come 10000Kbit.) Con nessun limite sul bitrate, il risultato è che il +codec userà il quantizzatore più basso possibile per ciascun macroblocco +(come specificato da per +libavcodec, che è 2 di default). +Appena specifichi un bitrate abbastanza basso tale che il codec venga forzato +ad utilizzare un quantizzatore più alto, allora stai sicuramente diminuendo la +qualità del tuo video. +Per evitarlo, dovresti probabilmente ridurre la dimensione del tuo video, +seguendo il metodo descritto più avanti in questa guida. +In generale dovresti evitare del tutto CBR se ti interessa la qualità. + + + +Con il quantizzatore costante, il codec utilizza lo stesso quantizzatore per +ogni macroblocco, come specificato dall'opzione (per +libavcodec). +Se vuoi la più alta qualità possibile di rip, sempre ignorantdo il bitrate, +puoi usare . +Ciò porterà gli stessi bitrate e PSNR (peak signal-to-noise ratio) come CBR +con =infinito e di default a 2. + + + +Il problema con la quantizzazione costante è che usa il quantizzatore indicato +sia che il macroblocco ne abbia bisogno o no. Perciò è possibile che venga +usato un quantizzatore più alto su un macroblocco senza sacrificare la +qualità visiva. Perché sprecare i bit di un quantizzatore basso che non +serve? La tua CPU ha tanti cicli fin quando c'è tempo, ma c'è solo un certo +numero di bit sul tuo disco rigido. + + + +Con una codifica a due passi, il primo codificherà il filmato come se fosse +CBR, ma manterrà una registrazione delle caratteristiche di ogni fotogramma. +Questi dati sono poi utilizzati durante il secondo passo in modo da effettuare +scelte intelligenti su quale quantizzatore usare. Durante le scene con azione +veloce o molti dettagliate, verrano usati più probabilmente quantizzatori più +alti, e durante scene lente o con pochi dettagli, verranno usati quantizzatori +più bassi. Solitamente è molto più importante la quantità di movimento +che la quantità di dettagli. + + + +Se usi , allora stai sprecando dei bit. Se usi +, allora non stai ottenendo la miglior qualità. +Supponi di rippare un DVD a e che il risultato sia +1800Kbit. Se fai una codifica a due passi con il +video risultante avrà una qualità superiore +a parità di bitrate. + + + +Dato che ora sei convinto che i due passaggi siano la strada da percorrere, la +vera domanda adesso è quale bitrate usare? La risposta à che non c'è una +risposta definitiva. Idealmente vuoi scegliere un bitrate che porti al miglior +equilibrio tra qualità e dimensione del file. Tutto ciò varia in dipendenza +del video di origine. + + + +Se la dimensione non è importante, un buon punto di partenza per un rip di +qualità molto elevata è intorno a 2000Kbit più o meno 200Kbit. +Per video con scene di azione veloce o con molti dettagli, oppure se +semplicemente hai l'occhio critico, potresti scegliere 2400 o 2600. +Per alcuni DVD potresti non notare alcuna differenza a 1400Kbit. Sperimentare +con alcune scene a vari bitrate è una buona idea per farsi un'opinione. + + + +Se punti a una data dimensione, dovrai calcolare il bitrate in un qualche modo. +Prima di farlo, però, devi sapere quanto spazio devi riservare per la traccia +(le tracce) audio, per cui devi dapprima fare il +rip di queste. +Puoi calcolare il bitrate con l'equazione che segue: +bitrate = (dimensione_voluta_in_Mbytes - dimensione_audio_in_Mbytes) +* 1024 * 1024 / lunghezza_in_secondi * 8 / 1000 +Per esempio, per far stare un film di due ore su un CD da 702MB, con 60MB di +traccia audio, il bitrate video diventerà: +(702 - 60) * 1024 * 1024 / (120*60) * 8 / 1000 += 740kbps + + + + + + +Vincoli per una codifica efficiente + + +A causa della natura del tipo di compressione MPEG, ci sono alcuni vincoli da +seguire per avere la massima qualità. +L'MPEG divide il video in quadrati da 16x16 chiamati macroblocchi, ciascuno di +essi composto da blocchi 4x4 con informazioni sulla luminanza (intensità) e +due blocchi da 8x8 a metà risoluzione per la crominanza (colore) (uno per +l'asse rosso-ciano e l'altro per l'asse blu-giallo). +Anche se la larghezza e l'altezza del tuo filmato non sono multipli di 16 il +codificatore userà tanti macroblocchi 16x16 in modo da coprire tutta la +superficie dell'immagine, e lo spazio in esubero sarà sprecato. +Indi, per migliorare la qualità a una dimensione prefissata è una brutta +idea utilizzare dimensioni che non siano multiple di 16. + + + +La maggior parte dei DVD ha anche alcune con bordi neri sui lati. Lasciarli lì +avrà un'influenza molto negativa sulla +qualità in svariati modi. + + + + + + Il tipo di compressione MPEG è pesantemente dipendente dalle trasformazioni + di dominio frequenti, in particolare la "trasformazione discreta del coseno" + (Discrete Cosine Transform (DCT)), che xxièe' simile alla trasformazione di + Fourier. Quest'approccio di codifica è efficiente nella rappresentazione di + motivi e transizioni delicate, ma trova difficoltà con spigoli più + definiti. Per codificarli deve usare molti più bit oppure apparirà un + artefatto conosciuto come 'ringing'. + + + + La trasformazione di frequenza (DCT) prende luogo separatemente in ogni + macroblocco (praticamente in ogni blocco) perciò questo problema si applica + solo quando lo spigolo definito è dentro a un blocco. Se il bordo nero inizia + esattamente sul lato di un multiplo di 16, questo non e' un problema. + Tuttavia i bordi neri sui DVD difficilmente sono ben allineati, perciò + nella realtà dovrai sempre tagliarli via per evitare questi problemi. + + + + + +Oltre alle trasformazioni del dominio di frequenza, il tipo di compressione +MPEG usa dei vettori di movimento per rappresetare le variazioni da un +fotogramma al successivo. Naturalmente i vettori di movimento funzionano molto +meno bene per i nuovi contenuti che arrivano dai bordi dell'immagine, dato che +non erano presenti nel fotogramma precedente. Fintanto che l'immagine arriva +fino al bordo dell'area codificata, i vettori di movimento non incontrano +alcun problema con li contenuto che esce dall'immagine. Tuttavia ci possono +esser problemi quando ci sono dei bordi neri: + + + + + + Per ogni macroblocco il tipo di compressione MPEG memorizza un vettore, che + identifica quale parte del fotogramma precedente debba essere copiata nel + macroblocco stesso, come base per predire il fotogramma successivo. Serve + codificare solo le differenze restanti. Se un macroblocco oltrepassa il + bordo dell'immagine e contiene parte del bordo nero, allora i vettori di + movimento provenienti da altre zone dell'immagine ricopriranno il bordo + nero. Questo significa che si devono utilizzare molti bit o per riannerire il + bordo che è stato ricoperto, oppure (più verosimilmente) un vettore di + movimento non sarà proprio usato e tutti i cambiamenti in questo + macroblocco dovranno venir esplicitamente codificate. In un modo o nell'altro + si ricuce di gran lunga l'efficienza della codifica. + + + + Inoltre questo problema si applica solo se i bordi neri non sono allinati + su limiti di multipli di 16. + + + + + + Immagina infine di avere un macroblocco all'interno dell'immagine, ed un + oggetto che passa da questo blocco verso il bordo dell'immagine. La + codifica MPEG non può dire "copia la parte che è dentro all'immagine, ma + non il bordo nero". Perciò anche il bordo nero vi verrà copiato + all'interno, e molti bit saranno sprecati codificando l'immagine che si + suppone stia lì. + + + + Se l'immagine arriva al limite della superficie codificata, l'MPEG ha una + particolare ottimizzazione che consta nel copiare ripetutamente i pixel sul + bordo dell'immagine quando un vettore di movimento arriva dall'esterno della + superficie codificata. Questa funzionalità diventa inutile quando il film + ha dei bordi neri. Diversamente dai problemi 1 e 2, allineare i bordi a + multipli di 16 in questo caso non aiuta. + + + + + A dispetto del fatto che i bordi siano completamente neri e non cambino mai, + c'è perlomeno un piccolo spreco nell'avere più macroblocchi. + + + + +Per tutte queste ragioni si consiglia di tagliar via completamente i bordi neri. +Inoltre, se c'è una zona di rumore/distorsione sui bordi dell'immagine, +tagliarla migliorerà ancora l'efficienza di codifica. I puristi videofili che +vogliono mantenere il più possibile l'originale potrebbero obiettare su questo +taglio, ma a meno di non codificare a una quantizzazione costante, la qualità +guadagnata tagliando sorpasserà di gran lunga la quantità di informazioni +perse sui bordi. + + + + + + +Tagliare e Ridimensionare + + +Ricorda dalla sezione precedente che la dimensione finale dell'immagine che +codifichi dovrebbe essere un multiplo di 16 (sia in larghezza che altezza). +Si può ottenere ciò tagliando, ridimensionando o combinando le due cose. + + + +Quando tagli, ci sono alcune linee guida che si devono seguire per evitare di +rovinare il tuo filmato. +Il formato YUV abituale, 4:2:0, memorizza le informazioni sulla crominanza +(colore) sottocampionate, per es. la crominanza viene campionata in ogni +direzione solo la metà di quanto venga la luminanza (intensità). +Osserva questo diagramma, dove L indica i punti di campionamente della +luminanza e C quelli della crominanza. + + + + + + + + + + + + + + + + + + + + + L + L + L + L + L + L + L + L + + + C + C + C + C + + + L + L + L + L + L + L + L + L + + + L + L + L + L + L + L + L + L + + + C + C + C + C + + + L + L + L + L + L + L + L + L + + + + + + +Come puoi vedere, le righe e le colonne dell'immagine vengono sempre a coppie. +Quindi i tuoi valori di spostamento e dimensione devono +essere numeri pari. +Se non lo sono la crominanza non sarà più allineata correttamente con la +luminanza. +In teoria è possibile tagliare con uno spostamento dispari, ma richiede che la +crominanza venga ricampionata, il che potenzialmente è un'operazione in perdita +e non è gestita dal filtro crop. + + + +Inoltre, il video interlacciato viene campionato come segue: + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Campo superiore + Campo inferiore + + + L + L + L + L + L + L + L + L + + + + + + + + + + + C + C + C + C + + + + + + + + + + + + + + + + + + + L + L + L + L + L + L + L + L + + + L + L + L + L + L + L + L + L + + + + + + + + + + + + + + + + + + + C + C + C + C + + + + + + + + + + + L + L + L + L + L + L + L + L + + + L + L + L + L + L + L + L + L + + + + + + + + + + + C + C + C + C + + + + + + + + + + + + + + + + + + + L + L + L + L + L + L + L + L + + + L + L + L + L + L + L + L + L + + + + + + + + + + + + + + + + + + + C + C + C + C + + + + + + + + + + + L + L + L + L + L + L + L + L + + + + + + +Come puoi notare, il motivo non si ripete fino a dopo 4 linee. +Quindi per il video interlacciato, il tuo spostamento sull'asse y e l'altezza +devono essere multipli di 4. + + + +La risoluzione nativa DVD è 720x480 per NTSC e 720x576 per PAL, ma c'è un +flag per l'aspetto che indica se è full-screen (4:3) o wide-screen (16:9). +Molti (se non quasi tutti) i DVD in widescreen non sono esattamente 16:9 e +possono essere sia 1.85:1 o 2.35:1 (cinescope). Questo significa che nel video +ci saranno bordi neri che bisogna tagliare via. + + + +MPlayer fornisce un filtro che rileva i valori di +taglio e fornisce il rettangolo per crop (). +Esegui MPlayer con ed +emetterà le impostazioni di taglio per crop al fine di rimuovere i bordi. +Dovresti lasciare andare avanti il film abbastanza da ottenere valori di taglio +precisi. + + + +Dopodiché prova con MPlayer i valori ottenuti usando +la linea comando emessa da , e correggi il +rettangolo se e come serve. +Il filtro può esserti di aiuto, dato che ti +permette di impostare interattivamente la posizione del rettangolo di taglio +sopra al filmato. +Ricordati di seguire le linee guida sui multipli in modo da non disallineare +i piani di crominanza. + + + +In talune occasioni, il ridimensionamento può essere indesiderabile. +Il ridimensionamento sulla direzione verticale è difficoltoso con video +interlacciato e se vuoi mantenere l'interlacciamento, dovresti evitare il +ridimensionamento. +Se non ridimensionerai, ma vuoi comunque usare dimensioni multiple di 16, +dovrai tagliare di più. +Evita di tagliare di meno, dato che i bordi neri sono un male per la codifica! + + + +Dato che MPEG-4 usa macroblocchi 16x16 vorrai esser sicuro che ambedue le +dimensioni del video che stai per codificare siano multiple di 16, altrimenti +perderai in qualità, soprattutto a bitrate più bassi. Puoi farlo abbassando +la larghezza e l'altezza del rettangolo di taglio al multiplo di 16 più vicino. +Come detto precedentemente, quando tagli, vorrai aumentare lo scostamento Y +della metà della differenza tra la nuova e la vecchia altezza, in modo che il +video risultante sia preso dal centro del fotogramma. Inoltre, a causa del modo +in cui il video DVD viene campionato, assicurati che lo scostamento sia un +numero pari. (Infatti, come regola, non utilizzare mai valori dispari per alcun +parametro quando tagli e ridimensioni un video.) Se non ti va di scartare dei +pixel in più, potresti piuttosto preferire il ridimensionamento del video. +Prenderemo in esame questa situazione più avanti. +Puoi in verità lasciare che tutte le considerazioni suddette vengano fatte +dal filtro , visto che ha un parametro + facoltativo, che è impostato a 16 di default. + + + +Fai anche attenzione ai pixel "mezzi neri" sui bordi. Assicurati di tagliare +anch'essi, altrimenti sprecherai bit più utili altrove. + + + +Dopo aver detto e fatto tutto ciò, probabilmente avrei un vide i cui pixel +non saranno proprio 1.85:1 o 2.35:1, ma piuttosto un valore vicino. Potresti +calcolare a mano il nuovo rapporto di aspetto, ma +MEncoder ha un'opzione per libavcodec chiamata +che lo farà per te. Non aumentare assolutamente le dimensioni del video per +avere i pixel quadrati, a meno che tu non voglia sprecare il tuo spazio disco. +Il ridimensionamento dovrebbe essere eseguito in riproduzione, e per definire +la risoluzione giusta il riproduttore userà l'aspetto memorizzato nell'AVI. +Sfortunatamente non tutti i riproduttori verificano l'informazione sul rapporto +perciò potresti voler comunque effettuare il ridimensionamento. + + + + + + +Scegliere la risoluzione e il bitrate + + +Other parameters such as scaling, cropping, etc. will +not alter the file size unless you +change the bitrate as well!. +A meno che tu non stia per codificare con quantizzazione costante devi +impostare un bitrate. +La logica del bitrate è abbastanza semplice. +Normalmente il bitrate viene misurato in kilobit (1000 bit) al secondo. +La dimensione del filmato sul disco è il bitrate moltiplicato per la durata +del filmato, più un piccolo quantitativo in "surplus" (vedi per esempio la +sezione sul +contenitore AVI). +Altri parametri come ridimensionamento, taglio, etc... +non influiscono sulla dimensione del file a +meno che tu non cambi anche il bitrate! + + + +Il bitrate non è direttamente proporzionale +alla risoluzione. +Tanto per capirci, un file 320x240 a 200 kbit/sec non avrà la stessa qualità +dello stesso filmato a 640x480 e 800 kbit/sec! +Ci sono due ragioni per ciò: + + + Percettiva: noti di più gli artefatti MPEG + quando sono più grandi! + Gli artefatti appaiono a livello dei blocchi (8x8). + Il tuo occhio non noterà errori in 4800 piccoli blocchi tanti quanti ne + vedrà in 1200 grossi blocchi (assumendo che tu li stia ridimensionando tutti + e due a schermo intero). + + + Teorica : quando rimpicciolisci un immagine + ma usi la stessa dimensione dei blocchi (8x8) per la trasformazione spaziale + della frequenza, hai più dati nelle bande ad alta frequenza. In parole + povere, ogni pixel contiene più dettagli di quanti ne contenesse prima. + Quindi anche se la tua immagine rimpicciolita contiene 1/4 delle informazioni + sulle direzioni spaziali, potrebbe ancora contenere una gran parte delle + informazioni nel dominio delal frequenza (assumendo che le alte frequenze + siano sotto-utilizzate nell'immagine di origine a 640x480). + + + + + +Guide precendenti hanno consigliato di scegliere un bitrate e una risoluzione +in base ad un approccio "bit al secondo", ma di solito ciò non è valido a +causa delle ragioni suddette. +Una stima migliore pare essere che il bitrate è proporzionale alla radice +quadrata della risoluzione, per cui 320x240 e 400 kbit/sec sarà +paragonabile a 640x480 a 800 kbit/sec. +Tuttavia ciò non è stato verificato con certezza empirica o teorica. +Inoltre, dato che i filmati hanno diversi livelli di disturbo, dettaglio, angoli +di movimento, etc..., è vano dare consigli generici su bit per lunghezza della +diagonale (analogamente a bit per pixel, usando la radice quadrata). + + +Finora abbiamo parlato della difficoltà nel scegliere un bitrate e una +risoluzione. + + + + +Calcolare la risoluzione + + +I passaggi seguenti ti guideranno nel calcolo della risoluzione per la tua +codifica senza distorcere troppo il video, tenendo in considerazione vari tipo +di informazioni riguardo la sorgente video. +Per prima cosa dovresti calcolare il rapporto di aspetto codificato: +ARc = (Wc x (ARa / PRdvd )) / Hc + + +dove: + + Wc e Hc sono la larghezza e l'altezza del video tagliato, + + + ARa è il rapporto di aspetto mostrato, che di solito è 4/3 o 16/9, + + + PRdvd à il rapporto del pixel del DVD che è uguale a 1.25=(720/576) per DVD + PAL e 1.5=(720/480) per DVD NTSC. + + + + + +Dopo puoi calcolare la risoluzione X e Y, basandoti su un dato fattore +di qualità di compressione (Compression Quality, CQ): +ResY = INT(SQRT( 1000*Bitrate/25/ARc/CQ )/16) * 16 +and +ResX = INT( ResY * ARc / 16) * 16 + + + +Okay, ma cos'è la CQ? +However, if you have a target size for your movie (1 or 2 CDs for instance), +there is a limited total number of bits that you can spend; therefore it is +necessary to find a good tradeoff between compressibility and quality. +Il CQ rappresenta il numero di bit per pixel e per fotogramma in codifica. +Parlando più semplicemente, più alto è la CQ, più difficilmente si vedranno +codificati degli artefatti. + + + +La CQ dipende dal bitrate, dall'efficienza del codec video e dalla risoluzione +del filmato. +Per alzare la CQ, di solito dovrai rimpicciolire il filmato visto che il bitrate +viene calcolato in funzione della dimensione voluta e della lunghezza del +filmato, che sono delle costanti. +Con codec MPEG-4 ASP come Xvid e +libavcodec, una CQ inferiore a 0.18 +solitamente genera un'immagine abbastanza squadrettata, perché non ci sono +abbastanza bit per codificare l'informazione di ogni macroblocco. (MPEG4, come +molti altri codec, ragruppa i pixel in blocchi di pixel per comprimere +l'immagine; se non ci sono abbastanza bit, si vedono i bordi dei blocchi.) +E' saggio anche prendere una CQ compresa tra 0.20 e 0.22 per un rip a 1 CD, +e 0.26-0.28 per un rip a 2 CD con impostazioni standard di codifica. +Opzioni più evolute di codifica come quelle qui indicate per +libavcodec +e +Xvid +dovrebbero permetterti di ottenere la stessa qualità con CQ compresa tra +0.18 e 0.20 per un rip da 1 CD, e da 0.24 a 0.26 per 2 CD. +Con codec MPEG-4 AVC come x264, +puoi usare una CQ che varia da 0.14 a 0.16 con opzioni standard di codifica, e +dovresti riuscire a scendere tra 0.10 e 0.12 con impostazioni avanzate di codifica +x264. + + + +Prendi per favore nota che CQ è solo un valore indicativo, dato che dipende dal +contenuto che viene codificato, una CQ di 0.18 può andar bene per un Bergman, +mentre per un film come Matrix, che contiene molte scene ad alta velocità, no. +D'altro canto è inutile portare la CQ oltre 0.30 dato che sprecherai dei bit +senza avere alcun guadagno visibile in qualità. +Nota anche che come detto precedentemente in questa guida, per video a bassa +risoluzione serve una CQ più alta (in rapporto, per esempio, alla risoluzione +DVD) perché si vedano bene. + + + + + + + +Filtraggio + + +Imparare come usare i filtri video di MEncoder è +essenziale per produrre delle buone codfiche. +Tutta l'elaborazione video è eseguita attraverso i filtri -- taglio, +ridimensionamento, aggiustamento del colore, rimozione del disturbo, rilevamento +margini, deinterlacciatura, telecine, telecine inverso, e deblocco, solo per +nominarne qualcuno. +Insieme con la vasta gamma di formati di entrata gestiti, la varietà dei +filtri disponibili in MEncoder è uno dei suoi +più grandi vantaggi sugli altri programmi similari. + + + +I filtri vengono caricati in catena usando l'opzione -vf: + +-vf filtro1=opzioni,filtro2=opzioni,... + +La maggior parte dei filtri riceve alcune opzioni numeriche separate da due +punti, ma la sintassi per le opzioni cambia da filtro a filtro, indi leggiti la +pagina man per i dettagli sul filtro che desideri usare. + + + +I filtri lavorano sul video nell'ordine in cui vengono caricati. +Per esempio la catena seguente: + +-vf crop=688:464:12:4,scale=640:464 + +dapprima taglia la zona 688x464 dell'immagine con uno scostamento dall'alto a +sinistra di (12,4), e poi ridimensiona il risultato a 640x464. + + + +Taluni filtri devono essere caricati all'inizio o vicino all'inizio della +catena di filtri, in modo da trarre vantaggio dalle informazioni che arrivano +dal decoder video, che potrebbero essere perse o invalidate da altri filtri. +Gli esempi principali sono (post elaborazione +(postprocessing), solo quando esegue operazioni di deblock o dering), + (un altra post elaborazione per eliminare artefatti MPEG), + (telecine inverso), e +(per passare da telecine soft a hard). + + + +In generale vorrai filtrare il meno possibile in modo da rimaner fedele alla +sorgente DVD originale. Il taglio è spesso necessario (com detto sopra), ma +evita di ridimensionare il video. Anche se alcune volte si preferisce +rimpicciolire per poter usare quantizzatori più alti, vogliamo evitare ciò: +ricorda che abbiamo sin dall'inizio deciso di investire bit in qualità. + + + +In più, non reimpostare la gamma, il contrasto, la luminosità, etc... +Quello che si vede bene sul tuo schermo potrebbe non vedersi bene su altro. +Queste modifiche dovrebbero esser fatte solo durante la riproduzione. + + + +Una cosa che voresti però fare è tuttavia far passare il video attraverso un +leggero filtro di rimozione disturbo, come . +Ancora, è una questione di poter meglio utilizzare quei bit: perché sprecarli +codificando disturbo mentre puoi semplicemente aggiungerlo di nuovo durante la +riproduzione? Alzando i parametri per aumenterà +ancora la compressione, ma se aumenti troppo i valori, rischi un degrado pesante +dell'immagine. I valori sopra consigliati () sono +abbastanza conservativi; sentiti libero di sperimentare con valori più alti e +verificare da solo il risultato. + + + + + + +Interlacciamento e Telecine + + +Quasi tutti i film vengono ripresi a 24 fps. Dato che NTSC è 30000/1001 fps, +si devono eseguire alcune elaborazioni affinché questo video a 24 fps sia +letto al giusto framerate NTSC. Il processo è chiamato "3:2 pulldown", meglio +conosciuto come "telecine" (poiché pulldown viene spesso applicato durante il +processo di telecine), e descritto rozzamente, agisce rallentando il film a +24000/1001 fps, e ripetendo ogni quarto fotogramma. + + + +Non viene invece eseguita alcuna elaborazione sul video per i DVD PAL, che +girano a 25 fps. (Tecnicamente, PAL può subire il telecine, chiamato +"2:2 pulldown", ma non è usanza abituale.) Il film a 24 fps viene +semplicemente riprodotto a 25 fps. Il risultato è che il filmato è leggermente +più veloce, ma a meno che tu non sia un alieno, probabilmente non noterai la +differenza. +La maggior parte dei DVD PAL hanno audio corretto ai picchi, in modo che quando +siano riprodotti a 25 fps le cose suonino giuste, anche se la traccia audio +(e quindi tutto il filmato) ha un tempo di riproduzione che è il 4% inferiore +ai DVD NTSC. + + + +A causa del fatto che il video nei DVD PAL non è stato alterato, non dovrai +preoccuperti molto della frequenza fotogrammi. La sorgente è 25 fps, e il tuo +rip sarà a 25 fps. Tuttavia, se stai codificando un film da DVD NTSC, +potresti dover applicare il telecine inverso. + + + +Per film ripresi a 24 fps, il video sul DVD NTSC è o con telecine a 30000/1001, +oppure è progressivo a 24000/1001 fps e destinato a subire il telecine al volo +da un lettore DVD. D'altro canto le serie TV sono solitamente solo +interlacciate, senza telecine. Questa non è una regola ferrea: alcune serie TV +sono interlacciate (come Buffy the Vampire Slayer) mentre alcune sono un misto +di progressivo e interlacciato (come Angel, o 24). + + + +Si consiglia vivamente di leggere la sezione su +Come trattare il telecine e l'interlacciamento nei DVD NTSC +per imparare come gestire le varie possibilità. + + + +Ciononostante, se stai principalmente rippando solo film, solitamente ti +troverai di fronte a video a 24 fps progressivo o con telecine, nel qual caso +puoi usare il filtro . + + + + + + +Codificare video interlacciato + + +Se il film che vuoi codificare è interlacciato (video NTSC o PAL) dovrai +scegliere se vuoi de-interlacciare o no. +Se da un lato de-interlacciare renderà il tuo filmato utilizzabile su +schermi a scansione progressiva come monitor di computer o proiettori, porta +con sé un costo: la frequenza dei campi di 50 o 60000/1001 campi al secondo +viene dimezzata a 25 o 30000/1001 fotogrammi al secondo, e circa la metà delle +informazioni nel tuo film saranno perdute, in scene con movimento significativo. + + + +Per di più, se stai codificando puntando ad alta qualità di archiviazione. +si consiglia di non de-interlacciare. +Puoi sempre de-interlacciare il film durante la riproduzione attraverso +dispositivi a scansione progressiva. +La potenza dei computer attuali forza per i riproduttori l'utilizzo di un filtro +di de-interlacciamento, che porta un leggero degrado dell'immagine. +Ma i lettori del futuro saranno in grado di simulare lo schermo di una TV, +de-interlacciando a piena frequenza di campi e interpolando 50 o 60000/1001 +fotogrammi interi al secondo dal video interlacciato + + + +Bisogna porre speciale attenzione quando si lavora con video interlacciato: + + + + + Altezza e scostamento del taglio devono essere multipli di 4. + + + Qualsiasi ridimensionamento verticale va fatto in modalità interlacciata. + + + I filtri di post elaborazione e di rimozione disturbo potrebbero non + funzionare come ci si aspetta a meno che tu non ponga particolare attenzione + per farli lavorare su un campo per volta, e possono rovinare il video quando + usati in modo non corretto. + + + + +Tenendo a mente queste cose, ecco il nostro primo esempio: + +mencoder capture.avi -mc 0 -oac lavc -ovc lavc -lavcopts \ + vcodec=mpeg2video:vbitrate=6000:ilme:ildct:acodec=mp2:abitrate=224 + +Nota le opzioni e . + + + + + + +Notes on Audio/Video synchronization + + +MEncoder's audio/video synchronization +algorithms were designed with the intention of recovering files with +broken sync. +However, in some cases they can cause unnecessary skipping and duplication of +frames, and possibly slight A/V desync, when used with proper input +(of course, A/V sync issues apply only if you process or copy the +audio track while transcoding the video, which is strongly encouraged). +Therefore, you may have to switch to basic A/V sync with +the option, or put this in your +~/.mplayer/mencoder config file, as long as +you are only working with good sources (DVD, TV capture, high quality +MPEG-4 rips, etc) and not broken ASF/RM/MOV files. + + + +If you want to further guard against strange frame skips and +duplication, you can use both and +. +This will prevent all A/V sync, and copy frames +one-to-one, so you cannot use it if you will be using any filters that +unpredictably add or drop frames, or if your input file has variable +framerate! +Therefore, using is not in general recommended. + + + +The so-called "three-pass" audio encoding which +MEncoder supports has been reported to cause A/V +desync. +This will definitely happen if it is used in conjunction with certain +filters, therefore, it is now recommended not to +use three-pass audio mode. +This feature is only left for compatibility purposes and for expert +users who understand when it is safe to use and when it is not. +If you have never heard of three-pass mode before, forget that we +even mentioned it! + + + +There have also been reports of A/V desync when encoding from stdin +with MEncoder. +Do not do this! Always use a file or CD/DVD/etc device as input. + + + + + + +Choosing the video codec + + +Which video codec is best to choose depends on several factors, +like size, quality, streamability, usability and popularity, some of +which widely depend on personal taste and technical constraints. + + + + + Compression efficiency: + It is quite easy to understand that most newer-generation codecs are + made to increase quality and compression. + Therefore, the authors of this guide and many other people suggest that + you cannot go wrong + + Be careful, however: Decoding DVD-resolution MPEG-4 AVC videos + requires a fast machine (i.e. a Pentium 4 over 1.5GHz or a Pentium M + over 1GHz). + + when choosing MPEG-4 AVC codecs like + x264 instead of MPEG-4 ASP codecs + such as libavcodec MPEG-4 or + Xvid. + (Advanced codec developers may be interested in reading Michael + Niedermayer's opinion on + "why MPEG4-ASP sucks".) + Likewise, you should get better quality using MPEG-4 ASP than you + would with MPEG-2 codecs. + + + + However, newer codecs which are in heavy development can suffer from + bugs which have not yet been noticed and which can ruin an encode. + This is simply the tradeoff for using bleeding-edge technology. + + + + What is more, beginning to use a new codec requires that you spend some + time becoming familiar with its options, so that you know what + to adjust to achieve a desired picture quality. + + + + + Hardware compatibility: + It usually takes a long time for standalone video players to begin to + include support for the latest video codecs. + As a result, most only support MPEG-1 (like VCD, XVCD and KVCD), MPEG-2 + (like DVD, SVCD and KVCD) and MPEG-4 ASP (like DivX, + libavcodec's LMP4 and + Xvid) + (Beware: Usually, not all MPEG-4 ASP features are supported). + Please refer to the technical specs of your player (if they are available), + or google around for more information. + + + + + Best quality per encoding time: + Codecs that have been around for some time (such as + libavcodec MPEG-4 and + Xvid) are usually heavily + optimized with all kinds of smart algorithms and SIMD assembly code. + That is why they tend to yield the best quality per encoding time ratio. + However, they may have some very advanced options that, if enabled, + will make the encode really slow for marginal gains. + + + + If you are after blazing speed you should stick around the default + settings of the video codec (although you should still try the other + options which are mentioned in other sections of this guide). + + + + You may also consider choosing a codec which can do multi-threaded + processing, though this is only useful for users of machines with + several CPUs. + libavcodec MPEG-4 does + allow that, but speed gains are limited, and there is a slight + negative effect on picture quality. + Xvid's multi-threaded encoding, + activated by the option, can be used to + boost encoding speed — by about 40-60% in typical cases — + with little if any picture degradation. + x264 also allows multi-threaded + encoding, which currently speeds up encoding by 94% per CPU core while + lowering PSNR between 0.005dB and 0.01dB on a typical setup. + + + + + + Personal taste: + This is where it gets almost irrational: For the same reason that some + hung on to DivX 3 for years when newer codecs were already doing wonders, + some folks will prefer Xvid + or libavcodec MPEG-4 over + x264. + + + You should make your own judgement; do not take advice from people who + swear by one codec. + Take a few sample clips from raw sources and compare different + encoding options and codecs to find one that suits you best. + The best codec is the one you master, and the one that looks + best to your eyes on your display + + The same encode may not look the same on someone else's monitor or + when played back by a different decoder, so future-proof your encodes by + playing them back on different setups. + ! + + + + + +Please refer to the section +selecting codecs and container formats +to get a list of supported codecs. + + + + + + +Audio + + +Audio is a much simpler problem to solve: if you care about quality, just +leave it as is. +Even AC-3 5.1 streams are at most 448Kbit/s, and they are worth every bit. +You might be tempted to transcode the audio to high quality Vorbis, but +just because you do not have an A/V receiver for AC-3 pass-through today +does not mean you will not have one tomorrow. Future-proof your DVD rips by +preserving the AC-3 stream. +You can keep the AC-3 stream either by copying it directly into the video +stream during the encoding. +You can also extract the AC-3 stream in order to mux it into containers such +as NUT or Matroska. + +mplayer source_file.vob -aid 129 -dumpaudio -dumpfile sound.ac3 + +will dump into the file sound.ac3 the +audio track number 129 from the file +source_file.vob (NB: DVD VOB files +usually use a different audio numbering, +which means that the VOB audio track 129 is the 2nd audio track of the file). + + + +But sometimes you truly have no choice but to further compress the +sound so that more bits can be spent on the video. +Most people choose to compress audio with either MP3 or Vorbis audio codecs. +While the latter is a very space-efficient codec, MP3 is better supported +by hardware players, although this trend is changing. + + + +Do not use when encoding +a file with audio, even if you will be encoding and muxing audio +separately later. +Though it may work in ideal cases, using is +likely to hide some problems in your encoding command line setting. +In other words, having a soundtrack during your encode assures you that, +provided you do not see messages such as +Too many audio packets in the buffer, you will be able +to get proper sync. + + + +You need to have MEncoder process the sound. +You can for example copy the orignal soundtrack during the encode with + or convert it to a "light" 4 kHz mono WAV +PCM with . +Otherwise, in some cases, it will generate a video file that will not sync +with the audio. +Such cases are when the number of video frames in the source file does +not match up to the total length of audio frames or whenever there +are discontinuities/splices where there are missing or extra audio frames. +The correct way to handle this kind of problem is to insert silence or +cut audio at these points. +However MPlayer cannot do that, so if you +demux the AC-3 audio and encode it with a separate app (or dump it to PCM with +MPlayer), the splices will be left incorrect +and the only way to correct them is to drop/dup video frames at the +splice. +As long as MEncoder sees the audio when it is +encoding the video, it can do this dropping/duping (which is usually OK +since it takes place at full black/scenechange), but if +MEncoder cannot see the audio, it will just +process all frames as-is and they will not fit the final audio stream when +you for example merge your audio and video track into a Matroska file. + + + +First of all, you will have to convert the DVD sound into