====== Doppiaggio audio con Ardour ====== Per doppiare un video sostitutendo o mixando l'audio originale con musiche, ecc. si può utilizzare il programma Ardour. In questi appunti un possibile metodo di lavoro da utilizzare. Ardour è ovviamente un programma grafico, quindi il processo di lavoro è visuale e non trasformabile in procedura batch da riga di comando. Per alcuni suggerimenti vedere il paragrafo sull'uso di **[[..:audio_video#mouse_e_tastiera|mouse a testiera con Ardour]]**. ===== Estrazione traccia audio originale ===== La traccia audio originale verrà usata come riferimento per allineare i brani musicali da abbinare al video. **ATTENZIONE** alla conversione del file in formato WAV: controllare con ''mediainfo'' che la durata sia esattamente quella del video originale, al secondo! Può capitare che l'estrazione con ''ffmpeg'' e la successiva conversione in wav (ad esempio con Audacity) produca un file più corto di qualche secondo (1 secondo ogni 10 minuti di durata). ffmpeg -i video.mp4 -vn -c:a copy audio.m4a ffmpeg -i 2018-05_portogallo.m4a -af aresample=async=1 2018-05_portogallo.fix.wav Per estrarre una traccia audio che non sia la prima, ad esempio la seconda: ffmpeg -i video.mkv -map '0:a:1' -vn -c:a copy audio_track2.m4a L'opzione **%%-map%%** è costituita da tre parti: l'indice del file di input (**zero** seleziona il primo file), il tipo di flusso (**a** per audio) e l'indice del flusso che si intende selezionare (**2** per la seconda traccia audio). Senza ulteriori indicazioni tale flusso audio diventerà il primo (indice zero) nel file destinazione. ===== Importazione della traccia video ===== Ardour è un programma per la manipolazione delle tracce audio, tuttavia consente di associare una traccia video per verificarne la sincronizzazione, ecc. Dal menu **Session** => Open video => **Transcode (640 VGA)**. Il programma provvede a creare una versione ridotta del video (in questo caso in bassissima risoluzione 640px), salvandola nella directory di lavoro del progetto. Per questo tipo di attività è necessario aver installato il tool **ffmpeg** e **xjadeo** dagli omonimi pacchetti Debian. ===== Conversione dei brani audio ===== Per importare in Ardour i brani musicali vanno convertiti in WAV quelli non direttamente supportati (es. i file MP3 e le tracce M4A solitamente estratte dai video MP4). Per questo si può utilizzare **sox** (dall'omonimo pacchetto Debian): sox file.mp3 file.wav ===== Manipolazione di tracce e regioni ===== Con Ardour si inizia un **nuovo progetto**, impostare **48 kHz, 32 bit float, stereo**, che sono i parametri che vanno per la maggiore nei video MP4 in alta risoluzione. Quando il progetto è avviato (pulsante **Start**) il sistema audio ALSA sarà impegnato in modo esclusivo, altri programmi non potranno usare l'audio. Con Ardour si **importano** le varie **tracce musicali** (menu //Session// => //Import//). Conviene scegliere il **mapping one track per file**, altrimenti il canale destro e sinistro vengono importati come tracce separate. Se necessario il programma provvede automaticamente alla conversione del sample rate. Attenzione al **fader** di ogni traccia: se per caso viene spostato con il mouse, fare **Ctrl-click** per resettarlo al **valore predefinito di 0 dB**. {{..:ardour:track_fader.png?direct&220|Track Fader}} Ogni **traccia** può essere manipolata separatamente (es. spostata nella timeline, ecc.), inizialmente la traccia è costituita da un'unica **regione**, ma è possibile effettuare ad esempio un taglio per ottenere due regioni manipolabili separatamente. L'oggetto che viene manipolato infatti è la singola regione, non l'intera traccia. === Spostare === === Tagliare un pezzo === * Strumento forbici * Zoom opportuno * Click sul punto: taglia immediatamente la traccia * Strumento selezione, click sul pezzo da togliere, menu //Region// => //Remove// === Bloccare una singola regione === * Dopo averla selezionata, menu //Region// => //Position// => //Lock// === Fade in/out === * Con lo strumento "Grab mode" cliccare una regione * Trascinare il quadretto che appare all'estremità ===== Esportare tutto il lavoro in WAV ===== * //Session// => //Export// => //Export to Audio File(s)// * **File formats**: impostare **WAV 16 bit, 48 KHz**. Eventualmente si può abilitare il **Normalize**, che viene applicato alla fine del rendering sull'intera sessione. * **Time Span**: Controllare che sia pari alla lunghezza originale. Se c'è qualcosa di troppo aggiustare il tag **end** nella barra **Location markers**. * **Channels**: selezionare solo il **Master**, gli altri canali possono restare deselezionati. ATTENZIONE: Se nel progetto c'è l'audio originale in presa diretta che non va incluso, si deve agire di conseguenza: **selezionare tutte le tracce ad eccezione dell'audio in presa diretta**. In questo caso selezionare o meno il Master è ininfluente. ===== Normalizzazione ===== In generale, se si sono stabiliti accuratamente i livelli di guadagno per ogni traccia, è preferibile non effettuare la normalizzazione in fase di esportazione. ==== Normalizzazione Peak ==== La normalizzazione **Peak** va a cercare il campione numerico di valore più alto (dopo aver applicato i livelli di gain impostati nel progetto) e lo normalizza al valore prescelto di **dBFS**. Impostando **Normalize Peak, 0 dBFS** la traccia risultante conterrà valori **fino al fondo scala**. Se si desidera stare lontani da possibili clipping degli apparati in fase di riproduzione, è preferibile utilizzare valori inferiori. ==== Normalizzazione Loudness ==== La normalizzazione **Loudness** analizza la traccia audio utilizzando le [[wpit>Diagramma_di_uguale_intensità_sonora|curve Fletcher Munson]] (curve di uguale [[wpit>Pressione acustica|pressione acustica]] al variare delle frequenze audio). Impostando un valore **LUFS** (Loudness relative to Full Scale) in decibel è possibile ottenere la //loudness// desiderata (cioè la percezione soggettiva della pressione acustica) rispetto al fondo scala (massima pressione sonora riproducibile). Ad esempio una **LUFS** di **-14.00 dB** significa un pressione acustica pari a circa il **20%** della massima rappresentabile (vedere questa [[:tecnica:misc:decibel#attenuazione_di_tensione|tabella di attenuazione]]). Il servizio streaming di //Apple Music// utilizza una LUFS pari a -16 dB, il profilo //Spotify Loud// è di -11, CD e DVD invece si spingono di più verso il fondo scala con LUFS di -9.00 dB. Inoltre, con il parametro **dBTP** (dB True Peak), è possibile definire lo scostamento della traccia risultante dal valore di fondo scala. Se si desidera utilizzare al 100% la gamma dinamica bisogna impostare 0 dBTP, ma è opportuno lasciare un piccolo margine di sicurezza; normalmente CD e DVD utilizzano 0.1 dBTP, mentre i servizi di streaming musicale spesso utilizzano valori molto più conservativi, addirittura di **-1.0** (Spotify) o **-2.0** (Amazon Music). Per una **normalizzazione Loudness** io consiglio di partire con dei valori di **-15.00 LUFS** e **-0.20 dBTP**, quindi verificare il risultato ottenuto. * **[[https://manual.ardour.org/mixing/basic-mixing/loudness-analyzer-and-normalizer/|The Ardour Manual - Loudness Analyzer and Normalizer]]** * **[[https://www.kits.ai/glossary/dbtp-decibels-true-peak|dbTP Decibels True Peak]]** * **[[https://emastered.com/it/blog/what-are-lufs|What are LUFS: The Complete Beginner's Guide]]**