====== Doppiaggio audio con Ardour ======

Per doppiare un video sostitutendo o mixando l'audio originale con musiche, ecc. si può utilizzare il programma Ardour. In questi appunti un possibile metodo di lavoro da utilizzare. Ardour è ovviamente un programma grafico, quindi il processo di lavoro è visuale e non trasformabile in procedura batch da riga di comando.

Per alcuni suggerimenti vedere il paragrafo sull'uso di **[[..:audio_video#mouse_e_tastiera|mouse a testiera con Ardour]]**.

===== Estrazione traccia audio originale =====

La traccia audio originale verrà usata come riferimento per allineare i brani musicali da abbinare al video.

**ATTENZIONE** alla conversione del file in formato WAV: controllare con ''mediainfo'' che la durata sia esattamente quella del video originale, al secondo! Può capitare che l'estrazione con ''ffmpeg'' e la successiva conversione in wav (ad esempio con Audacity) produca un file più corto di qualche secondo (1 secondo ogni 10 minuti di durata).

<code>
ffmpeg -i video.mp4 -vn -c:a copy audio.m4a
ffmpeg -i 2018-05_portogallo.m4a -af aresample=async=1 2018-05_portogallo.fix.wav
</code>

Per estrarre una traccia audio che non sia la prima, ad esempio la seconda:

<code>
ffmpeg -i video.mkv -map '0:a:1' -vn -c:a copy audio_track2.m4a
</code>

L'opzione **%%-map%%** è costituita da tre parti: l'indice del file di input (**zero** seleziona il primo file), il tipo di flusso (**a** per audio) e l'indice del flusso che si intende selezionare (**2** per la seconda traccia audio). Senza ulteriori indicazioni tale flusso audio diventerà il primo (indice zero) nel file destinazione.

===== Importazione della traccia video =====

Ardour è un programma per la manipolazione delle tracce audio, tuttavia consente di associare una traccia video per verificarne la sincronizzazione, ecc. Dal menu **Session** => Open video => **Transcode (640 VGA)**. Il programma provvede a creare una versione ridotta del video (in questo caso in bassissima risoluzione 640px), salvandola nella directory di lavoro del progetto. Per questo tipo di attività è necessario aver installato il tool **ffmpeg** e **xjadeo** dagli omonimi pacchetti Debian.

===== Conversione dei brani audio =====

Per importare in Ardour i brani musicali vanno convertiti in WAV quelli non direttamente supportati (es. i file MP3 e le tracce M4A solitamente estratte dai video MP4). Per questo si può utilizzare **sox** (dall'omonimo pacchetto Debian):

<code>
sox file.mp3 file.wav
</code>

===== Manipolazione di tracce e regioni =====

Con Ardour si inizia un **nuovo progetto**, impostare **48 kHz, 32 bit float, stereo**, che sono i parametri che vanno per la maggiore nei video MP4 in alta risoluzione. Quando il progetto è avviato (pulsante **Start**) il sistema audio ALSA sarà impegnato in modo esclusivo, altri programmi non potranno usare l'audio.

Con Ardour si **importano** le varie **tracce musicali** (menu //Session// => //Import//). Conviene scegliere il **mapping one track per file**, altrimenti il canale destro e sinistro vengono importati come tracce separate. Se necessario il programma provvede automaticamente alla conversione del sample rate.

Attenzione al **fader** di ogni traccia: se per caso viene spostato con il mouse, fare **Ctrl-click** per resettarlo al **valore predefinito di 0 dB**.

{{..:ardour:track_fader.png?direct&220|Track Fader}}

Ogni **traccia** può essere manipolata separatamente (es. spostata nella timeline, ecc.), inizialmente la traccia è costituita da un'unica **regione**, ma è possibile effettuare ad esempio un taglio per ottenere due regioni manipolabili separatamente. L'oggetto che viene manipolato infatti è la singola regione, non l'intera traccia.

=== Spostare ===

=== Tagliare un pezzo ===

  * Strumento forbici
  * Zoom opportuno
  * Click sul punto: taglia immediatamente la traccia
  * Strumento selezione, click sul pezzo da togliere, menu //Region// => //Remove//

=== Bloccare una singola regione ===

  * Dopo averla selezionata, menu //Region// => //Position// => //Lock//

=== Fade in/out ===

  * Con lo strumento "Grab mode" cliccare una regione
  * Trascinare il quadretto che appare all'estremità

===== Esportare tutto il lavoro in WAV =====

  * //Session// => //Export// => //Export to Audio File(s)//
    * **File formats**: impostare **WAV 16 bit, 48 KHz**. Eventualmente si può abilitare il **Normalize**, che viene applicato alla fine del rendering sull'intera sessione.
    * **Time Span**: Controllare che sia pari alla lunghezza originale. Se c'è qualcosa di troppo aggiustare il tag **end** nella barra **Location markers**.
    * **Channels**: selezionare solo il **Master**, gli altri canali possono restare deselezionati. ATTENZIONE: Se nel progetto c'è l'audio originale in presa diretta che non va incluso, si deve agire di conseguenza: **selezionare tutte le tracce ad eccezione dell'audio in presa diretta**. In questo caso selezionare o meno il Master è ininfluente.

===== Normalizzazione =====

In generale, se si sono stabiliti accuratamente i livelli di guadagno per ogni traccia, è preferibile non effettuare la normalizzazione in fase di esportazione.

==== Normalizzazione Peak ====

La normalizzazione **Peak** va a cercare il campione numerico di valore più alto (dopo aver applicato i livelli di gain impostati nel progetto) e lo normalizza al valore prescelto di **dBFS**. Impostando **Normalize Peak, 0 dBFS** la traccia risultante conterrà valori **fino al fondo scala**. Se si desidera stare lontani da possibili clipping degli apparati in fase di riproduzione, è preferibile utilizzare valori inferiori.

==== Normalizzazione Loudness ====

La normalizzazione **Loudness** analizza la traccia audio utilizzando le [[wpit>Diagramma_di_uguale_intensità_sonora|curve Fletcher Munson]] (curve di uguale [[wpit>Pressione acustica|pressione acustica]] al variare delle frequenze audio). Impostando un valore **LUFS** (Loudness relative to Full Scale) in decibel è possibile ottenere la //loudness// desiderata (cioè la percezione soggettiva della pressione acustica) rispetto al fondo scala (massima pressione sonora riproducibile). Ad esempio una **LUFS** di **-14.00 dB** significa un pressione acustica pari a circa il **20%** della massima rappresentabile
(vedere questa [[:tecnica:misc:decibel#attenuazione_di_tensione|tabella di attenuazione]]). Il servizio streaming di //Apple Music// utilizza una LUFS pari a -16 dB, il profilo //Spotify Loud// è di -11, CD e DVD invece si spingono di più verso il fondo scala con LUFS di -9.00 dB.

Inoltre, con il parametro **dBTP** (dB True Peak), è possibile definire lo scostamento della traccia risultante dal valore di fondo scala. Se si desidera utilizzare al 100% la gamma dinamica bisogna impostare 0 dBTP, ma è opportuno lasciare un piccolo margine di sicurezza; normalmente CD e DVD utilizzano 0.1 dBTP, mentre i servizi di streaming musicale spesso utilizzano valori molto più conservativi, addirittura di **-1.0** (Spotify) o **-2.0** (Amazon Music).

Per una **normalizzazione Loudness** io consiglio di partire con dei valori di **-15.00 LUFS** e **-0.20 dBTP**, quindi verificare il risultato ottenuto.

  * **[[https://manual.ardour.org/mixing/basic-mixing/loudness-analyzer-and-normalizer/|The Ardour Manual - Loudness Analyzer and Normalizer]]**
  * **[[https://www.kits.ai/glossary/dbtp-decibels-true-peak|dbTP Decibels True Peak]]**
  * **[[https://emastered.com/it/blog/what-are-lufs|What are LUFS: The Complete Beginner's Guide]]**