Atención
Esta página ya no se encuentra mantenida y contiene información referente a características o funciones de versiones anteriores de Kdenlive que bien son obsoletas o han sido reemplazadas por otra función más moderna.
El espectro de audio y el espectrograma¶
Esta sección trata acerca de los instrumentos de audio. También versa sobre audio en general (sobre su grabación, percepción, etc).

Los instrumentos¶

Captura de pantalla de un espectrograma¶
Los instrumentos de audio se encuentran documentados en profundidad en el artículo Audio Scopes for Kdenlive (PDF) de Simon «Granjow» Eugster[1]. La parte matemática del asunto podrá ser completamente omitida — no es necesaria para entender el instrumento, además las operaciones matemáticas detrás del mismo no son sencillas. El resto, sin embargo, es muy interesante.
Dejaremos aquí un resumen de las características disponibles actualmente.
Espectro de audio¶
Este instrumento muestra el espectro de frecuencias de cada fotograma. Las frecuencias bajas se encontrarán a la izquierda, las altas a la derecha. Y cuanto más alta se encuentre la barra, más intenso será el volumen de esa frecuencia.
El volumen estará medido en decibelios en el espectro[2]. En caso de que todas las frecuencias tuvieran un volumen idéntico, será posible ajustar el rango a ser mostrado arrastrando verticalmente. Al arrastrar se ajustará el umbral inferior, Mayús+arrastrar ajustará el límite máximo de volumen a mostrar. Al arrastrar horizontalmente se ajustará la frecuencia máxima para la cual se visualizarán muestras.
Pero, ¿para qué es útil este instrumento? En primer lugar, tal como se describe en el PDF enlazado más arriba, permitirá distinguir visualmente entre una buena y mala calidad del sonido: Si no hubieran frecuencias mayores a, por ejemplo, 3 kHz, entonces la calidad del audio seguramente no será muy buena.
Consejo
En el caso de que no se tuviera noción sobre si 3 kHz es una frecuancia alta o no (lo cual no es algo inusual, ya que los oídos humanos no entregan valores numéricos de frecuencia a nuestro cerebro), será posible usar un programa como SignalGen o Audacity para generar una onda sinusoidal de 3 kHz (o 3000 Hz).
Otra cosa para la que el espectro de frecuencias resultará útil es para evitar la saturación. Se trata del mismo efecto que puede ser visto aplicado a los colores de una imagen, p.ej: con el instrumento Presentación RVA y, de hecho, con cualquier señal que sea digitalizada. Más acerca de esto abajo.
Espectrograma¶
El Espectrograma hace lo mismo que el Espectro de audio: Muestra la distribución de frecuencias, con la diferencia de que las frecuencias no son mostradas sólo para un único fotograma. De forma similar a lo que sucede con instrumento Presentación RVA usado para medir los colores de una imagen, las frecuencias más intensas (con más volumen) serán representadas mediante píxeles más lluminosos; esto permitirá visualizar el espectro completo de un fotograma completo en una línea.
En qué otra cosa pueden ayudar los instrumentos¶
Si se considera este artículo (this review) acerca de la cámara Nikon D7000 y se presta atención al sonido en 7:00 y 11:00. En 7:00 será posible escuchar a quien habla fuerte y claro, en 11:00 es necesario aumentar el volumen para siquiera llegar a entender lo que está diciendo. Esto no debería suceder. Los instrumentos de audio ayudarán a mantener un volumen nivelado a lo largo de varias tomas.
Sonido¶
Ahora, algunos detalles interesantes acerca del sonido.
Saturación¶

Los niveles de audio en una grabadora Zoom H4n¶
Tal como se mencionaba arriba, el sonido puede llegar a saturarse. Seguramente la gran mayoría haya podido escuchar esto alguna vez, pero así es como suena (extractos de Greensleeves de James Edwards[3]):
Audio original: Original
Volumen aumentado 24dB - ¡saturación masiva!: Volume increased by 24 dB
Volumen disminuido en 24 dB - el efecto de la saturación es irreversible: Volume afterwards decreased by 24 dB
La saturación podrá ser también rápidamente visible en la propia forma de onda del audio, al (por ejemplo) abrir los ejemplos de arriba en Audacity. (En caso de querer reproducir el efecto mostrado arriba con Audacity, asegurarse de seleccionar la opción «Permitir recorte» en el efecto Amplificar, de otro modo el programa prevendrá la saturación. Luego, al volver a disminuir el volumen, no usar el mismo proyecto, porque Audacity almacena los valores mayores que el valor máximo de amplitud (sólo en archivos .aup
). Esto es genial durante una edición normal y sería bueno que un día Kdenlive tuviera algo así para el procesamiento del color…)
Entonces, ¿cuándo puede ocurrir una saturación?
Durante la grabación del audio. La ganancia de entrada podrá ser ajustada en el grabador de audio. En caso de que la ganancia estuviera demasiado alta podría, por ejemplo, grabar una conversación calmada a un buen volumen, pero saturar tan pronto como alguno de los participantes levantara su voz. Por lo tanto, la ganancia de entrada es normalmente ajustada de tal manera que el volumen medio y los picos de volumen no excedan un cierto límite.
Este límite dependerá del rango dinámico esperado del audio. Una elección habitual es tomar -12 dB como nivel para el volumen medio y -6 dB como máximo para los picos de volumen.
Durante la edición del audio. Existe una gran variedad de efectos de volumen en Kdenlive. Cuando al usarlos se eleve demasiado el volumen, se experimentará saturación.
Para evitar la saturación en Kdenlive, se deberá hacer lo mismo que al momento de grabar audio. Intentar mantener los valores de los picos bajos (-6 dB). En caso de que fuera necesario que una sección fuera mucho más alta que el resto, y no fuera posible aumentar más el volumen, entonces será necesario disminuir el volumen de todo el resto.
Atenuación¶
Cuanto más alejado se esté de una fuente sonora, más tenue se escuchará. Hasta que, finalmente, su volumen deje de superar el piso de ruido del micrófono y el grabador de audio. Para mantener una buena relación señal-ruido o SNR, usualmente se intentará mantener el micrófono tan cerca como sea posible a la fuente de sonido. De este modo, la señal será mucho más fuerte que el piso de ruido (manteniendo el control de ganancia ajustado, de tal manera que no se produzcan saturaciones).
Pero eso no será todo aún. (De hecho, el unto de arriba ni siquiera trataba sobre la atenuación en absoluto, sino simplementa sobre la propagación de las ondas de sonido.) Existe un aspecto interesante, y es que las frecuencias altas son absorbidas más fuertemente que las bajas frecuencias. A diferencia de los puntos anteriores, no se trata de un problema en sí mismo, sino de una variable interesante: En caso de haberse grabado la voz de alguien y necesitar que se escuche como si la persona hubiera estado alejada (por ejemplo, en la habitación de al lado), podrá disminuirse el volumen de las frecuencias altas del audio (por ejemplo, usando el efecto Ecualizador de Audacity).
Nuestro oído¶
¿Qué se percibe más intensamente: Una onda sinusoidal de 200 Hz o una de 4 kHz?
Onda sinusoidal de 200 Hz: 200 Hz Sine
Onda sinusoidal de 4000 Hz: 4,000 Hz Sine
Ambas han sido generadas con la misma amplitud (volumen). Sin embargo, nuestro oído es más sensible dentro del rango de frecuencias con el que hablamos. Para leer más acerca del oído humano, ver el siguiente artículo de Wikipedia, como un buen puto de referencia: Hearing.
Notas
- Información adicional y lecturas sugeridas
Acoustics I - Sound Propagation Outdoors, ETH Zurich
Capturing Good Sound en Vimeo, acerca de micrófonos
Thread about audio and clipping en el foro de dvxuser.com