Увага
Супровід цієї сторінки припинено. Вона містить відомості, які стосуються можливостей або функцій застарілих версій Kdenlive, які вважаються застарілими або які було замінено чимось іншим.
Звуковий спектр та спектрограма¶
Цей розділ присвячено областям звуку. Також тут обговорено роботу зі звуковим даними загалом (зокрема запис, сприйняття тощо).
Області¶
Звукові області докладно документовано у файлі Audio Scopes for Kdenlive (PDF) Simon «Granjow» Eugster[1]. Ви можете пропустити технічну і математичну частини — для розуміння областей це не потрібно, а базова математика є непростою. Втім, решта тексту має бути вам цікавою.
Тим не менше, зараз вже маємо короткий огляд усіх можливостей.
Звуковий спектр¶
У цій області буде показано спектр частот для кожного з кадрів. Низькі частоти буде розташовано ліворуч, високі — праворуч. чим вищий є стовпчик, тим гучнішою є відповідна частота.
Гучність вимірюють у децибелах у спектрі[2]. Якщо усі частоти мають однакову гучність, ви можете коригувати діапазон показу вертикальним перетягуванням. Просте перетягування коригує нижнє порогове значення, Shift+перетягування коригує максимальну показану гучність. Горизонтальне перетягування коригує максимальну частоту, для якої буде показано семпли.
Але для чого може бути корисним такий показ даних? Одним із застосувань, як описано у файлі PDF, посилання на який наведено вище, є візуальне розрізнення звуку доброї і поганої якості: якщо немає частот, більших за, наприклад, 3 кГц, якість звукових даних, найімовірніше, є доволі низькою.
Підказка
Якщо ви не маєте гадки, наскільки високою є частота у 3 кГц, а це не дуже дивно, оскільки наш слух не доносить до нашого мозку числових даних, ви можете скористатися програмою, подібною до SignalGen або Audacity для створення синусоїдного сигналу із частотою 3 кГц (тобто 3,000 Гц).
Крім того, спектр частот є корисним для уникнення обрізання. Той самий результат можна спостерігати з кольорами, наприклад, у розкладці RGB, і, загалом, з кожним сигналом, який підлягає цифруванню. Докладніше про це нижче.
Спектрограма¶
Спектрограма робить те, що і «Звуковий спектр»: показує розподіл частот. Втім, відмінність полягає у тому, що частоти буде показано для багатьох кадрів одразу. Подібно до розкладки RGB для кольорів, потужніші (гучніші) частоти буде показано яскравішими пікселями; це надає змогу зібрати увесь спектр кадру у одну лінію.
Чим можуть допомогти області¶
Зверніть увагу на this review щодо Nikon D7000 і прослухайте фрагмент від 7:00 до 11:00. На позначці 7:00 ви можете чути автора огляду голосно і чітко, на позначці ж 11:00 вам доведеться збільшити гучність, щоб хоч щось зрозуміти. Так не має бути. Звукова область допоможе зберігати однакову гучність у різних частинах матеріалу.
Звук¶
Тепер трохи цікавих відомостей щодо звуку.
Зрізання¶
Як ми вже згадували вище, звуковий сигнал може також обрізатися. Ми усі це чули. Ось, як це звучить (фрагменти з «Greensleeves» Джеймса Едвардса[3]):
Volume increased by 24 dB — значне обрізання!
Volume afterwards decreased by 24 dB — ефект обрізання усунути не вдалося
Обрізання також дуже добре видно на самій звуковій хвилі, якщо ви, наприклад, відкриєте наведені вище зразки в Audacity. (Якщо вам хочеться відтворити наведений вище ефект в Audacity, не забудьте позначити пункт «дозволити перевантаження», інакше програма запобігатиме обрізанню. При зменшенні гучності після обрізання не використовуйте той самий проєкт, оскільки Audacity зберігає значення, які перевищують максимальне значення амплітуди (лише у файлах .aup
). Це чудово для редагування і, можливо, одного дня ми матимемо таку можливість і для кольорів у Kdenlive…
То коли ж стається обрізання?
При записуванні звукових даних. Підсилення вхідного сигналу можна скоригувати на записувачі звукових даних. Якщо підсилення є надмірним, з добрим рівнем звуку вдасться записати, наприклад, тихе мовлення, але обрізання одразу виникне, якщо хтось почне говорити голосно. Тому, вхідне підсилення, зазвичай, коригують так, щоб середній рівень звуку і піки не перевищували певного значення.
Це обмеження засновано на очікуваному динамічному звуковому діапазоні. Типовим вибором є −12 дБ для середньої гучності і максимальне −6 дБ для піків.
При редагуванні. У kdenlive є декілька ефектів керування гучністю. Якщо ви надмірно збільшите гучність, виникне обрізання.
Щоб запобігти обрізанню у kdenlive, вам, насправді, доведеться зробити те саме, що і при записуванні звуку. Спробуйте зробити так, щоб пікові значення лежали нижче −6 дБ. Якщо вам потрібно, щоб якийсь фрагмент був набагато гучнішим за решту і ви не можете більше підвищувати гучність, вам слід знизити гучність усіх інших фрагментів.
Послаблення звуку¶
Чим далі ви перебуваєте від джерела звуку, тим тихішим він буде. Аж до рівня базового шуму вашого мікрофона або записувача звуку. Щоб співвідношення сигнал-шум було прийнятним, зазвичай, слід намагатися тримати мікрофон якомога ближче до джерела звуку. Таким чином можна забезпечити значне перевищення потужності сигналу над потужністю шуму (звичайно ж, слід скоригувати вхідне підсилення так, щоб не було обрізання).
Але це ще не усе. (Загалом, наведене вище зауваження стосується не згасання сигналів, а взагалі поширення хвиль.) Маємо один цікавий аспект, який полягає у тому, що сигнали із високими частотами середовище поглинає набагато сильніше за сигнали із низькими. На відміну від попередніх речей, це не проблема, а скоріше цікава можливість: якщо ви записали чийсь голос і хочете розташувати його вдалині у відео (у сусідній кімнаті, наприклад), знизьте високі частоти (за допомогою, наприклад, ефекту еквалайзера Audacity).
Наш слух¶
Що гучніше, синусоїдна хвиля з частотою 200 Гц чи синусоїдна хвиля із частотою 4 кГц?
Обидві створено із однаковою амплітудою (гучністю) Але наш слух найчутливіший до звуків із частотами, на яких ми говоримо Щоб дізнатися більше про наш слух, почніть зі статті Hearing у Вікіпедії.
Нотатки
- Подальші відомості та пропоноване до читання
Acoustics I - Sound Propagation Outdoors, ETH Zurich
Capturing Good Sound на Vimeo, про мікрофони
Thread about audio and clipping на форумі dvxuser.com