Khảo sát âm lượng (loudness) các kênh truyền hình tại Việt Nam

Khảo sát âm lượng (loudness) các kênh truyền hình tại Việt Nam Nguyễn Hữu Phong∗, Nguyễn Đức Hoàng∗, Đỗ Thế Thiện∗, Võ Nguyễn Quốc Bảo†, và Huỳnh Hữu Tuệ‡ ∗ Trung tâm Nghiên cứu Ứng dụng Khoa học Kỹ thuật Truyền hình Email: {phongnguyen; hoangnd; dothethien}@vtv.gov.vn † Phòng Thí Nghiệm Thông Tin Vô Tuyến Học Viện Công Nghệ Bưu Chính Viễn Thông Cơ Sở TP. Hồ Chí Minh Email: baovnq@ptithcm.edu.vn ‡ Khoa Điện Tử - Viễn Thông, Đại Học Quốc Tế, Đại Học Quốc Gia TP.HCM Email: hhtue@hcmiu.edu

pdf8 trang | Chia sẻ: huongnhu95 | Lượt xem: 390 | Lượt tải: 0download
Tóm tắt tài liệu Khảo sát âm lượng (loudness) các kênh truyền hình tại Việt Nam, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
.vn Tóm tắt nội dung—Âm lượng (loudness) của các kênh truyền hình có thể thay đổi đột ngột giữa các thể loại chương trình khác nhau trong cùng một kênh, hoặc khi chuyển giữa các kênh với nhau. Bài báo này nhằm khảo sát sự thay đổi mức loudness của một số kênh chương trình được lấy mẫu từ các phương thức phân phối quảng bá khác nhau: mặt đất, vệ tinh và cáp tại Việt Nam. Mức loudness của cả chương trình truyền hình số và analog được lấy mẫu và đo đạc. Một công cụ đo loudness được phát triển trong Matlab dựa trên khuyến nghị ITU-R BS.1770-2 và khuyến nghị EBU R128 dùng để đo loudness các file audio 2 kênh. Dữ liệu thu thập được sẽ tiến hành đo và phân tích mức loudness. Cuối cùng giải pháp chuẩn hóa loudness theo EBU R128 nhằm đạt mức cân bằng loudness cho các chương trình truyền hình tại Việt Nam được đề xuất. Index Terms—Loudness, ITU-R BS.1770-2, EBU R128, TV, Volume control. I. GIỚI THIỆU Âm thanh đóng vai trò cực kỳ quan trọng trong truyền hình. Trước đây, khi truyền hình còn phát đen trắng, sóng yếu, ở những khu vực xa khi xem tín hiệu lúc được lúc mất, âm thanh bị nhiễu nhiều khi át cả âm thanh chính. Cùng với sự phát triển của công nghệ, ngành truyền hình tại Việt Nam cũng đã phát triển nhanh chóng và ngày càng mang đến cho người xem nhiều chương trình chất lượng về nội dung bao gồm cả chất lượng hình ảnh và âm thanh. Dù đã được nâng cao về chất lượng âm thanh thì cho đến gần đây, người xem vẫn còn nhiều điều chưa hài lòng khi mà âm thanh quảng cáo thường đột nhiên to hơn nhiều so với âm thanh chương trình đang xem, hoặc khi chuyển kênh truyền hình thì phải điều chỉnh lại âm lượng giữa các kênh. Nghĩa là không có cách nào để đo được âm lượng của âm thanh từ phía nhà cung cấp cho tới phía người xem. Việc chuẩn hóa âm thanh theo mức đỉnh (peak normalisation) không phải là cách thức để xác định âm lượng/độ ồn (loundness) của tín hiệu âm thanh. Loudness (âm lượng) có thể hiểu đơn giản là cách mà người nghe cảm nhận được biên độ âm thanh hay là thuộc tính về độ nhạy cảm của tai người nghe khi chuyển từ mức im lặng đến mức ồn của âm thanh [1]. Loudness đo cảm nhận của tai người nghe về âm thanh, khác với mức áp lực âm thanh (sound pressure level - SPL) chỉ mô tả cường độ âm thanh theo thang dB. Loudness chịu ảnh hưởng bởi nhiều thông số hơn so với SPL, bao gồm tần số, băng thông và độ lâu của âm thanh [2]. Trong suốt quá trình xem TV (Television), sự thay đổi loudness có thể gây khó chịu cho người xem khi họ phải thường xuyên dùng Volume control (điều khiển từ xa) để điều chỉnh lại mức loudness. Ví dụ như khi thực hiện chuyển kênh chương trình, hoặc sự thay đổi âm lượng đột ngột giữa các chương trình tin tức và chương trình quảng cáo. Nguyên nhân là do các nhà quảng bá đã không thực hiện điều chỉnh mức loudness thống nhất trước khi phát sóng, các kỹ thuật nén dải động âm thanh cũng góp phần gây ra sự nhảy mức loudness này, và phương pháp chuẩn hóa âm thanh theo mức đỉnh trước đây không giải quyết triệt để vấn đề nhảy mức âm lượng. Tiêu chuẩn ITU-R BS.645-2 khuyến nghị chuẩn hóa theo mức đỉnh – 9 dBFS (decibel to full scale) [3] dùng máy đo PPM (Peak Programme Meter) hiện nay vẫn còn nhiều quốc gia sử dụng, trong đó có Việt Nam. Gần đây, vấn đề nhảy âm lượng đã được giải quyết thông qua khuyến nghị EBU R128 của EBU [4]. Khuyến nghị này được xem như một chuẩn mở cho việc cân bằng âm lượng của các chương trình audio theo như cách mà Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 358 người nghe/xem cảm nhận được âm lượng thực tế. Việc đưa ra khuyến cáo này đánh dấu một trong những thay đổi cơ bản nhất trong lịch sử audio của ngành phát thanh truyền hình vì nó đã giải quyết được sự tăng vọt âm lượng audio trong các chương trình, giữa các chương trình và giữa các kênh truyền hình. EBU R128 được phát triển kế thừa tiêu chuẩn ITU-R BS.1770-2: “Thuật toán đo âm lượng chương trình và mức đỉnh thực của tín hiệu audio” [5]. Khuyến nghị ITU-R BS.1770-2 phát triển thuật toán đo âm lượng chương trình (programme loudness) cho các file audio dạng mono, stereo và âm thanh đa kênh 5.1. Khuyến nghị ITU-R BS.1770-2 lần đầu tiên đưa ra khái niệm mức đỉnh thực (true-peak - TP) của tín hiệu audio. Mức TP được đo với máy đo đỉnh thực (true-peak meter hay oversampling PPM), đơn vị đo là dBTP (dB relative to digital full scale). dBTP được đo trong miền thời gian liên tục, tần số lấy mẫu ít nhất gấp 4 lần tần số tín hiệu audio đầu vào. Khác với đo đỉnh mẫu dBFS sử dụng máy đo PPM hay QPPM (Quasi-Peak Programme Meter), và đo giá trị trong miền rời rạc. Giá trị mức đỉnh thực luôn lớn hơn giá trị đo bởi dBFS, tiệm cận với mức đỉnh thực của tín hiệu audio vì vậy máy đo đỉnh thực dự đoán chính xác hơn mức đỉnh tín hiệu audio, hạn chế vấn đề méo tín hiệu (clipping) xảy ra khi chuyển audio từ số sang tương tự (D/A). Hình 1 minh họa so sánh giữa mức đỉnh thực dBTP và mức đỉnh mẫu dBFS, máy đo đỉnh thực đọc tiệm cận mức đỉnh thực của tín hiệu audio, là mức đỉnh lớn nhất đo trong miền thời gian liên tục, còn máy đo PPM/QPPM đọc mức đỉnh dBFS tại các vị trí lấy mẫu rời rạc, vì vậy dBFS có sai số lớn so với mức đỉnh của tín hiệu audio. Hiện nay phần lớn các đài phát thanh- truyền hình tại Châu Âu đã chuyển qua sử dụng máy đo đỉnh thực và tích hợp khuyến nghị EBU R128 vào dòng làm việc (workflow) truyền hình. Khuyến nghị EBU R128 được nhóm EBU PLOUD phát triển, ngoài giá trị đo âm lượng tích hợp/âm lượng chương trình (programme loudness) dùng đo tích hợp trong một thời gian dài hay đo toàn bộ chương trình, với đơn vị đo là LUFS (Loudness Units Full Scale) hay LKFS (Loudness K-weighted Full Scale theo cách gọi của ITU-R BS.1770), EBU R128 còn định nghĩa thêm đo loudness theo khoảng thời gian ngắn ’S’ (short- term loudness), đo loudness tức thời ’M’ (Momentary loudness) để thực hiện đo và giám sát loudness các chương trình truyền hình trực tiếp. Loudness ’S’ đo các mẫu audio dùng cửa sổ trượt 3s, loudness ’M’ đo các mẫu audio dùng cửa sổ trượt 400ms. Để đo programme loudness (hay intergrated loudness: ‘I’), EBU R128 dùng cơ chế đo gating với mức ngưỡng -10 LU (Loudness 7KӡLJLDQ G%73G%)6 7UXHSHDNÿӑFEӣLPi\ÿR 2YHUVDPSOLQJ730HWHU VDPSOHSHDNÿӑFEӣLPi\ ÿR330RU4330 Hình 1. So sánh dBTP và dBFS. Hình 2. LRA khác nhau tùy theo môi trường phát lại [6]. Unit). Cơ chế gating sẽ bỏ qua không đo những phần âm thanh có âm lượng dưới mức ngưỡng (xem là nhiễu), vì vậy kết quả đo âm lượng tích hợp của toàn bộ file sẽ chính xác. Cơ chế gating trình bày chi tiết trong tài liệu ITU-R BS.1770-2. Mức đỉnh thực được đo theo thuật toán trình bày trong Phụ Lục 2 của ITU-R BS.1770-2. EBU R128 giới hạn mức đỉnh thực tối đa cho các tín hiệu audio là –1dBTP. Ngoài ra, EBU R128 còn định nghĩa thêm thông số dải âm lượng LRA (loudness range), đơn vị đo LU, 1LU tương ứng 1dB. LRA mô tả sự phân bố của âm lượng chương trình từ mức yên lặng đến mức ồn nhất, LRA đo bằng phương pháp phân phối thống kê. LRA được định nghĩa bởi sự khác nhau giữa ước lượng 10% mức thấp và 95% mức cao của phân phối. Phép đo LRA tương tự như đo IQR (Interquartile Range) trong phân phối thống kê. LRA tương tự như thông số dải động DRC (Dynamic Range Compressor) của tín hiệu audio. Thông số LRA phụ thuộc vào nền tảng phân phối (ví dụ: truyền dẫn qua mạng cáp, mặt đất, vệ tinh), đối tượng người nghe (ví dụ: nhỏ tuổi, trung niên, người già) hay môi trường phát lại (ví dụ: nghe ở trong xe hơi, trong rạp hát, trong nhà) xem Hình 2. Để đạt cân bằng loudness giữa các kênh chương trình Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 359 truyền hình (ví dụ kênh VTV1 và VTV3), hay giữa các nội dung chương trình (quảng cáo, tin tức, thời sự) phát trong cùng một kênh sóng. EBU R128 đưa ra khuyến nghị chuẩn hóa âm lượng trong các khâu sản xuất, hậu kỳ, truyền dẫn và phát sóng. Cụ thể là đối với một tín hiệu audio, các thông số sau cần phải chuẩn hóa: Loudness “I” chuẩn hóa về mức -23 LUFS, với các chương trình truyền hình trực tiếp thông số này có thể chấp nhận trong giới hạn:- 23 LUFS ± 1 LU. Mức đỉnh thực tín hiệu audio phải thõa mức giới hạn nhỏ hơn hoặc bằng- 1 dBTP. Thông số LRA tùy thuộc vào nền tảng truyền dẫn và môi trường phát lại. Các thông số này được đo tham chiếu đến tín hiệu audio baseband dạng PCM không nén. Đo dùng phần mềm hay máy đo tương thích với tiêu chuẩn EBU R128 và ITU-R BS.1770-2. Việc chuẩn hóa âm lượng theo EBU R128 sẽ thống nhất mức âm lượng, người xem truyền hình sẽ không còn phải dùng thiết bị điều khiển âm lượng để điều chỉnh lại mức âm lượng mỗi khi họ chuyển kênh TV, hay khi xuất hiện chương trình quảng cáo có âm lượng tăng vọt, gây khó chịu cho người xem. Giải quyết được bài toán mất cân bằng âm lượng trong truyền hình, mà phương pháp chuẩn hóa theo mức đỉnh trước đây không giải quyết triệt để. Hình 3 so sánh sự khác nhau giữa chuẩn hóa theo mức đỉnh và chuẩn hóa loudness. Với mức đỉnh, việc chuẩn hóa của tín hiệu audio được dựa trên mức cho phép tối đa (PML – Permitted Maximum Level, ví dụ là mức -9 dBFS) vẫn là cách xử lý mức audio được chấp nhận phổ biến nhằm thống nhất chung mức đỉnh cho phép của các chương trình. Tuy nhiên, với các mức âm lượng thì có đặc thù là độ biến thiên lớn, và độ biến thiên này phụ thuộc vào mức độ nén dải động của tín hiệu. Việc chuẩn hóa âm lượng nhằm đạt kết quả âm lượng trung bình cân bằng giữa các chương trình dù mức đỉnh thay đổi tùy theo nội dung (dựa trên các yếu tố về nghệ thuật và kỹ thuật). Với chuẩn hóa âm lượng, khi dải âm lượng của một chương trình nằm trong giới hạn chấp nhận của người nghe thì người nghe có thể hài lòng với mức âm lượng trung bình thống nhất cho tất cả các chương trình, họ không cần phải dùng điều khiển từ xa để điều chỉnh âm lượng nữa. Phần còn lại của bài báo được tổ chức như sau, Phần II trình bày thuật toán đo loudness theo ITU-R BS.1770-2. Trong Phần III, chúng tôi trình bày cách thức thu thập mẫu đo. Phần IV và Phần V là kết quả đo đạc thực tế với Phần IV là kết quả đo trước khi chuẩn hóa và Phần V trình bày kết quả sau khi chuẩn hóa loudness. Cuối cùng, Phần VI đưa ra một số kết luận sau khi khảo sát. Hình 3. Chuẩn hóa mức đỉnh so với chuẩn hóa âm lượng [6]. %ӝOӑF. %ӝOӑF. %ӝOӑF. %ӝOӑF. %ӝOӑF. 0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH 0HDQ6TXDUH *> *Z *& */6 *56 ™ 'd/E'/RJ .ӂ748Ҧ ;/ ;5 ;& ;/6 ;56 </ <5 <& </6 <56 =/ =5 =& =/6 =56 Hình 4. Sơ đồ thuật toán đo audio loudness đa kênh [5]. II. THUẬT TOÁN ĐO LOUDNESS THEO ITU-R BS.1770-2 Thuật toán đo âm lượng được xây dựng tổng quát cho tín hiệu audio đa kênh (5.1 kênh). Sơ đồ khối trong Hình 4 trình bày kèm các nhãn ký hiệu theo các khối nhằm mô tả thứ tự xử lý của thuật toán. Theo đó, có 5 kênh audio ở ngõ vào left (L), centre (C), right (R), left surround (LS) và right surround (RS), trường hợp chỉ gồm một kênh audio (mono) hoặc stereo thì tương ứng chỉ có ngõ vào XL, hoặc/và XR ở ngõ vào. Kênh audio tần số thấp (Low frequency effect - LFE) được bỏ qua không đo trong giải thuật. Giải thuật thực hiện qua bốn bước như sau: • Bước 1: Gán trọng số K theo tần số Trọng số K áp dụng bộ lọc K-filter (còn gọi là pre-filter) hai tầng cho tín hiệu ngõ vào. Tầng thứ nhất của bộ lọc pre-filter nâng hiệu ứng âm học vùng tần số cao. Các hệ số bộ lọc dùng với tần số lấy mẫu (sampling rate) của tín hiệu audio là 48 kHz [5], với các tần số lấy mẫu khác thì các hệ số cần được tính toán và thiết kế lại. Để đơn giản, tín hiệu audio lấy mẫu ở những tần số khác có thể lấy mẫu lại ở tần số 48 kHz và dùng các hệ số bộ lọc như khuyến cáo. Tầng thứ 2 của bộ lọc K-filter là bộ lọc thông cao (high-pass filter). Đường cong trọng số RLB của tầng này được xác định bởi bộ lọc bậc 2 với các Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 360 hệ số cho trong [5, Table 2]. Tương tự, các hệ số này cũng được sử dụng ứng với tần số lấy mẫu của tín hiệu audio là 48 kHz, và phải tính lại các hệ số khi sử dụng với tần số lấy mẫu khác. • Bước 2: Tính toán trung bình bình phương mỗi kênh Năng lượng (hoặc trung bình bình phương) của tín hiệu ở ngõ vào bộ lọc trong một khoảng thời gian T được tính bởi công thức sau: zi = 1 T T∫ 0 y2 i dt, (1) với yi là tín hiệu ngõ vào đã được lọc từ bộ lọc pre- filter ở Bước 1 và i ∈ I với I = [L, R, C, LS, RS] là tập các kênh audio ngõ vào. • Bước 3: Tổng trọng số các kênh Khi tính tổng trọng số các kênh, chúng ta dùng trọng số lớn hơn cho các kênh surround và bỏ qua kênh LFE. Loudness theo đơn vị LKFS trong khoảng thời gian T được định nghĩa bởi LK = −0.691 + 10log10 ∑ i Gizi (2) với Gi là các hệ số trọng số cho các kênh riêng. • Bước 4: Cơ chế đo gating Cơ chế đo gating dùng block 400ms, hệ số chồng lấp 75%. Để đo loudness dùng cơ chế đo gating, khoảng thời gian T được chia theo các khoảng block chồng lấp (gọi là gating block là một khoảng thời gian chứa các mẫu audio kế tiếp nhau có giá trị Tg = 400ms). Hệ số chồng lấp (overlap) của mỗi gating block là 75% của khoảng thời gian gating block. Năng lượng hoặc trung bình bình phương của gating block thứ j của kênh ngõ vào thứ i trong khoảng T được tính bởi zij = 1 Tg Tgj(Step+1)∫ TgjStep y2 i dt (3) với Step = 1 − Overlap và j ∈{ 0, 1, 2, . . . , T−Tg TgStep } . Khi đó, loudness của gating block thứ j được định nghĩa bởi Lj = −0.691 + 10log10 ∑ i Gizij (4) với ngưỡng gating, Γ, sẽ có một tập các gating block ký hiệu Jg = {j : lj > Γ}, nghĩa là tập các gating block có loudness lớn hơn giá trị ngưỡng gating Γ. Số lượng các thành phần trong Jg ký Bảng I TRỌNG SỐ CHO CÁC KÊNH AUDIO. Kênh Trọng số Gi Kênh trái (L) 1.0 (0 dB) Kênh phải (R) 1.0 (0 dB) Kênh trung tâm (C) 1.0 (0 dB) Kênh surround trái (LS) 1.41 (1.5 dB) Kênh surround phải (RS) 1.41 (1.5 dB) hiệu là |Jg|. Giá trị gated loudness, LKG, theo đơn vị LKFS đo trong khoảng T được định nghĩa: LKG = −0.691 + 10log10 ∑ i Gi ⎛ ⎝ 1 |Jg| ∑ Jg zij ⎞ ⎠ . (5) Lúc này, một quá trình xử lý hai bước được thực hiện để đo gating dựa trên giá trị ngưỡng tuyệt đối và tương đối. Ngưỡng tương đối theo đơn vị LKFS được tính toán dựa trên ngưỡng tuyệt đối Γa = −70 LKFS theo công thức sau: Γr = −0.691 + 10log10 ∑ i Gi . ⎛ ⎝ 1 Jg . ∑ Jg zij ⎞ ⎠ − 10 (6) với Jg = {j : lj > Γa} và Γa = −70 LKFS. Giá trị gated loudness, LKG theo LKFS, đo dùng ngưỡng Γr được tính như sau: LKG = −0.691 + 10log10 ⎡ ⎣∑ i Gi ⎛ ⎝ 1 |Jg| ∑ Jg zij ⎞ ⎠ ⎤ ⎦ , (7) trong đó Jg = {j : lj > Γr}. Ở đây, đơn vị LKFS tương đương decibel, nghĩa là mức tín hiệu gia tăng 1 dB thì loudness gia tăng tương ứng 1 LKFS. Một ví dụ minh họa cho kết quả khi thực hiện giải thuật là: nếu các ngõ vào left, center, hoặc right là tín hiệu sin 0 dBFS 1 kHz thì kết quả đo loudness là -3.01 LKFS. III. PHƯƠNG PHÁP THU THẬP MẪU ĐO Các mẫu đo được lấy từ các phương thức truyền dẫn khác nhau: vệ tinh, mạng cáp, truyền hình mặt đất. Các kênh được lấy mẫu bao gồm các kênh truyền hình của Đài truyền hình Việt Nam (VTV), các kênh truyền hình trong nước khác như: Công ty cổ phần truyền thông đa phương tiện (VTC), Công ty truyền hình cáp Saigon Tourist (SCTV), và các kênh truyền hình nước ngoài, ví dụ như BBC, KBS, Arirang, Australia. Lấy mẫu cho Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 361 cả truyền hình phát quảng bá analog và số. Các mẫu đo được thu thập và xử lý trong suốt thời gian từ tháng 04/2013-04/2014. A. Cách thức lấy mẫu 1) Lấy mẫu theo thể loại chương trình phát sóng: Các thể loại chương trình được lấy mẫu: chọn một số chương trình điển hình sau: quảng cáo, thời sự, phim truyện, gameshow, thể thao, ca nhạc, thời tiết, phóng sự, tin tức và các thể loại khác. Thời lượng cho mỗi mẫu từ 2-3 phút. Mỗi thể loại chương trình lấy 4 đến 10 mẫu. 2) Lấy mẫu theo kênh phát sóng: Thời lượng cho mỗi mẫu là 3 phút. Các mẫu được lấy từ các kênh ứng với khoảng thời gian liên tiếp nhau để đánh giá nhảy mức âm lượng khi chuyển kênh truyền hình. B. Hệ thống lấy mẫu 1) Thu chương trình từ truyền hình quảng bá mặt đất: Dùng card DVB-T Hauppauge WinTV-HVR- 1300 kết nối trực tiếp với anten truyền hình Yagi UHF/VHF và máy vi tính thông qua cáp TV và khe cắm. Dùng phần mềm Win TV 7 để capture chương trình từ các kênh phát sóng và ghi lại các kênh chương trình, card có khả năng thu tín hiệu truyền hình analog và DVB-T. Mẫu được capture là các dòng TS có định dạng MPEG-2. Sau đó dùng phần mềm NxTSA tách dòng TS thành các file video và audio có định dạng MPG, tiếp tục dùng phần mềm chuyển đổi file audio định dạng MPG thành file audio có định dạng WAV để đưa vào xử lý (đo và chỉnh) loudness bằng phần mềm Matlab. 2) Thu chương trình từ vệ tinh: Dùng card DTA 140 để gắn vào máy tính và phần mềm DtGrabber+ để capture chương trình từ vệ tinh tại tổng khống chế (Head-End) của VTV9 (Trung tâm truyền hình Việt Nam tại TP. Hồ Chí Minh. Dùng phần mềm NxTSA để tách luồng (Transport Stream - TS) gồm nhiều kênh thành các dòng TS của các kênh riêng lẻ. Dùng phần mềm TOTAL VIDEO CONVERTER chuyển đổi các file audio có định dạng MPG của các kênh đó thành định dạng WAV để xử lý. 3) Thu chương trình từ mạng truyền hình cáp SCTV: Dùng đầu thu Set-Top-Box (STB) A800 để thu chương trình các kênh truyền hình trong nước và nước ngoài từ hệ thống truyền hình cáp của SCTV. Các kênh capture là: VTV1, VTV2, VTV3, VTV4, VTV6, Arirang, KBS World HD, BBC, Australia. Mẫu được lấy từ các kênh truyền hình 0 2000 4000 6000 8000 10000 í70 í60 í50 í40 í30 í20 í10 0 VTV6í3105í0957 LU FS Thoi gian Hình 6. Minh họa kết quả đo loudness với cửa sổ trượt 3s. nêu trên. Thời lượng mỗi mẫu từ 1 phút 30 giây đến 2 phút. Thời gian lấy mẫu là ngẫu nhiên trong hai ngày (ngày 08 và 09/10/2013). Mẫu được lấy tiếp tục chuyển thành định dạng WAV để đo các thông số loudness. Để đo loudness và chuẩn hóa loudness, chúng tôi xây dựng một công cụ trong Matlab. Thuật toán có thể đo và xử lý file audio stereo 2.0, đo loudness, LRA, true-peak và chuẩn hóa các thông số loudness và true-peak theo EBU-R 128. Để kiểm chứng sự tương thích của thuật toán, trước khi tiến hành đo các mẫu thực, chúng tôi tiến hành đo các file audio mẫu cung cấp từ trang web EBU trong [7], với sai số của các giá trị loundess, LRA và dBTP trong giới hạn ±0.1 , giới hạn chấp nhận của các máy đo tương thích với chuẩn EBU R128. Hình 5 trình bày quy trình thu thập và xử lý các mẫu đo, trước tiên dữ liệu có thể xuất phát từ: Mạng truyền hình vệ tinh, mặt đất hay truyền hình cáp. Hệ thống thu thập dữ liệu bao gồm phần cứng và phần mềm để ghi lại các dòng chương trình dạng TS cho các xử lý về sau. Tiếp theo dùng phần mềm chuyên dụng để tách riêng các dòng video và audio. Các file audio dạng WAV sẽ được đo và chuẩn hóa loudness riêng, sau đó ghép audio và video thành file hoàn chỉnh, lưu các file video đã chuẩn hóa các thông số loudness. IV. KẾT QUẢ ĐO Trong phần này, chúng tôi sẽ trình bày các kết quả đo đạc trước khi chuẩn hóa. Bắt đầu từ Hình 6, chúng tôi minh họa kết quả đo loudness của kênh VTV6, mẫu đo ngày 31/05/2013 với thời gian lấy mẫu bắt đầu lúc 9h57, âm lượng tích hợp của file này là -14 LUFS, lớn hơn 9 LUFS so với khuyến nghị EBU R 128 là -23 LUFS. Trong Hình 7, chúng tôi trình bày kết quả đo loudness trên cùng một kênh (kênh VTV3 của Đài Truyền hình Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 362 9ӋWLQK PһWÿҩW FiS 7RROÿRYj FKXҭQKyD ORXGQHVV3KҫQPӅPWiFKDXGLRYj YLGHR 7KXWKұSOѭX WUӳYjRKӋ WKӕQJGzQJ76 3KҫQPӅP JKpSDXGLRYj YLGHR /ѭXWUӳFiF ILOHÿmFKXҭQ KyDORXGQHVV $XGLR 9LGHR Hình 5. Quy trình thu thập và xử lý loudness dựa trên file. 1 2 3 4 5 6 í20 í15 í10 í5 0 Mau lo ud ne ss [L U FS ] Hình 7. Sự biến thiên loudness của các chương trình ca nhạc trên kênh VTV3 Việt Nam) và trên cùng một chương trình (chương trình ca nhạc), các mẫu đo được lấy vào tháng 04/2013 qua hệ thống truyền hình số mặt đất DVB-T, thời gian của mỗi mẫu là 2-3 phút. Kết quả cho thấy mức âm lượng của các chương trình ca nhạc có mức biến động lớn, chênh lệch 10 LUFS giữa mẫu đo 1 và mẫu 2. Tiếp theo, chúng tôi khảo sát trên các kênh khác nhau trong Hình. 8, minh họa kết quả đo loudness của 3 kênh VTV1, VTV2, VTV3 được lấy mẫu vào 04/2013 vời thời lượng 3 phút trong các khoảng thời gian liên tiếp nhau theo thứ tự (8h10-8h13, 8h13-8h16, 8h16-8h19). Điều này tương tự như khi người xem truyền hình đang muốn chuyển kênh chương trình từ kênh VTV1 và VTV2 hay VTV3. Mức âm lượng chênh lệch là 17 LUFS, với mức này người nghe/xem sẽ cảm nhận được rất rõ sự khác biệt của âm lượng khi chuyển kênh, âm lượng có thể tự nhiên tăng đột ngột, gây khó chịu cho người xem và họ phải dùng volume control điều chỉnh lại mức âm lượng. Trong Hình 9, chúng tôi khảo sát ở các kênh khác nhau giữa hai đài khác nhau. Kết quả đo các kênh từ hệ í35 í30 í25 í20 í15 í10 í5 0 Kenh Lo ud ne ss [L U FS ] Loudness luc chuyen kenh chuong trinh VTV1 (í17 LUFS) VTV2 (í31 LUFS) VTV3:í14 LUFS Hình 8. Sự nhảy âm lượng lúc chuyển kênh chương trình VTV1 (8h10- 8h13), VTV2 (8h13-8h16), VTV3 (8h16-8h19). 1 2 3 4 5 6 7 8 9 10 11 12 í30 í25 í20 í15 í10 í5 0 Lo ud ne ss [L U FS ] Mau do Kenh SCTV4&13 Kenh VTC1&2 Hình 9. Loudness các kênh truyền hình cáp SCTV và kỹ thuật số VTC. thống truyền hình kỹ thuật số VTC và truyền hình cáp SCTV. Các kênh lấy mẫu với thời gian 1 phút vào tháng 12/2013. Kênh SCTV (SCTV4 và SCTV13), kênh VTC (VTC1 và VTC2) có sự chênh lệch âm lượng lớn nhất Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 363 1 2 3 4 5 6 í35 í30 í25 í20 í15 í10 í5 Mau do LU FS The thao Phim Quang cao Thoi su Hình 10. Sự biến thiên âm lượng kênh VTV. í35 í30 í25 í20 í15 í10 í5 Mau do LU FS VTV3 Arirang KBS BBC Australia Hình 11. So sánh với các kênh nước ngoài. 14 LUFS, mức âm lượng các kênh không ổn định. Hình 10 trình bày sự biến động âm lượng được lấy mẫu theo thể loại chương trình phát sóng (tin tức, phim thời sự, thể thao. . . ) của VTV. Kết quả cho thấy âm lượng có độ vênh rất lớn, các mẫu có thời gian từ 2-3 phút, lấy mẫu vào tháng 04/2013, thời gian lấy mẫu là các giờ trong ngày từ 9h-16h. Các chương trình quảng cáo có mức âm lượng rất lớn so với các chương trình khác, cao hơn 10-15 LUFS. Hình 11 so sánh âm lượng kênh VTV3 so với các kênh nước ngoài lấy mẫu vào tháng 10/2013. Thời gian lấy mẫu là 1 phút 30 giây. Kênh VTV3 có sự biến thiên âm lượng rất lớn từ [-10 LUFS, -33 LUFS], kênh BBC của Anh có mức âm lượng dao động ổn định quanh mức -18 LUFS, kênh Australia dao động khoảng [-23 LUFS, -19 LUFS], kênh Arirang (kênh ca nhạc Hàn Quốc) mức dao động [-21 LUFS, -18 LUFS], kênh KBS HD World (Hàn Quốc) mức dao động [-21 LUFS, -18 LUFS]. Mức biến động âm lượng của các kênh BBC là ổn định, do Anh và phần lớn các nước Châu Âu đã chấp thuận khuyến nghị EBU R128, với chuẩn hóa mức âm lượng mục tiêu là -23 LUFS [8] từ 2012, và Úc chấp thuận tiêu chuẩn ITU-R BS.1770 với mức âm lượng chuẩn hóa mục tiêu là -24 LKFS [8] từ 2012. Ở Hàn Quốc, một số giải pháp điều chỉnh loudness tự động được áp dụng để cân bằng mức loudness cho các chương trình phát sóng truyền hình, ví dụ như IPTV [9]. Các giá trị đo được từ STB đặt tại Việt Nam của kênh nước ngoài có chênh lệch từ 2-3 LUFS so với giá trị trung bình -23 LUFS của tiêu chuẩn EBU R128, đây là kết quả đo sau khi tín hiệu truyền qua đường vệ tinh, rồi phân phối lại qua hệ thống truyền hình cáp SCTV, và sau đó giải mã lại từ STB nên mức tín hiệu có thay đổi, tuy nhiên mức loudness trung bình giữa các kênh ít biến động, nằm trong giới hạn cho phép, với sự thay đổi từ 2-3 LUFS người nghe khó cảm nhận được sự biến động âm lượng. V. KẾT QUẢ CHUẨN HÓA ÂM LƯỢNG Việc chuẩn hóa âm lượng nhằm đưa mức âm lượng trung bình thống nhất về một mức chung, sẽ làm giảm sự khác biệt âm lượng của các thể loại trong cùng một kênh chương trình (ví dụ chương trình quảng cáo, thời sự, phim) hay giữa các kênh chương trình với nhau (ví dụ VTV1, VTV2, HTV7) giúp tạo ra sự hài hòa âm thanh cho người nghe/xem truyền hình. Người xem không cần phải dùng thiết bị điều khiển âm lượng (volume control) khi xem TV. Chúng tôi đã thực nghiệm chuẩn hóa loudness theo các yêu cầu của khuyến nghị EBU R128, với thông số loudness đưa về mức -23 LUFS, giới hạn true-peak là nhỏ hơn hoặc bằng -1 dBTP và giá trị LRA tùy thuộc vào nền tảng phân phối và môi trường người nghe. Kết quả sau khi chuẩn hóa các thông số loudness, xem Hình 12 và Bảng II, không còn sự nhảy vọt âm lượng đột ngột khi chuyển kênh chương trình, các mẫu trước và sau khi chuẩn hóa âm lượng được cho một số đối tượng nghe trong điều kiện phòng thông thường không phát hiện sự nhảy vọt âm lượng nào sau khi chuẩn hóa loudness. VI. KẾT LUẬN Bài báo này đã trình bày hiện trạng âm lượng trong sản xuất, phát sóng tại VTV là đơn vị mà nhóm thực hiện có cơ hội khảo sát. Các đài khác, ví dụ như VTC và SCTV, nhóm chỉ thực hiện việc đo các chương trình thông qua thu sóng từ các hệ thống phát sóng. Một số Đài truyền hình khác mà nhóm thực hiện có cơ hội tìm hiểu và có thông tin như: HTV (Đài Tp.HCM), Vĩnh Long, Trà Vinh, Sóc Trăng, và Tây Ninh, thì vấn đề kiểm soát âm lượng cũng chưa được các Đài quan tâm, điều này dẫn đến trên địa bàn Tp. Hồ Chí Minh khi người dân thu sóng từ các kênh sóng của các đài khác Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 364 Bảng II KẾT QUẢ ĐO LOUDNESS VÀ CHUẨN HÓA KÊNH VTV3-HD, NGÀY 02/07/2013. Kết quả đo trước chuẩn hóa Kết quả sau chuẩn hóa STT Tên mẫu Tên chương trình Loudness LRA True Peak Loudness LRA True Peak 1 VTV3HD-0207-1004 Chúng tôi là chiến sỹ -21.3577 15.8869 -10.1225 -22.9939 15.8869 -11.7591 2 VTV3HD-0207-1008 Chúng tôi là chiến sỹ -21.2166 17.2823 -10.2902 -23.0181 17.2823 -12.0918 3 VTV3HD-0207-1051 Quảng cáo -18.5065 16.1065 -9.1228 -22.9999 16.1065 -13.6159 4 VTV3HD-0207-1105 Vui sóng mỗi ngày -27.4586 14.7628 -12.4597 -23.0007 14.7628 -8.0016 5 VTV3HD-0207-1200 Phim truyện -24.9318 14.7246 -10.2497 -22.9832 14.7246 -8.3009 6 VTV3HD-0207-1211 Quảng cáo -22.734 20.3828 -9.1509 -22.734 20.3828 -9.1509 7 VTV3HD-0207-1330 Phim -19.8765 23.7393 -8.4418 -23.0106 23.6403 -11.5944 8 VTV3HD-0207-1356 Thể thao -22.339 20.1832 -9.1694 -22.339 20.1832 -9.1694 9 VTV3HD-0207-1609 Vua đầu bếp -23.7787 22.4803 -8.5955 -23.7787 22.4803 -8.5955 10 VTV3HD-0207-1700 360 độ thể thao -25.8948 18.2827 -9.5511 -22.9982 18.2827 -6.6513 11 VTV3HD-0207-1804 Quảng cáo -26.6231 21.4746 -12.4737 -23.012 21.5251 -8.8502 12 VTV3HD-0207-1834 Phim truyện -30.3537 24.944 -13.7609 -22.9785 24.944 -6.3712 13 VTV3HD-0207-1930 Thời sự -21.9057 17.1782 -12.5234 -22.9866 17.1782 -13.6049 14 VTV3HD-0207-1950 Thời sự -26.5142 15.726 -15.5236 -23.019 15.726 -12.0284 15 VTV3HD-0207-2022 Ai là triệu phú -23.5972 15.8781 2.534 -23.5972 15.8781 2.534 16 VTV3HD-0207-2126 Phim truyện -26.5419 17.0156 -11.8635 -23.0229 17.0156 -8.3241 0 2 4 6 8 10 12 14 16 í35 í30 í25 í20 í15 í10 í5 0 Thoi gian Lo ud ne ss Ket qua do sau chuan hoa loudness Ket qua do truoc khi chuan hoa loudness Hình 12. Kênh VTV3 trước và sau khi chuẩn hóa âm lượng. nhau có âm lượng khác nhau, dẫn đến sự khó chịu của người xem khi chuyển kênh giữa các đài. Bản thân giữa các chương trình trong mỗi kênh của mỗi đài thì vấn đề kiểm soát âm lượng vẫn chưa được quan tâm đúng mức. Sự phản ánh của người xem về chất lượng âm thanh gây khó chịu khi họ chuyển kênh, khi quảng cáo đan xen giữa các chương trình trên một kênh truyền hình có âm lượng tăng đột biến là minh chứng cụ thể cho việc không đạt yêu cầu về mức chuẩn hóa âm lượng các chương trình phát sóng của nhiều đài. Vấn đề này sẽ được giải quyết thông qua việc chuẩn hóa âm lượng trong khâu phân phối, sản xuất và phát sóng theo khuyến nghị EBU R128. Việc chuẩn hóa loudness cũng có thể thực hiện tại phía khách hàng. Tuy nhiên, các đầu thu STB tích hợp giải mã metadata tương thích với EBU R128 chưa phổ biến, nhóm thực hiện khuyến nghị trước hết nên chuẩn hóa tại phía nhà cung cấp dịch vụ, chuẩn hóa âm lượng ngay tại khâu tổng khống chế của nhà quảng bá để đạt mức cân bằng âm lượng cho người xem truyền hình tại Việt Nam. LỜI CẢM ƠN Nghiên cứu này được thực hiện dưới đề tài:“Nâng cao chất lượng audio cho phát sóng truyền hình số đa kênh” với sự hỗ trợ của Trung tâm Nghiên cứu Ứng dụng KHKT Truyền hình (BRAC), Đài Truyền hình Việt Nam. TÀI LIỆU [1] ANSI, American national psychoacoustical terminology, Ameri- can National Standards Institute, New York, ANS Std., Rev. Vol S3.20, 1973. [2] H. F. Olson, “The measurement of loudness,” Audio Magazine, pp. 18–22, 1972. [3] ITU, “Recommendation ITU-R.645-2: Test signals and metering to be used on international sound programme connections,” 1992. [4] EBU, “128 recommendation:" Loudness normalization and per- mitted maximum level of audio signals,” 2011. [5] ITU-R, “Algorithms to measure audio programme loudness and true-peak audio level,” Mar. 2011. [6] EBU, “Practical guidelines for production and implementation in accordance with EBU R128,” Geneva, 2011. [7] EBUR128. (2014). [Online]. Available: https://tech.ebu.ch/loudness [8] TCelectronic. (2014). [Online]. Available: [9] Miranda. (2014). [Online]. Available: Hội thảo quốc gia 2014 về Điện tử, Truyền thông và Công nghệ thông tin (ECIT2014) ISBN: 978-604-67-0349-5 365

Các file đính kèm theo tài liệu này:

  • pdfkhao_sat_am_luong_loudness_cac_kenh_truyen_hinh_tai_viet_nam.pdf