Audio overview - Xử lý tín hiệu âm thanh số - truyền hình và đa truyền thông

PHẦN I AUDIO OVERVIEW CHƯƠNG I TÍN HIỆU ÂM THANH VÀ SỰ CẢM THỤ TÍN HIỆU ÂM THANH Khái quát a. Nguồn âm Nguồn âm điểm: Kích thước nguồn âm d << bước sóng גּ Nguồn âm diện (mặt): d < גּ , nhưng d ≈ גּ Nguồn âm tuyến b. Sóng âm - Tai người chỉ nghe được các âm thanh có tần số trong khoảng 16Hz đến 20.000Hz. Vận tốc âm thanh trong không khí là 340 m/s và bước sóng גּ khoảng 1,7 cm đến 17m. c. Độ suy giảm - Ở tần số khác nhau thì độ suy giảm khác nhau Âm có tần số cao bị nhiễu x

doc22 trang | Chia sẻ: huyen82 | Lượt xem: 2996 | Lượt tải: 3download
Tóm tắt tài liệu Audio overview - Xử lý tín hiệu âm thanh số - truyền hình và đa truyền thông, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ạ nhiều hơn âm có tần số thấp. Âm trầm ít bị suy hao hơn ( tín hiệu âm của nữ (âm cao) bị suy hao nhiều hơn âm của nam (âm trầm )). Các đại lượng vật lý của sóng âm a. Thanh áp (Áp suất âm thanh) p p = F/ S ( N/m2) , (Pa). Bar âm thanh: 1 bar = 105 Pa. b. Mức áp suất âm thanh SPL = 20 lg(P/Po) [dB] trong đó Po : thanh áp chuẩn tại ngưỡng nghe được (ở tần số f = 1000Hz thì Po = 2.10-5 N/m2). Theo tiêu chuẩn của ITU-T, OIRT, CCIR,.. thì: + Mức tạp âm nội bộ của Studio là SPL < 30 dB. + Ở phòng câm: SPL < 25 dB. + SPL = 74 dB : mức chuẩn để kiểm định thiết bị âm thanh. + SPL >= 120 dB: chói tai (đau tai). Tốc độ dao động âm: v’ = 2. 10-7 m/s Cường độ âm thanh: I = P/S, với P là công suất âm thanh. Sự thụ cảm của cơ quan thính giác Sự thụ cảm của cơ quan thính giác phụ thuộc vào: Tần số Cường độ I = P/S, từ đó suy ra âm lượng của âm thanh là K = 10 lg(I/Io), với Io = 10-12 W/m2 . Khoảng cách Xác định được vị trí của nguồn âm (Hiệu ứng tham gia). Xác định được hướng của nguồn âm. . Dải động của tín hiệu âm thanh Dải động của máy tăng âm thường là 50 – 70 dB. Dàn nhạc giao hưởng có thể là 90 – 120 dB. . Sự lấn át tín hiệu âm thanh - Do tạp âm: Trong quá trình xử lí tín hiệu âm thanh bên cạnh tín hiệu có ích thì thiết bị cũng nhận thêm các tạp âm có hại. Để tính toán mối quan hệ giữa tín hiệu có ích và tạp âm người ta đưa ra công thức tính là: Tỉ số tín hiệu trên tạp âm (S/N)dB. - Lấn át theo tần số: Khi phát ra tín hiệu có 1 băng thông nhất định và một tín hiệu khác có một băng thông khác thì có sự xen lẫn giữa 2 băng thông -> tạo ra phách của các tần số ( Do hệ thần kinh trung ương cảm thụ). Ví dụ : tần số f1 và tần số f2 nhưng tai có thể nghe nf1± mf2 làm tai ta khó phân biệt tần số f1 và tần số f2 . Từ đó đưa ra độ lấn át theo tần số (dB) M= N’0 – N0 trong đó: + N0 : ngưỡng nghe được khi không có tạp âm ( không có tác động của một tần số tạp âm nào cả). + N’0 : ngưỡng nghe được khi có tạp âm ( khi có f2 ). 1.6. Độ rõ của tín hiệu âm thanh Đây là một khái niêm mang tính thống kê. Ví dụ: Trong một gian phòng chia ra các ô người ta đọc một trăm từ, nghĩa của các từ không liên quan với nhau – tách rời nhau. Cho người ngồi ở các vị trí khác nhau -> ở các vị trí khác nhau ghi được số từ là bao nhiêu. Nếu từ đúng ngồi ở bất cứ ở chỗ nào cũng có thể ghi được. 80 từ trở lên : Chất lượng phòng tốt. 40 – 60 từ : Chất lượng phòng trung bình. nhỏ hơn 40 từ: Chất lượng phòng kém. Hiệu ứng stereo Là hiệu ứng mà con người xác định được vị trí của nhiều nguồn âm sơ cấp- > Tạo nên hệ thống âm thanh lập thể (2 kênh và nhiều kênh). Trong điện ảnh là 5 kênh đến 9 kênh. Tai người khi thụ cảm còn mang tính phi tuyến Nếu τ < 50 ms thì tai ta không phân biệt được hai âm đó. Nếu τ <200ms : không xác định được công suất âm thanh. Với τ là độ trễ giữa trực âm và phản âm. Trực âm và phản âm Trong một không gian khép kín - một phòng, sóng âm từ nguồn âm một mặt lan truyền trực tiếp tới người nghe hoặc microphone đó là TRỰC ÂM, mặt khác nó đập vào bề mặt giới hạn của phòng ( tường, trần, nền) và các đồ vật đặt trong phòng rồi phản xạ trở lại đó là PHẢN ÂM. Hiện tượng này của sóng âm không chỉ xảy ra một lần mà cứ lặp đi lặp lại, mỗi lần gặp chướng ngại vật thì một phần năng lượng âm bị tiêu hao vào vật liệu cấu tạo của vật đó – ta gọi đó là hiện tượng hấp thụ âm thanh, một phần bức xạ trở lại không khí – ta gọi là hiện tượng phản xạ âm thanh. Những âm phản xạ lần thứ nhất gọi là phản âm bậc một chúng thường có năng lượng lớn ( chỉ nhỏ hơn trực âm) và tách biệt thành những phản xạ rời rạc. Phản âm bậc một có ý nghĩa vô cùng quan trọng đối với đối với sự cảm nhận không gian của phòng thu, cho dù trong thực tế ta khó có thể nghe tách biệt chúng ra khỏi tín hiệu chung. Các phản âm bậc 2,3,...ngày càng dầy và đan xen từ nhiều hướng, nhưng sau mỗi lần phản xạ năng lượng âm lại suy giảm và dần dần bị suy hao cho đền hết, ta gọi đó là hiện tượng kết vang. Số đo biểu thị tốc độ suy giảm năng lượng âm như trên gọi là thời gian vang (reverberation time) hay thời gian kết vang. Vì sóng âm phản xạ từ tất cả các hướng tới microphone (hoặc người nghe) nên nó tạo ra một trường âm Tán xạ tạo ra cảm giác âm thanh không gian hoặc âm thanh quang cảnh . 1.10. Sự suy giảm năng lượng trên đường truyền - Với nguồn âm điểm: Phát ra sóng có dạng hình cầu – sóng cầu nghĩa là sóng âm bức xạ đều ra theo các hướng hay nói cách khác năng lượng âm được phân bố đều đặn trên mặt cầu. Diện tích măt cầu S=4ПR2 nghĩa là năng lượng âm sẽ giảm theo tỉ lệ với bình phương của khoảng cách tới nguồn âm tức là suy giảm rất nhanh: mỗi khi khoảng cách tăng gấp đôi (ví dụ từ 3m đến 6m ) thì thanh áp giảm đi một nửa hoặc mức thanh áp giảm đi 6dB. Như vậy, ở trường gần năng lượng năng lượng (hay mức âm) giảm rất nhanh, ở trường xa độ suy giảm chậm hơn. - Khi có rất nhiều nguồn âm điểm nối tiếp nhau tạo thành một tuyến (một đường) sẽ tạo thành nguồn âm tuyến kéo dài nên sóng âm của những nguồn dạng âm tuyến như thế sẽ tạo thành những hình ống bức xạ vào không trung. Sự suy giảm của dạng nguồn âm này nhỏ hơn : khi khoảng cách tăng gấp đôi thì nó giảm có 3dB. - Những nguồn âm có dạng mặt phẳng gọi là nguồn âm diện . Trong trường gần của các nguồn âm diện có mặt bức xạ lớn mức âm hầu như không suy giảm theo khoảng cách vì sóng âm ở đây có dạng gần như sóng phẳng. Ở khá xa nguồn âm diện (với khoảng cách R >> kích thước nguồn âm) thì mức âm mới suy giảm dần. 1.11. Ảnh hưởng của thời tiết và khí hậu - Hầp thụ năng lượng của môi trường không khí tần số càng cao độ suy giảm càng lớn. - Nhiệt độ - Độ ẩm Khi nhiệt độ và độ ẩm tăng thì sự suy giảm năng lượng âm lại bớt đi. Ảnh hưởng của gió. 1.12. Hiện tượng nhiễu xạ Trên đường lan truyền trực tiếp từ nguồn âm đến đến người nghe hoặc microphone, sóng ân thường gặp các vật cản, thí dụ cột, tường, bàn ghế,..tạo ra hiện tượng nhiễu xạ của sóng âm tương tự như hiện tượng nhiễu xạ của ánh sáng. Có ảnh hưởng nhỏ đến âm mà tai người hoặc microphone thu được. 1.13. Hiện tượng hấp thụ âm thanh Khi sóng âm gặp một vật liệu hút âm thì một phần năng lượng của nó bị hấp thụ vào vật liệu một phần phản xạ trở lại không gian. Năng lượng âm bị hấp thụ, một phần chuyển thành nhiệt năng trong vật liệu, một phần được truyền qua tường rồi bức xạ qua phòng bên cạnh. Không có loại vật liệu nào có khả năng hấp thụ mọi tần số âm thanh như nhau. Có thể chia ra 3 chủng loại vật liệu hút âm như sau: + Vật liệu hút âm trầm (khoảng dưới 250Hz) + Vật liệu hút âm trung (khoảng 250Hz đến 1000Hz) + Vật liệu hút âm cao (khoảng trên 1000Hz). 1.14. Hiện tượng âm vang Trong một phòng (nhất là phòng lớn và tường cứng) khi âm thanh của một nguồn âm đã tắt, nhưng nó vẫn còn ngân dài nhờ hiện tượng phản xạ của sóng âm; ta gọi đó là hiện tượng âm vang. Tiếng vang có ảnh hưởng rất lớn đến đặc điểm âm thanh của phòng. Trong biểu diễn âm nhạc, nhờ có tiếng vang mà tại những chỗ dừng - dấu lặng – âm thanh không bị cắt cụt một cách khô khan; nó được bù đắp phần nào bởi năng lượng của trường phản âm – âm thanh quan cảnh. Chính phần tín hiệu quang cảnh này cho ta những thông tin về đặc diểm âm học của không gian biểu diễn ( phòng hoà nhạc, studio hay nhà thờ,..). So với trực âm, tiếng vang đến tai ngưòi nghe hay microphone phải sau một khoảng thời gian t nào đó gọi là trễ. Hiện tượng âm vang bao gồm 3 giai đoạn: khởi vang, đồng vang và kết vang. 1.15. Những yêu cầu cơ bản đối với một ảnh âm lập thể (stereo) 1. Giữ được sự cân đối lập thể: Xét cả về phân bố âm lượng cho mỗi nguồn âm cũng như phân bố phương vị cho các nguồn âm. Có 5 phương vị chính khi dựng ảnh âm: TRÁI (L), NỬA TRÁI (HL), GIỮA (M), NỬA PHẢI (HR), và PHẢI ( R). 2. Tận dụng tối đa chiều rộng dựng ảnh âm. 3. Tạo được cảm giác không gian rõ rệt. 4. Đảm bảo tính tương thích (đối với các chương trình dùng cho phát thanh truyền hình). 1.16. Tiếng nói và việc nhận dạng tiếng nói Hiện nay, có các phương pháp sau để nhận dạng tiếng nói: Nhận dạng tiếng nói bằng phương pháp Markop ẩn, bằng mạng nơ ron và bằng trí tuệ nhân tạo. 1.17. Nguyên lý ghi âm Với analog có các phương pháp ghi như sau: Ghi cơ giới Là phương pháp dùng thiết bị cơ giới để khắc những tín hiệu âm thanh, thành dạng các rãnh vòng tròn trên đĩa nhựa. Khi cần phát lại âm thanh đã ghi, thì cho kim đĩa hát chuyển động trên những rãnh vòng đó. Phương pháp này dùng trong sản xuất đĩa hát. Ghi âm quang học Là phương pháp dùng micrô và bộ điều chế quang, để đưa âm thanh cần ghi vào những phiến nhựa cảm quang. Sau đó đưa phiến nhựa đã định hình ghi âm, khống chế ánh sáng của đèn quang học chiếu tới, để phát ra tín hiệu ban đầu. Phương pháp ghi âm quang học thường dùng trong điện ảnh. Ghi âm từ Là phương pháp dùng dòng điện âm tần tác động lên băng từ và để lại từ dư trên băng theo quy luật của dong điện âm tần. Lúc phát lại thì những mức từ dư trên băng qua đầu từ đọc lại biến thành dòng điện âm tần. Phương pháp ghi âm từ dùng trong truyền thanh và đời sống. Nguyên lý ghi âm từ dựa trên đặc tính của các hạt sắt từ có thể bị nhiễm từ, khi chịu tác động của từ trường và còn giữ lại mức từ dư, khi ra khỏi từ trường đó. Hiện nay, người ta thưòng dùng băng từ là băng nhựa có phủ một lớp bột sắt từ. Với digital Định dạng băng audio số DAT đầu tiên được phát triển cho máy ghi âm dân dụng (đầu từ quay – nên gọi là R-DAT : Rotary – Digital Audio Tape). Tuy nhiên DAT có chất lượng cao nên được dùng trong các muc đích chuyên dụng. CHƯƠNG II XỬ LÝ TÍN HIỆU ÂM THANH SỐ . Tín hiệu âm thanh số là gì ? Ở dạng gốc, tín hiệu âm thanh (tín hiệu âm tần) là tín hiệu tương tự (analog) tức là tín hiệu có đường biểu diễn tần số và biên độ liên tục. Tín hiệu analog là tín hiệu liên tục về thời gian và trị số. Tín hiệu âm thanh digital là tín hiệu gồm những mẫu được lấy ra từ tín hiệu gốc analog và số hoá theo mã quy định, vì thế nó là những tín hiệu rời rạc, xét về mặt thời gian cũng như giá trị. Mỗi mẫu rời rạc được biễu diễn bằng một mã nhị phân. Việc xử lí các mẫu nhị phân rời rạc đó theo quy luật của kỹ thuật số gọi là phương pháp xử lí tín hiệu âm thanh số. Mạch xử lí tín hiệu âm thanh số chủ yếu là các mạch trữ, mạch chuyển tiếp và mạch thuật toán. Tại sao cần xử lí tín hiệu âm thanh theo công nghệ số a. Phương pháp xử lí tín hiệu bằng công nghệ tương tự thường có những hạn chế về Dải tần Dải động Độ méo Độ suy hao Suy giảm chất lượng khi sao chép thông tin,... b. Một hệ truyền tín hiệu ( nói ngắn gọn là một kênh ) được đặc trưng bởi các tính chất kỹ thuật sau Tỉ số tín hiệu trên tạp âm (S/N) Yếu tố gây nhiễu thường gặp nhất là tạp âm sinh ra ngay trong các linh kiện điện tử ( cả linh kiện thụ động và tích cực ). Những điện áp tạp âm này phân bố suốt dải âm tần, từ thấp lên cao. Khi nghe phát ra loa ta thường có cảm giác chúng chỉ xuất hiện ở vùng tần số cao. Sở dĩ như vậy dải thông ở vùng tần số thấp trên đường đặc tuyến biên độ tần số hẹp hơn nhiều so với vùng tần số cao. Mặt khác khả năng cảm thụ của tai người còn phụ thuộc vào tần số. Tiêu chuẩn cho máy HiFi : (S/N) >= 54dB. Dải động Dải động của một kênh truyền dẫn cho biết mức điện áp ra cực đại và cực tiểu mà không bị ảnh hưởng của tạp âm, biểu thị bằng dB. Giá trị cực đại còn phụ thuộc vào khả năng điều chế của hệ thống, giá trị tạp nhiễu phụ thuộc vào độ nhiễu và tạp âm của toàn kênh. Khi truyền một tín hiệu âm thanh với dải động tự nhiên của kênh đủ rộng (thí dụ một tác phẩm khí nhạc cho dàn nhạc hoà tấu: concerto, symphony,..) qua một kênh truyền dẫn có dải động hẹp hơn thì tín hiệu đầu ra bị ép lại. Dải tần Tín hiệu truyền đi thường bị giới hạn trong một khoảng tần số, tuỳ thuộc chất lượng của kênh. Tín hiệu tần số thấp, thành phần điện áp một chiều và tần số cao (ở cuối dải tần) thưòng không được chuyển tải đầy đủ hoặc bị mất hoàn toàn. Độ tuyến tính Trên một kênh truyền dẫn lý tưởng thì tín hiệu đầu ra phải biến đổi tuyến tính vói tín hiệu đầu vào. Nếu không được như vậy thì sẽ tạo ra méo tín hiệu. Kênh truyền dẫn thường tạo ra méo tuyến tính (méo đường thẳng) và méo phi tuyến tính (méo không đường thẳng). Méo đường thẳng xuất hiện khi đặc tuyến biên độ - tần số của hệ truyền không bằng phẳng. Méo không đường thẳng tạo ra các thành phần tần số không có trong tín hiệu gốc. Dạng méo này là do các đặc tuyến công tác của linh kiện không được thẳng, sinh ra hài. Độ méo biểu hiện bằng hệ số méo, tức là bằng tỷ số hiệu dụng của các thành phần hài bậc cao do méo tạo ra trên tín hiệu tổng. Note : Trên cơ sở tóm tắt các đặc tính kỹ thuật của một kênh thông tin ta thấy ngay: tín hiệu analog bị ảnh hưởng rất nhiều bởi tình trạng của kênh trong quá trình chuyển tải thông tin. Để giảm tới mức thấp nhất những ảnh hưởng của kênh lên tín hiệu, người ta chuyển tín hiệu của âm thanh sang dạng số. 2.3. Ưu, nhược điểm của công nghệ xử lý âm thanh số Ưu điểm Nhiễu không thể xâm nhập được vào tín hiệu Với kỹ thuật analog ta không thể tách nhiễu ra khỏi tín hiệu khi đã bị xâm nhập, mặt khác tỉ số S/N bị thu hẹp. Trong kỹ thuật digital, với phương pháp hạn biên (limit) ta hoàn toàn có thể tách được nhiễu ra khỏi các điện áp vuông góc để tái tạo các tín hiệu gốc hoàn toàn sạch. Nhờ đó, có thể lọc được tất cả can nhiễu của hệ thống truyền dẫn. Phương pháp xử lí tín hiệu số có thể đạt được S/N > 90 dB và do đó có thể đạt được dải động rất lớn. Ưu điểm này cho phép sao chép nhiều lần các thông tin âm thanh từ băng hay đĩa sang băng hay đĩa khác mà không làm giảm chất lượng. Trong công nghệ analog, quá trình in lại các băng đĩa đều làm tăng tạp âm rõ rệt. Điều này hoàn toàn không tồn tại trong công nghệ digital. Tóm lại XLTH âm thanh bằng công nghệ số có các ưu điểm sau: Tỷ số S/N lớn. Mở rộng dải động. Có khả năng sao chép thông tin vô hạn định mà không làm giảm chất lượng. Không bị ảnh hưởng bởi sự dao dộng nhiệt độ và điện áp công tác. Không bị méo tín hiệu. Có khả năng tái lập thành phần điện áp một chiều của tín hiệu. Đặc tuyến tần số bằng phẳng. b. Nhưng công nghệ số cũng có các nhược điểm sau 1.Tín hiệu ở dạng dữ liệu số thưòng dễ bị tổn thất. Chỉ mất một vài bit dữ liệu cũng dẫn tới lỗi trong tín hiệu âm thanh. Sửa các lỗi dữ liệu rất tốn kém về phần mềm cũng như phần cứng. 2. Hệ thống thiết bị xử lí tín hiệu âm thanh số phức tạp và tốn kém hơn so với công nghệ tương tự. 3. Bão hoà tín hiệu sẽ dẫn tới phá huỷ hoàn toàn tín hiệu âm thanh. 4. Không thể cắt nối băng ghi âm số như băng ghi âm tương tự, ở đây phải sử dụng phương pháp cắt nối điện tử. Ngày nay với công nghệ vi mạch có thể giải quyết dễ dàng nhược điểm 1,2. 2.4. Các bộ biến đổi tương tự - số và số - tương tự (ADC và DAC) (Sẽ giới thiệu tổng quan) 2.5. Mã hoá kênh truyền Mã hóa kênh được sử dụng trong các hệ thống ghi số và truyền dẫn nhằm làm cho các đặc tính của dữ liệu sau mã hóa nguồn phù hợp với đặc tính của máy ghi hay kênh truyền. Mã hoá kênh truyền sẽ sửa đổi dữ liệu gốc nhằm đạt được mật độ bít cao nhất có thể được trong giới hạn đặc tính của dải thông kênh truyền. DC (Direct current) hay các tần số thấp khác sẽ không được chuyển đổi trong quá trình này. Trong truyền dẫn, dữ liệu truyền dẫn phụ thuộc vào tốc độ chuyển đổi thông tin phải nhỏ hơn dung lượng kênh truyền, dẫn đến hiện tượng thường gặp là sự không thích ứng đối với kênh truyền. Khả năng giảm bớt sự mất mát thông tin trong thời gian truyền dẫn hoặc giải thông kênh truyền được cải thiện khi dữ liệu truyền dẫn đạt được có đặc tính tốt nhất, và điều này giải thích cho sự cần thiết của quá trình mã hóa kênh truyền. Đặc tính của dải thông kênh truyền dẫn dẫn đến sự méo tín hiệu tại tần số thấp và cao trong dải tần cơ bản. Từ đó mục tiêu của mã hóa kênh truyền là làm cho hình dạng phổ tín hiệu audio số bị méo nhỏ nhất. Các dạng mã hoá kênh truyền là NRZ ( Non Return to Zero), BPM ( Biphase - Mark ), HDB3,... 2.6. Cơ sở về nén AUDIO số 2.6.1 Kỹ thuật mã hoá nguồn được dùng để loại bỏ độ dư thừa trong tín hiệu Audio và các kỹ thuật “ psychoacoustic masking – che mặt nạ tâm sinh lý nghe ” được dùng để nhận biết và loại bỏ những thành phần không thích hợp ( các mẫu âm thanh lỗi). Có 2 kỹ thuật nén chủ yếu là : a. Mã hoá dự đoán trước trong miền thời gian: Phương pháp này sử dụng việc mã hoá khác nhau đối với các thành phần khác nhau của các mẫu liên tiếp mà có thể khôi phục được. Việc giảm tốc độ dòng bit sẽ được sử dụng để mã hoá và truyền dẫn các thông tin của tín hiệu audio. b. Mã chuyển đổi trong miền tần số: Kỹ thuật này sử dụng các khối block của các mẫu audio ra từ bộ PCM đều để truyền từ miền thời gian trong miền tần số những dải băng khác nhau. 2.6.2. Nén không tổn hao Nén không tổn hao cho phép khôi phục lại dòng bit những thông tin nguyên thuỷ sau bộ giải nén mà không gây ra tổn hao. Hệ thống này loại bỏ sự dư thừa thống kê, những thông tin tồn tại trong tín hiệu audio có thể dự báo trước từ những mẫu trước đó. Bộ nén không tổn hao cho các tỉ số nén thấp, tỉ số tốt nhất đạt được là 2:1 nó phụ thuộc vào sự phức tạp của tín hiệu audio nguồn. Nén không tổn hao sử dụng kỹ thuật mã dự đoán trước trong miền thời gian bao gồm: - Thuật toán vi sai: DPCM (Differential PCM ), ADPCM. - Mã hoá entropy: tận dụng độ dư thừa trong cách miêu tả của các hệ số băng con đã lượng tử hoá nhằm cải thiện tính hiệu quả của quá trình mã hoá . - Các thông số quá tải khối dữ liệu: Các giá trị nhị phân từ quá trình biến đổi ADC, được nhóm thành các khối dữ liệu cả trong miền thời gian, bằng cách lấy mẫu kề nhau tại đầu ra ADC, lẫn trong miền tần số tại đầu ra FDCT. Các giá trị nhị phân trong một khối dữ liệu sau đó được tạo thang độ tiếp sao cho giá trị vừa dưới toàn bộ thang. 2.6.3. Nén có tổn hao Nén có tổn hao được đề cập đến bởi sự kết hợp của 2 hay nhiều hơn các công nghệ xử lý mà nó lợi dụng đặc tính của hệ thống HAS (Human Auditory System) là không phân biệt được các thành phần phổ có biên độ nhỏ giữa những thành phần phổ có biên độ lớn. Các phương pháp giảm số liệu xử lý cao có hệ số nén từ 2:1 đến 20:1, nó phụ thuộc vào quá trình nén và giải nén, và vào yêu cầu chất lượng của audio. Các hệ thống số nén có tổn hao sử dụng công nghệ mã hoá tri giác. Nguyên lý cơ bản của nó là loại bỏ những thành phần dư thừa trong tín hiệu audio bằng cách bỏ đi những tín hiệu nằm dưới đường cong ngưỡng âm, điều này giải thích tại sao người ta gọi các hệ thống nén số liệu có tổn hao là mất các thành phần âm. Nén làm mất các thành phần âm được kết hợp từ các kỹ thuật như: - Kỹ thuật “masking - che” đối với các thành phần tín hiệu trong miền thời gian và trong miền tần số. Tỉ lệ signal – mask được sử dụng để xác định số bit cho quá trình lượng tử hóa mỗi băng với mục đích giảm thiểu khả năng nghe thấy của âm thanh. - Chặn mức tạp âm lượng tử cho từng âm độ của tín hiệu âm thanh bằng cách chỉ định số bit vừa đủ để chắc chắn rằng mức nhiễu lượng tử luôn luôn nằm dưới mức giá trị cần chặn. Tại những tần số gần với tần số tín hiệu âm thanh thì S/N có thể chấp nhận được từ 20 đến 30 dB, tương đương với độ phân tích từ 4 đến 5 bits. - Mã hoá nối: Công nghệ này khai thác sự dư thừa trong hệ thống audio đa kênh, người ta thấy rằng có rất nhiều các phần số liệu ở trong các kênh là giống nhau, do đó người ta có thể nén số liệu bằng cách mã hoá 1 phần số liệu chung đó trên một kênh và chỉ định cho bộ giải mã lặp lại tín hiệu đó trên các kênh còn lại. 2.7. Nén tín hiệu Audio theo chuẩn MPEG (Moving Picture Experts Group) ( sẽ giới thiệu tổng quan) Chuẩn nén MPEG-1, MPEG-2 2.8.Ví dụ: Mã hoá và giải mã âm thanh Dolby Digital trong truyền hình số 1. Giới thiệu: Để chuyển tín hiệu truyền hình số DTV từ máy phát đến khách hàng, người ta phải dùng kỹ thuật mã hoá đa kênh Dolby Digital (hay AC-3). Bắt nguồn từ luật mã AC-2 , bản chất AC-3 là bộ mã hoá sử dụng kỹ thuật tuyến tính tần số, lọc lấy mẫu tới hạn dựa trên kỹ thuật triệt tiêu trong miền thời gian TDAC (Time domain alias cancellation). Lợi thế đầu tiên của phương pháp lọc dựa trên cơ sở mã hoá là ở chỗ các phần tử tín hiệu và nhiễu lượng tử tương ứng (Đã có kế hoạch được chắn lọc), được giữ bên trong độ rộng băng tới hạn so với bên kia, xuất phát từ độ lợi lớn nhất từ đặc tính lọc của tai người và giảm thiểu tốc độ dữ liệu hợp thành được yêu cầu cho mã hoá nhiễu tự do có thể cảm nhận được. Đối với sự xuất hiện của các đột biến , độ rộng chặn biến đổi của bộ lọc có thể được giảm rất năng động nhằm chứa luôn các đột biến nhỏ tạm thời, do đó chứa luôn các nhiễu lượng tử mức nhỏ. Hình 1. Sơ đồ khối bộ mã hoá Dolby Digital Hình 2 Kỹ thuật phân phối định vị Bit năng động thực hiện trên các đa kênh từ nhóm Bit cơ bản bằng cách đính các Bit chỉ định thông qua những tần số và kênh như được yêu cầu, trong khi vẫn tiếp tục nắm giữ quyền điều khiển lọc chắn trong nội bộ từng kênh và giữa các kênh với nhau. Qui trình xử lý khối của một bộ mã hoá và giải mã DD theo các bước minh họa dưới đây: Bộ mã hoá Dolby Digital Bộ đệm đầu vào AC-3 là bộ mã hoá được cấu trúc theo từng khối, do đó có thể có một hoặc nhiều khối xử lý cho tín hiệu trong miền thời gian, với 512 mẫu cho một khối, được lựa chọn trong bộ đệm vào từ mỗi kênh trước khi tiến hành xử lý tiếp theo. Bộ lọc đầu vào : Các tín hiệu đầu vào của bộ mã hoá được lọc thông cao một cách riêng biệt. (Left, Right, Left Surround, Right Suround, Center, Subwoofer), bắt đầu từ 3Hz nhằm vất bỏ gợn biên một chiều DC. Tín hiệu cho Subwoofer cũng được lọc luôn đến 120Hz hoặc lớn hơn đôi chút Phát hiện đột biến: Tất cả các tín hiệu qua khâu xử lý ở bước trên được phân tích ở bước tiếp theo nhằm phát hiện đột biến. Thông tin này được sử dụng để điều chỉnh thông số bộ lọc của TDAC, hạn chế hiện tượng nhiễu lượng tử kết hợp với mức đột biến tại mức thấp, tránh mất tác dụng lọc tạm thời. Bộ lọc TDAC : Mỗi tín hiệu trong miền thời gian của một kênh được tạo một cửa sổ và được lọc với bộ lọc TDAC. Những biến đổi TDAC dựa trên kỹ thuật lật trạng thái của FFT. Quá trình xử lý tiếp theo được thực hiện trên quần thể 6 kênh 5.1 của các hệ số biến đổi TDAC trên diện rộng, đồng thời nhìn chúng như một thực thể duy nhất. (Chỉ có những hệ số đầu tiên của kênh Subwoofer được mang đi. Trong qúa trình khôi phục lại tín hiệu, bộ giải mã sẽ tái cấu trúc lại tín hiệu của miền thời gian từ những hệ số biến đổi trên thông qua bộ lọc tổng hợp biến đổi ngược TDAC. Cả bộ lọc phân tích và bộ lọc tổng hợp đều lấy mẫu giới hạn và xây dựng lại một cách chính xác, nhờ đó tránh được việc mất mát thông tin. Thêm nữa, cả hai bộ lọc đều sử dụng phương pháp xử lý gối phủ: 2/3 khối thông tin thứ nhất được xử lý trọn vẹn, 1/3 khối thông tin của khung thứ hai đã được xét đến. Điều này tránh được sự gián đoạn và luôn bảo toàn thông tin. Lợi thế đầu tiên của việc mã hoá đạt được từ việc lượng tử hoá có lựa chọn các hệ số biến đổi mà chúng chứa cả các yếu tố chính của thông tin cần mã. Chuyển đổi sang hệ dấu phẩy động: Khi chuyển sang xử lý dấu chấm cố định trên Chip âm thanh số DSP (Digital Sound Processor), các hệ số biến đổi TDAC AC-3 cùng những giá trị phần định trị trong phạm vi từ 0,5 đến 1, các số mũ tương ứng được chuyển về hệ dấu phẩy động. Điều này bảo đảm quá trình xử lý tiếp không đặt một sự hạn chế về dải động nào. Xử lý tách phần tử trống : Nói chung , yêu cầu trung bình về lượng Bit của hệ đa kênh xuất hiện tỷ lệ không thuận hoàn toàn với căn bậc hai của số lượng kênh. Nếu cần tới 128Kbps để mã hoá một kênh đơn , như vậy 5.1 kênh đòi hỏi 128*SQRT (5.1) = 289Kbit/s, thông thường AC-3 dùng 320 Kbit/s. Điều này cho thấy, phần lớn tín hiệu của các đa kênh có thể được mã hoá thích đáng chỉ cần thông qua tính năng động của của kỹ thuật gán Bit tổng quan. Đối với các tín hiệu yêu cầu cao, việc kết hợp có lựa chọn các thành phần mang tần số cao được sử dụng nhằm cung cấp thêm độ lợi mã hoá. Kỹ thuật này loại trừ thông tin định vị tần số cao dự phòng, dựa vào hiện tượng thanh âm vật lý học là tại tần số cao, hệ thống thính giác của con người định vị âm thanh chủ yếu trên cở sở “bao bọc” những tín hiệu được lọc đến tai họ hơn là bản thân tín hiệu đó như thế nào. Cách thức này được khai thác trong AC-3 bằng việc tách biệt tín hiệu băng con của tần số cao trở thành các phần tử “bao lại” và các phần tử trống. Các phần tử trống được mã hoá kém chính xác hơn. Nếu cần thiết, các phần tử trống của các kênh sẽ được tập hợp lại. Điều này có tác động tối thiểu đến âm thanh, từ đó thông tin định vị sẽ được bảo vệ trong dữ liệu “bao bọc” kia, phần kia trong bất kỳ trường hợp nào sẽ kết hợp do hiện tượng thanh học bởi tai nghe của người nghe, tạo ra kết quả cân bằng. Thông tin trống được mã hoá tăng số lượng mảng phần định trị và phần số mũ, trong khi thông “bao bọc” được truyền tải như những phần hệ số hữu ích. Gán Bit tổng quan: Mã hóa đa kênh yêu cầu cấp phát một trình con nhằm giám sát qua lại các Bit lượng tử hoá dọc theo các kênh và các tần số khi cần để đáp ứng yêu cầu thay đổi của tín hiệu. Thanh gán Bit AC-3 phân tích các hệ số biến đổi nhưng chú trọng đến các tác động về chắn lọc của chúng và mối quan hệ ngưỡng nghe được tuyệt đối, do đó tính toán được sự chính xác lượng tử hoá (Lượng Bit) cần thiết để mã hoá một định trị. Phép tính được thực hiện tổng quát trên quần thể các kênh được nhìn trong một khối thống nhất, sử dụng một nhóm Bit chung, một Bit nhóm đơn... Cả bộ mã hoá và giải mã đều thực hiện chung một trình gán Bit: lấy chuẩn thông tin về số mũ đầu tiên để làm việc. Tuy nhiên, do các thuật toán nhằm bảo vệ thông tin trong bộ mã hoá đã thực hiện khi tính toán việc gán Bit, bộ giải mã không phải làm những phép tính tương ứng. Bộ mã hoá cũng có tham số lựa chọn về việc gửi đi dấu gán Bit trong dòng tin của mình, cho phép bộ giả mã tinh chế lại các thông tin vi tế trên . Lượng tử hoá: Kết quả tính toán trên được dùng lượng tử hoá dữ liệu phần định trị của TDAC. Thay vì gửi đi n Bit đặc thù nhất của một giá trị, giá trị này được chia thang và độ dịch biên cung cấp điểm 0, độ rộng thang đo, các mức lượng tử đối xứng (Lượng tử đối xứng lẻ) nhằm giảm tối đa sự xen nhiễu và tạo điều kiện cho việc dùng. Đóng gói dữ liệu: Các bước xử lý trên chuyển đổi mỗi khối 6 kênh tín hiệu thời gian thành một loạt các mảng giá trị chuyển đổi và giá trị vô hướng gồm cả phần định trị được lượng tử hoá, phần số mũ của TDAC, thông tin về chuỗi gán Bit định vị, các hệ số đúp, cờ nghiệp vụ. Trạng thái cuối cùng khi mã hoá, thông tin này được đóng gói thành một khối đơn, đi cùng với với thông tin về đồng bộ, tiêu đề, sửa lỗi, và các biến lựa chọn khác nhau khác. Người ta cũng đóng gói tin trong một quan hệ thứ tự Logic sao cho dễ dàng khi xử lý mở các gói tin này tại khu giải mã. 3. Khối giải mã Bộ đệm vào: Như phần mã, nó được cấu trúc thành khối và do đó nó thiết lập và duy trì đồng bộ với dòng dữ liệu vào, tập hợp lại những khối được mã hoá chính trong bộ đệm và giải mã chúng. Định vị lỗi: Mỗi khối dữ liệu vào được kiểm tra về mật độ bên trong chúng, về sự có mặt của thông tin trạng thái từ bộ vi xử lý khắc phục lỗi. Nếu có dấu hiệu của lỗi không thể khôi phục được phát hiện, khối tín hiệu cuối cùng của đầu vào được xem là tốt, sẽ đem thế vào nhằm lấp phần lỗi kia đi. Do cơ chế xử lý thông tin gối phủ, việc lặp lại một vài khối thông tin có thể được tạo ra nếu cần thiết , giúp việc tái tạo lại dạng tín hiệu bị lỗi một cách lành lặn, trước khi bộ giải mã tìm thấy những dấu hiệu nặng hơn về lỗi đến mức hoặc ngắt liên lạc với đầu vào, hoặc trong một vài ứng dụng đòi hỏi độ an toàn cao, nó tìm đến các mảng thông tin tương tự, cùng tồn tại dưới dạng Analog trên cùng phần mềm đó. Hình 3 Dỡ bỏ dữ liệu được đóng gói: Việc này được thực hiện trong hai trạng thái. Trước tiên, dữ liệu ở dạng cố định như số mũ, các hệ cho ghép nối, các cờ được dỡ xuống. Những phần có liên quan của dữ liệu được sử dụng nhằm khôi phục việc gán Bit, điều cần thiết để mở các dữ liệu dạng khả biến (Variable data), đặc biệt là các mảng định trị TDAC. Gán Bit giải mã: Trình gán Bit này gần như giống hệt cái đã thực hiện trong bộ giải mã, có điều nó dùng các kết qủa trung gian được truyền đi nhằm tiết kiệm thời gian và để sửa đổi việc gán Bit định vị chuyển hóa một cách có lựa chọn như bộ mã điều khiển. Điều này cũng cho phép bộ giải mã tính toán được việc gán Bit trên một kênh tại một thời điểm, giảm thiểu yêu cầu về kích thước bộ nhớ. Thuật toán này phải liên hệ chặt chẽ với cái tương tự trong bộ mã hoá thì phần dữ liệu biến đổi mới được tời xuống thích đáng. Xử lý dữ liệu dạng biến: Gán Bit giải mã được khôi phục chỉ ra kích thước của mỗi đơn vị định trị được dùng để tải xuống dữ liệu dạng biến từ dòng Bit mã hoá. Chuyển đổi dấu phẩy tĩnh: Với mục đích chuyển ngược cho những giá trị TDAC, dữ liệu định trị và mũ được kết hợp để xây dựng lại các hệ số TDAC theo kiểu dấu phẩy tĩnh. Chèn các phần tử trống vào tần số cao: Các hệ số của tần số cao được mã hoá như những thông tin trống và thông tin hữu ích được tái cấu trúc lại do việc kết hợp các trống này với hệ số ghép nối tương ứng. Biến đổi ngược : Hệ số biến đổi TDAC được khôi phục của mỗi kênh được chuyển ngược về miền thời gian, một chuỗi quá trình như tạo cửa sổ giám sát, xử lý xen phủ được làm tại đây để tạo nên tín hiệu ra trong miền thời gian ở dạng số được giải mã. Hệ số của Subwoofer được chèn giả ký tự Zero tại tần số thấp, và cao trước khi biến đổi, do đó cửa ra Subwoofer trong miền thời gian là tốc độ mẫu đầy đủ. Hình 4 Cấu hình âm thanh cho hệ thống máy thu khách hàng chất lượng cao Cho dù đài phát truyền đi hình ảnh và âm thanh dưới dạng nào AC-3 hoặc Dolby Surround thông thường, để có thể tái tạo âm thanh theo ý đồ thiết kế của nhà cung cấp, hệ thống loa thông thường chưa đáp ứng được. Cấu hình âm thanh chuẩn sẽ như hình 4. Đây là cấu hình đầy đủ nhất dành cho một rạp chiếu bóng AC-3 và 5.1 kênh DTS, tính đến thời điểm hiện nay. Trong điều kiện gia đình, cấu hình được đơn giản hoá đôi chút trên nền tảng của cấu hình đã đề cập. Chi tiết chức năng được giải thích như sau: Hình 5 - Hai loa chủ (Left và Right) tái tạo toàn cảnh âm thanh. - Loa Center tái tạo chủ yếu là lời hội thoại trong các cảnh. Nhờ loa này, người xem ngồi hai bên cánh sẽ không bị cảm giác nhoè tiếng nói trong tiếng nhạc nền, tiếng độn._.

Các file đính kèm theo tài liệu này:

  • docBK0003.DOC