Bài giảng Cơ sở dữ liệu đa phương tiện - Chương 1: Các khái niệm cơ bản b - Nguyễn Thị Oanh
Nội dung
1. Văn bản (text)
2. Đồ họa và ảnh động (vector graphics and
animation)
3. Âm thanh (Digital Audio)
4. Ảnh số (Digital Image)
5. Video số (Digital Video)
1. Văn bản (text)
2. Đồ họa và ảnh động (vector graphics and
animation)
3. Âm thanh (Digital Audio)
4. Ảnh số (Digital Image)
5. Video số (Digital Video)
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Cơ sở dữ liệu đa phương tiện - Chương 1: Các khái niệm cơ bản b - Nguyễn Thị Oanh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.
File đính kèm:
- bai_giang_co_so_du_lieu_da_phuong_tien_chuong_1_cac_khai_nie.pdf
Nội dung text: Bài giảng Cơ sở dữ liệu đa phương tiện - Chương 1: Các khái niệm cơ bản b - Nguyễn Thị Oanh
- Nội dung 1. Văn bản (text) 2. Đồ họa và ảnh động (vector graphics and animation) 3. Âm thanh (Digital Audio) 4. Ảnh số (Digital Image) 5. Video số (Digital Video) 2
- DL văn bản – Chứa thông tin chủ đạo – Input: bàn phím, các chương trình nhận dạng âm thanh và ký tự, dữ liệu lưu trên đĩa, phụ đề phim, 4
- DL văn bản - Nén Nén không làm mất mát thông tin Dự trên thực tế: – tần suất xuất hiện của các ký tự khác nhau Một số kỹ thuật: – Huffman coding – Run-length Coding – Lempel Zip -Welch Coding (LZW) 6
- Run-length Coding Dựa trên số lần lặp liên tục của các ký tự eeeeeeeebtnnnnnnn 1 run, Ký tự đăc biệt để chỉ rằng length = 8 đang mã hóa @ 8 e Kết quả: @8ebt@7n 8
- 2. Đồ họa và ảnh động 10
- 3. Âm thanh 12
- DL âm thanh – Tín hiệu âm thanh là tín hiệu tương tự và liên tục – Input : microphone số hóa và lưu trữ – Không gian lưu trữ lớn : CD Quality Audio : 16-bit sampling at 44.1 KHz 1 phút của 1 Mono CD (chưa nén): 5Mb 1 phút của Stereo CD (chưa nén) : 10Mb – Thường được nén lại để giảm kích thước (mp3, aac, Flac, Ogg Vorbis, ) 14
- Một số kỹ thuật nén – Lượng tử phi tuyến – Predictive Coding – Chuẩn nén audio : MPEG – Audio 16
- Ảnh số – Ảnh số là một chuỗi các điểm ảnh để biểu diễn 1 vùng sẽ được hiển thị trên màn hình của người sử dụng – Input : caméra, scan, sinh ra từ các chương trình mô phỏng hay các phần mềm tạo và xử lý ảnh – Định dạng : jpg, png, bmp, tiff, – Kích thước lưu trữ : phụ thuộc vào kích thước ảnh, độ phân giải, kỹ thuật nén (nếu có). 1 bit / 1 pixel (ảnh nhị phân) 8 bits/ 1pixel (ảnh đa mức xám) 24 bits / 1pixel (ảnh màu) – Ảnh thường được nén để giảm không gian lưu trữ 18
- Ảnh màu -Mỗi điểm ảnh có 3 thành phần màu: R, G, B -1 ảnh số = 3 ma trận giá trị số để biểu diễn cường độ R, G, B tương ứng 20 - Ngoài RGB còn có các hệ tọa độ màu khác: YUV, HSV
- Kỹ thuật nén Dựa trên: – dư thừa trong ảnh (lặp giá trị) – dư thừa theo khả năng nhận thức (nhìn thấy) của con người Ví dụ: 2 điểm lân cận ở 2 hàng liền nhau thì có giá trị gần giống nhau mà con người khó phân biệt – với các mẫu khác nhau, độ nhạy cảm về nhận thức là khác nhau Mục tiêu: – Giữ lại các thông tin quan trọng và loại bỏ các TT khác 22
- 5. Video số 24
- Frame rate – Đủ lớn để thấy truyền tải sự chuyển động liên tục (>= 25 frames/s) – Băng thông để truyền tải tín hiệu: frame rate càng lớn thì băng thông phải lớn ( thỏa hiệp: frame rate: 25 frames/s) – Tốc độ làm tươi màn hình hiển thị (>=50 lần /s) Giải pháp cho hệ thống tivi: 2:1 interlace 26