
Nâng cao chất lượng ảnh trong miền không gian
Thông tin tài liệu
Tác giả | Nguyễ n Thanh Giang |
Trường học | Viện Công nghệ thông tin, Viện Hàn Lâm Khoa học và Công nghệ Việt Nam |
Chuyên ngành | Công Nghệ Thông Tin |
Loại tài liệu | đồ án tốt nghiệp |
Ngôn ngữ | Vietnamese |
Số trang | 58 |
Định dạng | |
Dung lượng | 11.39 MB |
Tóm tắt
I.Lời mở đầu
Xử lý ảnh đóng vai trò quan trọng trong nhiều ngành nghề. Bài toán tiền xử lý ảnh, cụ thể là tăng cường chất lượng ảnh là một công đoạn thiết yếu để loại bỏ nhiễu và khắc phục khiếm khuyết trong quá trình thu nhận ảnh. Đồ án này tập trung nghiên cứu về các phương pháp nâng cao chất lượng ảnh dựa trên kỹ thuật lọc không gian.
1.1.2.1. Biểu diễn ảnh
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel. Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Một số mô hình được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê.
1.1.2.2. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng vân tay, nhận dạng chữ viết… Có bốn cách tiếp cận khác nhau: nhận dạng dựa trên đặc điểm, nhận dạng dựa trên thu thập, phân tích số liệu, nhận dạng dựa trên cấu trúc và nhận dạng dựa trên kiến thức.
1.1.2.3. Cải thiện ảnh
Khâu cải thiện ảnh có ba thao tác cơ bản là: lọc nhiễu, phục hồi ảnh và nâng cấp ảnh. Trong phần nâng cấp ảnh có ba phép toán cơ bản: phép toán làm trơn, phép toán tách cạnh và phép toán kết hợp.
1.1.2.4. Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó cần phải giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết. Nén ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
1.1.2.5. Điều chỉnh giá trị ảnh
Việc lấy âm bản của bức ảnh sẽ cho ra một phiên bản ảnh âm bản tương tự.
Kiểu xử lý này đặc biệt thích hợp cho việc tăng cường các chi tiết sáng hoặc xám mà được bao quanh bởi vùng tối của bức ảnh, nhất là khi vùng tối trong bức ảnh chiếm chủ yếu.
1.1.2.6. Chuyển đổi Logarit
Công thức tổng quát chuyển đổi logarit (hình 2.4) như sau: s = c log(1+r) Trong đó, c là hằng số và r>=0. Đường cong log trong hình 2.3 cho thấy biến đổi này ánh xạ dải hẹp của những giá trị mức xám thấp trong hình ảnh đầu vào thành dải rộng hơn ở đầu ra. Chúng ta có thể sử dụng loại chuyển đổi này để mở rộng những giá trị của điểm tối trong bức ảnh trong khi nén những giá trị mức cao hơn. Điều ngược lại cũng đúng với hàm ngược của hàm log.
1.1.2.7. Chuyển đổi lũy thừa
Chuyển đổi lũy thừa có công thức cơ bản là : s=cr y (2.2-3), trong đó c và y là hằng số dương. Nhiều khi công thức (2.2-3) được viết: s=c(r+ԑ) y để thêm vào phần bù mà có nó là đầu ra có thể được thể hiện khi đầu vào bằng 0. Nhưng phần bù thường là rất nhỏ và được bỏ qua trong công thức 2.2-2. Hình 2.6 là đồ thị của s và r khi y biến thiên. Như trong trường hợp hàm biến đổi logarit, các đường cong quy luật lũy thừa với các các giá trị y rời rạc chuyển đổi một dải hẹp giá trị đầu vào sang dải rộng hơn. Và ngược lại cũng đúng với các giá trị đầu vào cao hơn. Nhưng không giống như hàm logarit, chúng ta thấy ở đây là một tập hợp các đường cong chuyển đổi được lược diễn biến biến thiên. Những đường cong được tạo với giá trị y>1 thì cũng được tạo ra bởi chiều ngược lại với y<1. Cuối cùng, với c=y=1, thì công thức được lược diễn như một đường thẳng đồng nhất.
1.1.2.8. Cắt theo mức xám
Có nhiều phương pháp cắt lát mức xám, nhưng đều dựa trên 2 nền tảng cơ bản: Một là hiển thị một giá trị cao và một giá trị thấp của tất cả các mức xám trong dải, Hai là dựa trên hàm biến đổi hình 2.11b,làm sáng dải mong muốn của mức xám nhưng giữ nguyên phần nền và sắc xám của ảnh.
II.Tổng quan về xử lý ảnh
Ảnh gồm các điểm ảnh với các giá trị độ sáng khác nhau. Ảnh số được biểu diễn dưới dạng mảng hai chiều. Mỗi điểm ảnh được biểu diễn bởi 1, 4, 8, 24 hoặc 32 bit tùy thuộc vào mức xám của ảnh.
1.1.2.1. Biểu diễn ảnh
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel. Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Một số mô hình được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê.
1.1.2.2. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng vân tay, nhận dạng chữ viết… Có bốn cách tiếp cận khác nhau:
1.1.2.3. Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó cần phải giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết. Nén ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
III.Định dạng ảnh
Ảnh có thể là ảnh nhị phân, ảnh xám, ảnh màu. Ảnh nhị phân có giá trị xám là 0 hoặc 1. Ảnh xám có giá trị xám từ 0 đến 255. Ảnh màu là sự kết hợp của ba màu cơ bản đỏ, lục, lam.
1.1.2.2 Biểu diễn ảnh
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel. Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Một số mô hình được dùng trong biểu diễn ảnh: mô hình toán, mô hình thống kê.
1.1.2.5 Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng vân tay, nhận dạng chữ viết… Có bốn cách tiếp cận khác nhau:
1.1.2.6 Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng mà lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó cần phải giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần thiết. Nén ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
IV.Biểu diễn ảnh
Ảnh có thể được biểu diễn bằng các mô hình khác nhau: mô hình toán, mô hình thống kê. Mô hình pixel là mô hình thường dùng trong biểu diễn ảnh, với mỗi pixel được coi là một phần tử đặc trưng của ảnh.
1.1.2.2. Biểu diễn ảnh
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh là pixel. Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Một số mô hình được dùng trong biểu diễn ảnh:
- Mô hình toán
- Mô hình thống kê
V.Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến việc mô tả các đối tượng trong ảnh. Có bốn cách tiếp cận khác nhau để nhận dạng ảnh: theo đặc điểm, theo vùng, theo đồ thị và theo ngữ cảnh.
1.1.2.5. Nhận dạng ảnh
- Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó.
- Người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng vân tay, nhận dạng chữ viết…
- Có bốn cách tiếp cận khác nhau:
- Tiếp cận thống kê
- Tiếp cận cấu trúc
- Tiếp cận gắn nhãn
- Tiếp cận nội dung
VI.Điều chỉnh ảnh
Một số phép biến đổi thường được sử dụng trong xử lý ảnh bao gồm: đảo âm, chuyển đổi Logarit, chuyển đổi lũy thừa, cắt theo mức xám, điều chỉnh gamma, điều chỉnh lược đồ.
1. Phép toán làm trơn
Trong chương 2 phần Điều chỉnh ảnh, tác giả trình bày phương pháp điều chỉnh toàn bộ ảnh và điều chỉnh biểu đồ phân phối mức xám. Ngoài ra, tác giả còn đề cập đến các phép toán làm trơn, kết hợp các phép toán làm trơn với các phép toán tăng cường độ sắc nét.
2. Phép toán tách cạnh
Trong phần này, tác giả trình bày các phương pháp dùng toán tử vi phân để tách cạnh trong ảnh.
3. Các phép toán tương quan
Trong phần này, tác giả trình bày phương pháp sử dụng phép toán tương quan để xử lý ảnh, giúp giảm nhiễu, làm mịn ảnh.
4. Các phép toán cuộn
Trong phần này, tác giả trình bày phương pháp sử dụng phép toán cuộn để xử lý ảnh, giúp loại bỏ nhiễu, tăng độ nét cho ảnh.
5. Phép toán dựa trên láng giềng
Trong phần này, tác giả trình bày phương pháp xử lý ảnh dựa trên phép toán láng giềng, giúp tăng cường độ nét, làm mịn ảnh, loại bỏ nhiễu.
6. Lọc không gian
Trong phần này, tác giả trình bày phương pháp lọc không gian để xử lý ảnh, giúp giảm nhiễu, làm mịn ảnh, tăng độ nét cho ảnh.
VII.Lọc nhiễu trong miền không gian
Các phép toán lọc nhiễu trong miền không gian sử dụng thông tin từ các điểm ảnh lân cận để thay thế giá trị của điểm ảnh hiện tại. Một số phép toán lọc thường dùng như: lọc trung bình, lọc trung bình có trọng số, lọc theo phương sai cục bộ, lọc theo giá trị trung bình.
2.2.5. Điều chỉnh lược đồ
Chương này giải thích cách điều chỉnh lược đồ ảnh sử dụng hàm biến đổi thống kê. Sau khi thảo luận về định nghĩa toán học, chương này cung cấp một ví dụ để áp dụng và kiểm chứng hiệu quả của phương pháp.
VIII.Chương trình thử nghiệm
Đồ án đã xây dựng một chương trình thử nghiệm trên MATLAB để khử nhiễu ảnh bằng toán tử số học, đạt được kết quả khả quan trong việc loại bỏ nhiễu và cải thiện chất lượng ảnh.
IX.Kết luận và hướng nghiên cứu
Đồ án đã hoàn thành mục tiêu nghiên cứu về phương pháp nâng cao chất lượng ảnh dựa trên kỹ thuật lọc không gian. Trong thời gian tới, cần tiếp tục nghiên cứu để hoàn thiện chương trình xử lý ảnh, áp dụng thêm nhiều kỹ thuật lọc nâng cao khác để đạt được hiệu suất tốt hơn.
1. Kết quả đã đạt được
- Các phép toán tăng cường độ sắc nét của ảnh: đạo hàm bậc nhất, bậc hai và kết hợp
- Viết được chương trình thử nghiệm
2. Hướng nghiên cứu trong tương lai
- Hoàn thiện chương trình xử lý ảnh để trở nên toàn diện hơn