BÁO CÁO KHOA HỌC

Giấu thông tin ảnh JPEG2000

Thông tin tài liệu

Tác giả

Phạm Thị Quỳnh

instructor Ths. Hồ Thị Hương Thơm
Trường học

Trường Đại Học Dân Lập Hải Phòng

Chuyên ngành Công Nghệ Thông Tin
Loại tài liệu Báo cáo khoa học
Ngôn ngữ Vietnamese
Định dạng | PDF
Dung lượng 1.15 MB

Tóm tắt

I.Kỹ thuật Giấu Thông Tin trong Ảnh và Thuỷ Vân Kỹ Thuật Số

Bài báo nghiên cứu các phương pháp giấu thông tin trong ảnh, tập trung vào kỹ thuật thuỷ vân kỹ thuật số. Ứng dụng quan trọng của giấu thông tin trong ảnh bao gồm xác thực thông tin, bảo vệ bản quyền, và tăng cường bảo mật. Bài báo nhấn mạnh vào việc tận dụng các ưu điểm của chuẩn nén ảnh JPEG2000biến đổi Wavelet (DWT) để thực hiện giấu thông tin một cách hiệu quả và bền vững.

1. Tổng quan về Giấu thông tin trong ảnh và Thuỷ vân kỹ thuật số

Phần này làm rõ tầm quan trọng ngày càng tăng của việc giấu thông tin trong ảnh, đặc biệt là trong thời đại số với lượng thông tin khổng lồ được trao đổi qua hình ảnh. Giấu thông tin trong ảnh đóng vai trò cốt yếu trong nhiều ứng dụng bảo mật thông tin, như nhận thực, xác định thông tin bị xuyên tạc, và bảo vệ bản quyền tác giả. Mục tiêu chính là làm cho thông tin trở nên vô hình, khó phát hiện ngay cả khi được nhúng vào dữ liệu ảnh mà chất lượng hình ảnh không thay đổi đáng kể. Sự phổ biến của ảnh số đã thúc đẩy việc ứng dụng rộng rãi kỹ thuật này trong nhiều lĩnh vực của đời sống. Tuy nhiên, sự phát triển của công nghệ kỹ thuật số cũng đồng thời tạo ra thách thức trong việc bảo vệ thông tin khỏi nguy cơ sử dụng trái phép và xuyên tạc thông tin trên mạng. Việc đảm bảo sử dụng dữ liệu đa phương tiện một cách an toàn và công bằng, cùng với việc cung cấp kịp thời cho người dùng cuối, là những vấn đề quan trọng cần được giải quyết. Kỹ thuật giấu thông tin bí mật (Steganography) được đề cập, tập trung vào việc giấu được nhiều thông tin nhất có thể mà không bị phát hiện. Các phương tiện chứa thông tin có thể là ảnh, văn bản hoặc âm thanh. Giấu thông tin trong ảnh được xem là phương pháp được quan tâm nhiều nhất do lượng thông tin trao đổi bằng ảnh rất lớn. Kỹ thuật giấu thông tin trong âm thanh lại phụ thuộc vào hệ thống thính giác của con người (HAS), khác với hệ thống thị giác (HSV) trong giấu thông tin trong ảnh. Giấu thông tin trong văn bản khó hơn do lượng thông tin dư thừa ít, cần khai thác khéo léo các đặc điểm tự nhiên của ngôn ngữ hoặc định dạng văn bản.

2. Ứng dụng của Thuỷ vân kỹ thuật số trong bảo vệ bản quyền và xác thực

Giấu thông tin dưới dạng thuỷ vân có những yêu cầu khác biệt so với giấu thông tin bí mật, đặc biệt là trong việc bảo vệ bản quyền và xác thực. Thuỷ vân cần đủ bền vững để chống lại các tấn công cố ý gỡ bỏ hoặc vô hình, đồng thời phải có ảnh hưởng tối thiểu đến chất lượng phương tiện chứa. Vì vậy, thông tin cần giấu càng nhỏ càng tốt. Kỹ thuật thuỷ vân mờ được chú ý vì không cần ảnh gốc vẫn có thể lấy được thuỷ vân. Các kỹ thuật thuỷ vân được phân loại thành hai nhóm chính: kỹ thuật vùng không gian (nhúng tin vào các bit ít quan trọng nhất - LSB) và kỹ thuật vùng tần số (như sử dụng biến đổi Wavelet). Một kỹ thuật thuỷ vân tốt cần đáp ứng các yêu cầu về tính an toàn (security), tức là chỉ những tổ chức có quyền mới có thể truy cập được thuỷ vân, ngay cả khi thuật toán được công bố rộng rãi. Việc sử dụng một khóa bí mật là cần thiết để bảo vệ thuỷ vân. Kỹ thuật biến đổi Wavelet (DWT) được đánh giá cao hơn DCT (Discrete Cosine Transform) vì DWT thao tác trên toàn bộ ảnh, tách ảnh thành các dải tần số khác nhau mà vẫn giữ được thông tin không gian, giúp cân bằng tốt giữa tính bền vững và vô hình của thuỷ vân. Các yêu cầu của một kỹ thuật thuỷ vân tốt bao gồm tính an toàn: chỉ những tổ chức có quyền mới có thể truy cập được thông tin, dù thuật toán được công khai. Khóa bí mật là yếu tố cần thiết cho việc này.

II.Nén Ảnh JPEG2000 và Biến Đổi Wavelet

Phần này trình bày chi tiết về chuẩn nén ảnh JPEG2000, đặc biệt là vai trò của biến đổi Wavelet trong quá trình nén. JPEG2000 cung cấp cả hai kỹ thuật nén có tổn thất và không tổn thất, với khả năng đạt tỉ lệ nén cao hơn nhiều so với JPEG truyền thống. Biến đổi Wavelet cho phép phân tích ảnh thành các dải tần số khác nhau, tạo điều kiện thuận lợi cho việc giấu thông tin trong các dải tần số cụ thể mà không làm giảm đáng kể chất lượng ảnh. Các thuật toán mã hoá như SPIHT và EZW được đề cập đến trong quá trình nén.

1. Chuẩn nén ảnh JPEG2000 Ưu điểm và cơ chế hoạt động

Phần này tập trung vào việc phân tích chuẩn nén ảnh JPEG2000, nổi bật là khả năng thực hiện cả hai kỹ thuật nén có tổn thất và không tổn thất thông tin dựa trên cùng một cơ chế mã hóa. Điều này làm cho JPEG2000 linh hoạt hơn so với JPEG truyền thống. Một ưu điểm vượt trội của JPEG2000 là khả năng đạt được tỉ lệ nén cao hơn nhiều so với JPEG (có thể lên tới 200:1 so với 41:1 của JPEG), đồng thời vẫn đảm bảo chất lượng ảnh tốt hơn, đặc biệt là khi cùng một tỉ lệ nén. JPEG2000 còn cho phép hiển thị ảnh ở độ phân giải và kích thước khác nhau từ cùng một ảnh nén, một tính năng không có ở JPEG. Kỹ thuật phân giải ảnh và mã hóa đính kèm trong JPEG2000 giúp đạt được điều này, cho phép người dùng quyết định chất lượng ảnh trong quá trình giải nén. JPEG2000 cũng sở hữu tính năng mã hóa ảnh quan trọng theo vùng (ROI - Region of Interest), một ưu thế lớn so với các chuẩn nén ảnh khác. Khả năng khôi phục lỗi vượt trội của JPEG2000 cũng được nhấn mạnh, giúp giảm thiểu ảnh hưởng của nhiễu trong quá trình truyền tải dữ liệu trên mạng. JPEG2000 sử dụng biến đổi Wavelet (DWT) thay vì DCT (Discrete Cosine Transform) vì DWT thao tác trên toàn bộ ảnh, tách ảnh thành các dải tần số khác nhau mà vẫn giữ được thông tin không gian, giúp cho việc xử lý và nén ảnh hiệu quả hơn. Các bước thực hiện nén ảnh theo chuẩn JPEG2000 được mô tả bao gồm: xử lý trước khi biến đổi, biến đổi liên thành phần (RCT và ICT), biến đổi riêng thành phần (biến đổi Wavelet), lượng tử hóa, mã hóa và kết hợp dòng dữ liệu sau mã hóa. Các phương pháp mã hóa SPIHT và EZW được đề cập như những phương pháp cơ sở và được áp dụng nhiều nhất trong JPEG2000.

2. Biến đổi Wavelet DWT trong JPEG2000 Nguyên lý và ứng dụng

Phần này tập trung vào vai trò của biến đổi Wavelet (DWT) trong chuẩn nén ảnh JPEG2000. DWT được sử dụng để phân tích ảnh thành các dải tần số khác nhau, giúp loại bỏ tính tương quan giữa các thành phần của ảnh và tăng hiệu quả nén. JPEG2000 áp dụng cả biến đổi Wavelet nguyên thuận nghịch 5/3 (IWT) và biến đổi thực không thuận nghịch Daubechies 9/7, với việc tính toán biến đổi được thực hiện theo phương pháp Lifting. DWT cho phép phân tích ảnh thành các dải tần số: thấp-thấp (LL), thấp-cao (LH), cao-thấp (HL), và cao-cao (HH). Việc phân tích này có thể được thực hiện nhiều lần để đạt được các hệ số Wavelet nhỏ hơn. Từ các hệ số DWT, ảnh gốc có thể được xây dựng lại thông qua quá trình đảo ngược DWT (IDWT). DWT được cho là có ưu điểm hơn DCT vì nó thao tác trên toàn bộ ảnh, giúp duy trì tính liên tục của thông tin và cân bằng tốt giữa tính bền vững và vô hình của thuỷ vân khi được áp dụng trong kỹ thuật giấu thông tin. Trong JPEG2000, việc lựa chọn các phương pháp mã hóa khác nhau (như SPIHT và EZW) cùng với các biến đổi Wavelet khác nhau cho phép điều chỉnh chất lượng ảnh cho phù hợp với ứng dụng. Phương pháp SPIHT được thiết kế tối ưu cho truyền dẫn lũy tiến, cho phép chất lượng ảnh hiển thị tốt nhất tại mỗi thời điểm với số lượng bit đã nhận được. Kỹ thuật embedded coding trong SPIHT cho phép giải nén ra nhiều mức chất lượng khác nhau từ cùng một dữ liệu nén.

III. Giấu Thông Tin trên Miền Biến Đổi Wavelet DWT Thuật toán Thuỷ Vân

Bài báo đề xuất các thuật toán giấu thông tin (thuỷ vân) trên miền biến đổi Wavelet, tập trung vào các dải tần số trung gian (HL và LH). Các thuật toán này tận dụng mối tương quan giữa các hệ số Wavelet để nhúng thông tin một cách kín đáo và bền vững. Được đề xuất là hai thuật toán: thuật toán gốc và thuật toán cải tiến, thuật toán cải tiến có tính bảo mật cao hơn bằng cách mã hóa thông điệp trước khi nhúng và sử dụng một ngưỡng (Mark) để xác định vị trí nhúng. Hiệu quả của các thuật toán được đánh giá thông qua PSNR (Peak Signal-to-Noise Ratio).

1. Thuật toán nhúng và tách thuỷ vân trong miền biến đổi Wavelet DWT

Phần này trình bày chi tiết về việc ứng dụng biến đổi Wavelet (DWT) để thực hiện kỹ thuật giấu thông tin, cụ thể là nhúng thuỷ vân vào ảnh. DWT cho phép phân tích ảnh thành các dải tần số khác nhau: LL (thấp-thấp), LH (thấp-cao), HL (cao-thấp), và HH (cao-cao). Việc lựa chọn dải tần số để nhúng thuỷ vân ảnh hưởng đến tính bền vững và độ vô hình của thuỷ vân. Nhúng vào dải LL đảm bảo tính bền vững nhưng có thể làm giảm chất lượng ảnh, trong khi nhúng vào dải HH dễ bị phát hiện. Do đó, các dải tần số trung gian HL và LH thường được ưu tiên sử dụng vì chúng cân bằng giữa hai yếu tố trên. Một thuật toán nhúng và tách thuỷ vân được giới thiệu, dựa trên việc lượng tử hoá các hệ số Wavelet trong các dải tần số trung gian. Thuật toán này sử dụng một hệ số trong cặp tần số giữa để lượng tử hoá hệ số còn lại, với bước lượng tử hoá là phần cố định của hệ số lớn hơn. 1/3 các giá trị lớn nhất của tất cả các hệ số được chọn là các hệ số quan trọng để thực hiện lượng tử hoá. Đối với các hệ số nhỏ, một bước Step duy nhất được sử dụng. Tuy nhiên, thuật toán này chỉ phù hợp với kỹ thuật nhúng thuỷ vân trên miền biến đổi DWT trước khi nén JPEG2000. Khi tách thuỷ vân trong quá trình giải nén JPEG2000, thuỷ vân được tách không đúng với thuỷ vân ban đầu do các hệ số DWT bị thay đổi trong quá trình nén và làm tròn. Sự thay đổi của cặp tần số giữa dưới các tấn công khác nhau, ví dụ làm mờ ảnh hay làm nét ảnh, cũng được phân tích để đánh giá sự bền vững của thuật toán.

2. Thuật toán nhúng và tách thuỷ vân cải tiến

Nhằm khắc phục nhược điểm của thuật toán gốc, một thuật toán nhúng và tách thuỷ vân cải tiến được đề xuất. Thuật toán này tăng cường tính bảo mật bằng cách mã hoá thuỷ vân (dạng chuỗi nhị phân) bằng một khóa KEY trước khi nhúng. Thuỷ vân được nhúng vào miền tần số giữa HL2 và LH2 của các hệ số DWT đã được lượng tử hoá bởi quá trình nén JPEG2000, dựa trên một ngưỡng Mark. Ngưỡng Mark được chọn thuộc miền giá trị của các hệ số DWT trên miền HL2 và LH2 sau khi đã được lượng tử hoá. Việc lựa chọn giá trị Mark phù hợp là rất quan trọng để tránh mất mát thông tin thuỷ vân trong quá trình nén. Kỹ thuật nhúng thuỷ vân bao gồm: chuyển đổi văn bản thuỷ vân thành dãy nhị phân, mã hoá bằng khóa KEY, và nhúng vào các hệ số DWT dựa trên ngưỡng Mark. Nếu bit thuỷ vân bằng 1, hệ số được đặt bằng Mark; nếu không, nó được giữ nguyên. Kỹ thuật tách thuỷ vân dựa trên việc phân tích các hệ số DWT sau khi giải nén JPEG2000 và so sánh với ngưỡng Mark, kết hợp với việc giải mã bằng khóa KEY để khôi phục thông điệp ban đầu. Tính bảo mật được nâng cao nhờ vào việc mã hoá bằng khóa KEY và việc lựa chọn ngưỡng Mark nằm trong miền giá trị của 1/3 các hệ số DWT lớn nhất, khiến việc tấn công trở nên khó khăn hơn.

3. Phân tích và đánh giá hiệu quả của thuật toán

Hiệu quả của thuật toán thuỷ vân cải tiến được đánh giá thông qua việc giấu thông điệp vào một tập ảnh thử nghiệm và đo lường PSNR (Peak Signal-to-Noise Ratio). Với Mark=3.0, PSNR trung bình đạt được trên 100 ảnh là 40.53528 dB, lớn hơn mức quy định 40 dB, cho thấy thuỷ vân được nhúng một cách vô hình đối với mắt người. Tuy nhiên, ảnh có độ nhiễu lớn có thể dẫn đến mất mát thông tin thuỷ vân do giá trị các hệ số DWT bị thay đổi trong quá trình nén ảnh JPEG2000, khiến giá trị ngưỡng Mark bị mất. Việc chọn giá trị Mark cao hơn giúp tăng độ chính xác của việc khôi phục thông tin nhưng lại làm tăng nhiễu và giảm PSNR. Do đó, việc lựa chọn Mark cần cân bằng giữa độ chính xác và tính vô hình của thuỷ vân. Ba phương pháp phân tích để phát hiện giấu tin được đề cập: phân tích trực quan (dựa trên quan sát và biểu đồ histogram), phân tích thống kê (phát hiện sự khác biệt về phân bố thống kê giữa ảnh gốc và ảnh đã giấu tin) và phân tích dựa trên thuật toán giấu tin (phân tích dựa trên thuật toán đã được sử dụng để giấu tin). Tính bảo mật của thuật toán được nhấn mạnh, với việc người tấn công cần phải biết ngưỡng Mark và khóa KEY để khôi phục thông tin, làm tăng độ phức tạp của việc tấn công.

IV.Phân Tích và Bảo Mật của Kỹ Thuật Giấu Thông Tin

Phần này thảo luận về các phương pháp phân tích nhằm phát hiện sự hiện diện của thông tin đã được giấu, bao gồm phân tích trực quan và các phương pháp phức tạp hơn. Bài báo cũng nhấn mạnh vào các biện pháp bảo mật được áp dụng trong các thuật toán thuỷ vân được đề xuất, bao gồm việc sử dụng khóa mã hoá (KEY) để bảo vệ thông tin. Các thách thức về bảo mật và các chiến lược chống tấn công được đề cập.

1. Các phương pháp phân tích giấu tin

Bài báo đề cập đến ba nhóm phương pháp phân tích để phát hiện thông tin giấu trong ảnh: Phân tích trực quan, dựa trên quan sát trực tiếp hoặc sử dụng biểu đồ histogram để so sánh ảnh gốc và ảnh đã giấu tin. Phương pháp này có hạn chế khi gặp ảnh có độ nhiễu cao và kích thước lớn. Phân tích thống kê, tập trung vào việc phát hiện sự khác biệt về phân bố thống kê giữa ảnh gốc và ảnh đã giấu tin. Và cuối cùng là phân tích dựa trên thuật toán giấu tin, đòi hỏi người phân tích phải hiểu rõ thuật toán đã được sử dụng để giấu thông tin. Phương pháp này hiệu quả hơn nhưng phức tạp hơn hai phương pháp còn lại. Mỗi phương pháp có ưu điểm và nhược điểm riêng, cần được lựa chọn phù hợp với từng trường hợp cụ thể. Hiệu quả của các phương pháp phụ thuộc vào nhiều yếu tố như độ phức tạp của thuật toán giấu tin, mức độ nhiễu trong ảnh, và khả năng của người phân tích. Tóm lại, việc phát hiện giấu tin là một vấn đề phức tạp và đòi hỏi sự kết hợp nhiều kỹ thuật phân tích khác nhau để đạt hiệu quả cao.

2. Bảo mật của thuật toán giấu thông tin

Bài báo nhấn mạnh vào vấn đề bảo mật của kỹ thuật giấu thông tin, đặc biệt là trong việc bảo vệ thông tin nhúng tránh bị phát hiện. Đối với thuật toán thuỷ vân cải tiến, tính bảo mật được tăng cường bằng hai lớp bảo vệ: thứ nhất, việc sử dụng một khóa KEY để mã hóa thông điệp trước khi nhúng, tăng độ phức tạp cho kẻ tấn công. Khóa KEY là một chuỗi nhị phân có độ dài tương tự như thông điệp, yêu cầu kẻ tấn công phải thử 2n lần (với n là độ dài thông điệp) để tìm ra khóa đúng. Thứ hai, việc sử dụng ngưỡng Mark, nằm trong miền giá trị của 1/3 các hệ số DWT lớn nhất, làm cho việc xác định vị trí thông tin giấu trở nên khó khăn hơn. Kẻ tấn công cần phải biết hệ số Mark và sau đó giải mã thông tin bằng khóa KEY để khôi phục được thông điệp gốc. Việc lựa chọn giá trị Mark cũng ảnh hưởng đến hiệu quả của thuật toán, cần chọn giá trị Mark sao cho vừa đảm bảo tính vô hình của thuỷ vân, vừa tránh bị mất thông tin trong quá trình nén ảnh JPEG2000. Tổng hợp lại, tính bảo mật của thuật toán phụ thuộc vào độ phức tạp của thuật toán, độ dài của khóa KEY và việc chọn lựa ngưỡng Mark một cách khéo léo.