
Giấu tin CPT trên ảnh nhị phân
Thông tin tài liệu
Tác giả | Nguyễn Tất Trung |
instructor | PTS. Hồ Thị Hương Thơm |
Trường học | Trường Đại Học Dầu Khí Hải Phòng |
Chuyên ngành | Tin học |
Loại tài liệu | Báo cáo tốt nghiệp |
Địa điểm | Hải Phòng |
Ngôn ngữ | Vietnamese |
Định dạng | |
Dung lượng | 1.62 MB |
Tóm tắt
I.Kỹ thuật Giấu tin CPT trên Ảnh Nhị phân Tổng quan
Đồ án nghiên cứu kỹ thuật giấu tin CPT (Chen-Pan-Tseng) ứng dụng trên ảnh nhị phân. Kỹ thuật giấu tin CPT cải tiến từ thuật toán Wu-Lee, cho phép giấu tin với độ an toàn cao hơn bằng cách sử dụng ma trận khóa K và ma trận trọng số W. Mục tiêu là tối đa hóa lượng thông tin được giấu trong khi chỉ thay đổi tối đa 2 bit trong khối ảnh nhị phân, đảm bảo tính vô hình (không dễ phát hiện bằng mắt thường). Hiệu quả giấu tin được đánh giá bằng chỉ số PSNR. Nguyễn Tất Trung (CT1201), sinh viên trường Đại học Dệt may Hải Phòng, là tác giả của đồ án này, hướng dẫn bởi Tiến sĩ Hồ Thị Hương Thơm.
1. Giới thiệu về Kỹ thuật Giấu tin và Ảnh Nhị phân
Phần này đặt ra bối cảnh cho đồ án, nhấn mạnh tầm quan trọng của việc bảo mật dữ liệu trong kỷ nguyên số. Nó giới thiệu khái niệm giấu tin mật (steganography) như một giải pháp để bảo vệ thông tin nhạy cảm bằng cách ẩn chúng trong các nguồn thông tin khác. Đồ án tập trung vào kỹ thuật giấu tin CPT trên ảnh nhị phân, một phương pháp được cho là hiệu quả hơn các phương pháp trước đó. Các ứng dụng của kỹ thuật giấu tin được đề cập đến, bao gồm bảo vệ bản quyền tài liệu số hóa, giấu thông tin bí mật quân sự và kinh tế. Sự phát triển của công nghệ thông tin đã tạo ra nhiều môi trường giấu tin mới, đa dạng và thuận lợi hơn, như văn bản, hình ảnh, âm thanh, đĩa cứng, đĩa mềm và cả các gói tin truyền trên mạng. Đồ án cũng đề cập đến thủy vân số (watermarking) như một kỹ thuật liên quan, phân biệt giữa thủy vân bền vững (robust watermarking) và thủy vân dễ vỡ, nhấn mạnh vai trò của thủy vân bền vững trong bảo vệ bản quyền. Cuối cùng, phần này giới thiệu sơ đồ phân loại các kỹ thuật giấu tin, bao gồm cả giấu tin mật (steganography) và thủy vân số (watermarking), làm nổi bật sự khác biệt giữa hai phương pháp này, đặc biệt là mục tiêu và cách thức hoạt động của chúng.
2. Mô hình Giấu tin và Tách tin Cơ bản
Phần này trình bày mô hình cơ bản của hệ thống giấu tin và tách tin trong ảnh số. Các thành phần chính được xác định bao gồm bản tin mật (có thể là văn bản, ảnh, hoặc bất kỳ tệp nhị phân nào), khả năng nhúng (lượng thông tin có thể được nhúng), và khả năng chống dò tìm (khả năng tránh bị phát hiện bằng các kỹ thuật thống kê thông thường). Ba yêu cầu thiết yếu của một hệ thống giấu tin mật được nêu rõ: tính vô hình (không thể phát hiện bằng mắt thường), khả năng nhúng nhiều thông tin, và khả năng chống dò tìm. Mô hình này miêu tả quá trình giấu tin cơ bản: thông tin được giấu vào phương tiện chứa (text, audio, video, ảnh) bằng một bộ nhúng sử dụng khóa bí mật. Quá trình tách tin sử dụng bộ tách tin và khóa tương ứng để lấy lại thông tin ban đầu. Phần này cũng đề cập đến các môi trường giấu tin phổ biến như ảnh, âm thanh, video và văn bản, nhấn mạnh vào việc giấu tin trong ảnh do tính phổ biến và vai trò quan trọng của nó trong bảo vệ an toàn thông tin, ví dụ như số hóa chữ ký và lưu trữ trong tài chính ngân hàng.
3. Giấu tin trong Ảnh Ứng dụng và Thách thức
Phần này tập trung vào việc giấu tin trong ảnh, đặc biệt là ảnh số, nhấn mạnh vai trò của nó trong các ứng dụng bảo vệ an toàn thông tin như xác định xuyên tạc thông tin và bảo vệ quyền tác giả. Việc giấu thông tin trong ảnh phải đảm bảo chất lượng ảnh không bị ảnh hưởng đáng kể. Các ứng dụng cụ thể được đề cập đến, bao gồm việc sử dụng chữ ký số hóa trong các dịch vụ ngân hàng và chức năng lưu trữ chữ ký trong ảnh nhị phân của phần mềm WinWord. Đồ án cũng giải thích quá trình tách tin, bao gồm việc sử dụng bộ tách tin và khóa để lấy lại thông tin đã giấu, và việc kiểm định, so sánh thông tin thu được với thông tin ban đầu. Phần này cũng so sánh việc giấu tin trong ảnh, âm thanh và video, nhấn mạnh sự khác biệt trong việc phụ thuộc vào hệ thống thị giác (HSV) và hệ thống thính giác (HAS) của con người. Khó khăn trong việc giấu tin trong âm thanh do dải tần rộng và công suất lớn của tín hiệu âm thanh cũng được đề cập. Cuối cùng, phần này đề cập đến việc giấu tin trong văn bản text, nhấn mạnh vào độ khó do ít thông tin dư thừa và các phương pháp khai thác thông tin dư thừa tự nhiên của ngôn ngữ hoặc định dạng văn bản.
4. Ảnh Nhị phân và Phương pháp Đánh giá PSNR
Phần này định nghĩa ảnh nhị phân là ảnh kỹ thuật số chỉ có hai giá trị (thường là đen và trắng) cho mỗi pixel. Cấu trúc của tệp ảnh bitmap (BMP), một định dạng phổ biến cho ảnh nhị phân, được mô tả bao gồm BITMAPFILEHEADER và BITMAPINFOHEADER. Phần này cũng giới thiệu phương pháp đánh giá PSNR (Peak Signal-to-Noise Ratio) để đánh giá chất lượng ảnh trước và sau khi giấu tin. PSNR được đo bằng đơn vị decibel (dB), giá trị PSNR cao cho thấy độ nhiễu thấp và chất lượng ảnh tốt. Giá trị PSNR tốt thường ở khoảng 35dB trở lên, trong khi giá trị nhỏ hơn 20dB là không chấp nhận được. PSNR được sử dụng rộng rãi trong kỹ thuật đánh giá chất lượng hình ảnh và video. Sự đơn giản và phổ biến của định dạng BMP trong các hệ điều hành khác nhau cũng được nêu ra, làm cho nó trở thành một định dạng hình ảnh rất phổ biến.
II.Phương pháp Giấu tin CPT Cơ chế hoạt động
Kỹ thuật giấu tin CPT chia ảnh nhị phân thành các khối nhỏ (m x n). Mỗi khối được sử dụng để giấu một lượng bit dữ liệu (r bit) thông qua việc tính toán dựa trên ma trận khóa K và ma trận trọng số W. Việc lựa chọn ma trận K và W ảnh hưởng đến độ an toàn và hiệu quả của phương pháp giấu tin. Quá trình tách tin được thực hiện tương tự, sử dụng cùng ma trận K và W.
1. Quá trình Giấu tin CPT
Phương pháp giấu tin CPT hoạt động trên ảnh nhị phân bằng cách chia ảnh thành các khối nhỏ có kích thước m x n. Mỗi khối này sẽ được sử dụng để giấu một lượng bit dữ liệu, tối đa là r = log₂(mn+1) bit. Điều quan trọng là kỹ thuật CPT chỉ thay đổi tối đa 2 bit trong mỗi khối ảnh để đảm bảo tính vô hình, tức là không làm ảnh hưởng đáng kể đến chất lượng hình ảnh. Quá trình giấu tin tận dụng hai ma trận: ma trận khóa K và ma trận trọng số W. Ma trận khóa K đóng vai trò như một yếu tố bí mật để mã hóa thông tin, trong khi ma trận trọng số W quyết định cách thức thông tin được phân bổ và nhúng vào ảnh. Phương pháp này khắc phục được nhược điểm của các thuật toán trước đó như Wu-Lee, bằng cách tránh việc sửa đổi các khối ảnh toàn màu đen hoặc toàn màu trắng, giúp tăng độ an toàn và giảm nguy cơ bị phát hiện. Việc lựa chọn kích thước khối m x n và giá trị của ma trận K và W ảnh hưởng lớn đến hiệu quả và độ an toàn của phương pháp giấu tin.
2. Vai trò của Ma trận Trọng số W
Ma trận trọng số W đóng vai trò quan trọng trong thuật toán CPT. Nó đại diện cho dữ liệu nhúng và ảnh hưởng trực tiếp đến cách thức thông tin được giấu trong từng khối ảnh. Định nghĩa về ma trận trọng số W được đưa ra: mỗi phần tử từ 1 đến 2r - 1 phải xuất hiện ít nhất một lần trong ma trận. Điều này đảm bảo tính đa dạng trong phân bổ trọng số, tăng độ phức tạp và khó khăn cho việc phá mã. Một ví dụ cụ thể về cách sử dụng ma trận K và W kích thước 3x3 để giấu 2 bit dữ liệu (r=2) vào một khối con 3x3 được trình bày. Bằng cách điều chỉnh tổng trọng số (SUM) thông qua việc đảo bit trong khối ảnh, thuật toán đảm bảo rằng thông tin được giấu một cách hiệu quả và an toàn. Việc lựa chọn các phần tử của W, có thể ngẫu nhiên hoặc theo một quy tắc nhất định, ảnh hưởng đến sự phức tạp và độ bảo mật của thuật toán. Các bổ đề được đưa ra để chứng minh quá trình đảo bit luôn thành công và chỉ cần thay đổi tối đa 2 bit để giấu r bit dữ liệu.
3. Quá trình Tách tin CPT
Quá trình tách tin CPT ngược lại với quá trình giấu tin, sử dụng cùng ma trận khóa K và ma trận trọng số W. Thông tin được tách ra từ từng khối ảnh đã được giấu tin (F') bằng công thức: b = SUM(F') mod 2. Kết quả là một chuỗi bit, đại diện cho thông tin nhị phân đã được giấu. Công thức SUM((F' ⊕ K) ⊗ W) = b₁b₂...br (mod 2r) được sử dụng để trích xuất r bit dữ liệu từ mỗi khối. Các bổ đề toán học được sử dụng để chứng minh tính khả thi và hiệu quả của phương pháp tách tin. Quá trình này đảm bảo rằng thông tin được tách ra chính xác và hoàn chỉnh nếu ma trận K và W được sử dụng đúng. Sự chính xác của quá trình tách tin phụ thuộc hoàn toàn vào sự khớp giữa khóa và ma trận được sử dụng trong quá trình giấu và tách. Sự phức tạp của thuật toán CPT nằm ở sự kết hợp của ma trận K và W, làm cho việc phá mã trở nên khó khăn hơn.
III.Đánh giá hiệu quả Giấu tin CPT
Hiệu quả của kỹ thuật giấu tin CPT được đánh giá thông qua PSNR. PSNR cao cho thấy chất lượng ảnh sau khi giấu tin vẫn tốt. Tuy nhiên, đồ án chỉ ra rằng khi lượng dữ liệu cần giấu lớn, PSNR giảm, dẫn đến ảnh bị nhiễu. Khả năng giấu tin còn phụ thuộc vào kích thước ảnh, giá trị điểm ảnh, cũng như sự lựa chọn ma trận K và W.
1. Đánh giá hiệu quả bằng PSNR
Hiệu quả của kỹ thuật giấu tin CPT được đánh giá chủ yếu thông qua chỉ số PSNR (Peak Signal-to-Noise Ratio). PSNR là một thước đo chất lượng hình ảnh, thể hiện mức độ nhiễu giữa ảnh gốc và ảnh sau khi giấu tin. Một giá trị PSNR cao cho thấy ảnh sau khi giấu tin vẫn giữ được chất lượng tốt, gần giống với ảnh gốc, tức là thông tin được giấu một cách hiệu quả và vô hình. Ngược lại, PSNR thấp cho thấy sự xuất hiện nhiễu, ảnh hưởng đến chất lượng hình ảnh, làm giảm hiệu quả của quá trình giấu tin. Theo tài liệu, PSNR đạt được là khá cao khi giấu lượng bit nhỏ, nhưng giảm xuống đáng kể khi giấu lượng bit lớn, dẫn đến ảnh bị nhiễu. Điều này cho thấy giới hạn của kỹ thuật CPT trong việc xử lý các lượng thông tin lớn cần được giấu. Ngưỡng PSNR tốt thường được coi là trên 35dB, trong khi dưới 20dB là không chấp nhận được.
2. Ảnh hưởng của các yếu tố khác
Ngoài PSNR, hiệu quả của kỹ thuật giấu tin CPT còn phụ thuộc vào một số yếu tố khác. Đầu tiên là kích thước của ảnh gốc: ảnh càng lớn, càng có nhiều không gian để giấu tin, nhưng cũng đồng nghĩa với thời gian xử lý lâu hơn. Thứ hai là kích thước của thông điệp cần giấu: lượng dữ liệu lớn đòi hỏi nhiều thay đổi hơn trên ảnh, làm tăng nguy cơ ảnh hưởng đến chất lượng ảnh và giảm PSNR. Thứ ba là giá trị điểm ảnh của ảnh gốc: tính chất của ảnh gốc có ảnh hưởng đến khả năng giấu tin. Cuối cùng là sự lựa chọn ma trận khóa K và ma trận trọng số W: việc chọn các giá trị thích hợp cho hai ma trận này là rất quan trọng, ảnh hưởng trực tiếp đến khả năng giấu tin, độ an toàn và hiệu quả của thuật toán. Sự kết hợp giữa các yếu tố này quyết định tính vô hình và độ an toàn của kỹ thuật giấu tin CPT.
3. Ưu điểm và Nhược điểm
Qua thử nghiệm, kỹ thuật giấu tin CPT trên ảnh nhị phân có ưu điểm là đảm bảo tính vô hình của thông tin khi giấu lượng bit nhỏ, nhờ vào việc sử dụng ma trận khóa K và ma trận trọng số W. Tuy nhiên, nhược điểm chính là hiệu quả giảm đáng kể khi giấu lượng bit lớn, dẫn đến giảm PSNR và ảnh bị nhiễu. Độ an toàn của kỹ thuật được cho là cao, phụ thuộc lớn vào sự lựa chọn ma trận K và W, tạo nên tính phức tạp và khó khăn cho việc phá mã. Thời gian xử lý phụ thuộc nhiều vào kích thước ảnh và lượng dữ liệu cần giấu. Tóm lại, kỹ thuật CPT cho kết quả tốt khi giấu lượng thông tin nhỏ nhưng cần được cải thiện để ứng dụng hiệu quả với lượng thông tin lớn hơn.
IV.Kết luận và Hướng phát triển
Đồ án đã trình bày thành công kỹ thuật giấu tin CPT trên ảnh nhị phân, với ưu điểm là độ an toàn cao và tính vô hình tốt khi lượng dữ liệu giấu nhỏ. Tuy nhiên, cần nghiên cứu thêm để cải thiện hiệu quả khi giấu lượng lớn dữ liệu, đồng thời tiếp tục tối ưu hóa việc lựa chọn ma trận K và W nhằm tăng cường độ bảo mật. Nguyễn Tất Trung (CT1201) đề xuất những hướng nghiên cứu tiếp theo để hoàn thiện kỹ thuật giấu tin CPT.
1. Kết luận về hiệu quả kỹ thuật giấu tin CPT
Đồ án kết luận rằng kỹ thuật giấu tin CPT trên ảnh nhị phân đạt được những kết quả khả quan, đặc biệt là về tính vô hình của thông tin khi lượng dữ liệu giấu nhỏ. Việc sử dụng ma trận khóa K và ma trận trọng số W giúp đảm bảo tính bảo mật cao. Tuy nhiên, hiệu quả của kỹ thuật giảm đáng kể khi lượng dữ liệu cần giấu lớn, thể hiện qua việc giảm chỉ số PSNR và ảnh bị nhiễu. Điều này cho thấy một giới hạn của kỹ thuật CPT trong việc xử lý các lượng dữ liệu lớn. Kết quả thử nghiệm cho thấy khả năng giấu tin hiệu quả khi dung lượng dữ liệu nhỏ, nhưng khi tăng dung lượng, chất lượng hình ảnh bị ảnh hưởng rõ rệt. Do đó, việc tối ưu hóa thuật toán để xử lý hiệu quả với dung lượng lớn là một hướng nghiên cứu quan trọng trong tương lai.
2. Nhận xét về các yếu tố ảnh hưởng
Hiệu quả của kỹ thuật CPT phụ thuộc vào nhiều yếu tố. Kích thước ảnh gốc, kích thước thông điệp cần giấu, và giá trị điểm ảnh của ảnh gốc đều có ảnh hưởng đáng kể. Ảnh có kích thước lớn cho phép giấu nhiều dữ liệu hơn nhưng cũng làm tăng thời gian xử lý. Thông điệp lớn hơn đòi hỏi nhiều thay đổi trên ảnh, làm giảm chất lượng ảnh. Giá trị điểm ảnh của ảnh gốc cũng ảnh hưởng đến khả năng giấu tin. Ngoài ra, sự lựa chọn ma trận khóa K và ma trận trọng số W cực kỳ quan trọng. Việc lựa chọn các giá trị thích hợp cho hai ma trận này sẽ quyết định khả năng giấu tin, độ an toàn và hiệu quả của thuật toán. Tóm lại, hiệu quả của kỹ thuật CPT là sự kết hợp phức tạp của nhiều yếu tố này.
3. Hướng phát triển và cải tiến
Dựa trên kết quả nghiên cứu, đồ án đề xuất một số hướng phát triển và cải tiến cho kỹ thuật giấu tin CPT. Một trong những hướng quan trọng nhất là nghiên cứu để cải thiện hiệu quả khi giấu lượng lớn dữ liệu, nhằm khắc phục nhược điểm về giảm PSNR và ảnh bị nhiễu khi dung lượng dữ liệu lớn. Việc tối ưu hóa việc lựa chọn ma trận khóa K và ma trận trọng số W cũng cần được nghiên cứu thêm để tăng cường độ bảo mật và hiệu quả của thuật toán. Ngoài ra, nghiên cứu về các phương pháp đánh giá hiệu quả khác ngoài PSNR cũng có thể được xem xét. Tóm lại, mặc dù kỹ thuật CPT đã cho thấy tiềm năng trong việc giấu tin trên ảnh nhị phân, nhưng vẫn còn nhiều không gian cho việc cải tiến và tối ưu hóa để đạt hiệu quả cao hơn, đặc biệt là với các lượng dữ liệu lớn.