Ray Tracing: Kỹ thuật sinh ảnh 3D

Cập nhật lúc:25/03/2025

Thông tin tài liệu

Tác giả	Triệu Minh Đức
instructor	PGS. TS Đỗ Năng Toàn
Trường học	Trường Đại Học Dầu Khí Hải Phòng
Chuyên ngành	Công nghệ thông tin
Loại tài liệu	Đồ án tốt nghiệp

Ngôn ngữ	Vietnamese
Định dạng	\| PDF
Dung lượng	894.20 KB

Tóm tắt

I.Khái niệm và Ứng dụng của Đồ họa 3D

Tài liệu trình bày khái niệm cơ bản về đồ họa 3D, nhấn mạnh vai trò quan trọng của nó trong nhiều lĩnh vực như điện ảnh, hoạt hình, kiến trúc và đặc biệt là game. Sự phát triển của đồ họa 3D bắt đầu từ năm 1966 với sự ra đời của thiết bị hiển thị trùm đầu (head-mounted display) của Ivan Sutherland tại Học viện Công nghệ Massachusetts. Đồ họa 3D hiện nay là một ngành công nghiệp phát triển mạnh mẽ, không thể thiếu trong việc tạo ra các trò chơi điện tử hiện đại như Doom và Half-Life, nhờ khả năng tạo ra môi trường ảo sống động và chân thực.

1. Định nghĩa và Lịch sử Phát triển Đồ họa 3D

Đoạn văn bản giới thiệu khái niệm đồ họa máy tính (Computer Graphics), thuật ngữ được William Fetter đề xuất năm 1960 trong nghiên cứu mô hình buồng lái máy bay cho Boeing. Mục đích chính của đồ họa 3D là tạo ra và mô tả các đối tượng, mô hình trong thế giới thực trên máy tính sao cho giống thật nhất có thể. Năm 1966 đánh dấu bước ngoặt quan trọng với sự ra đời của thiết bị hiển thị trùm đầu (head-mounted display) do Ivan Sutherland tại Học viện Công nghệ Massachusetts phát minh, cho phép người dùng nhìn thấy hình ảnh 3D lập thể. Từ đó, đồ họa 3D phát triển mạnh mẽ và trở thành một lĩnh vực rực rỡ của đồ họa máy tính. Các chương trình đồ họa ứng dụng ngày nay cho phép người dùng làm việc với máy tính một cách thoải mái và thân thiện nhất, hướng tới mục tiêu tạo ra các mô hình càng giống thực tế càng tốt. Sinh ảnh là một trong những phương pháp quan trọng để đạt được mục tiêu này.

2. Ứng dụng rộng rãi của Đồ họa 3D

Đồ họa 3D được ứng dụng rộng rãi trong nhiều lĩnh vực. Trong điện ảnh và hoạt hình, đồ họa 3D giúp tạo ra những thước phim sống động, chân thực. Kiến trúc và xây dựng cũng tận dụng đồ họa 3D để thiết kế và xây dựng các mô hình thực tế ảo. Tuy nhiên, vai trò quan trọng nhất không thể bỏ qua là trong lĩnh vực game. Đồ họa 3D giúp tạo ra các game với đồ họa hiện đại, cho người chơi cảm giác như đang sống trong một thế giới thực, góp phần tạo nên một nền công nghiệp game phát triển mạnh mẽ. Các ví dụ về game sử dụng đồ họa 3D được nhắc đến là Doom và Half-Life, minh chứng cho sức ảnh hưởng của công nghệ này đối với trải nghiệm người dùng.

II.Ánh sáng trong Đồ họa 3D

Ánh sáng là yếu tố quyết định trong việc tạo ra hình ảnh chân thực trong đồ họa 3D. Mô hình ánh sáng OpenGL bao gồm các thành phần chính: Emissive Light, Ambient Light, Diffuse Light và Specular Light. Hiểu rõ cách vận dụng các nguồn sáng này là then chốt để tạo ra các hiệu ứng bóng đổ tự nhiên và chính xác. Hình ảnh minh họa cho thấy sự khác biệt giữa việc sử dụng Ambient Light, loại ánh sáng phân tán, không xác định hướng.

1. Vai trò của Ánh sáng trong Đồ họa 3D

Ánh sáng đóng vai trò cực kỳ quan trọng trong đồ họa 3D, đặc biệt là trong việc tạo ra bóng đổ. Có nhiều loại nguồn sáng khác nhau, từ nguồn sáng chiếu theo một hướng nhất định (giống ánh sáng mặt trời) đến nguồn sáng chiếu toàn khung cảnh. Một khung cảnh có thể có nhiều nguồn sáng, mỗi nguồn có thể được bật hoặc tắt độc lập, tương tự như việc bật tắt đèn bằng công tắc. Ánh sáng là thành phần không thể thiếu để tạo ra chiều sâu và độ chân thực cho hình ảnh 3D.

2. Mô hình Ánh sáng OpenGL

Theo mô hình ánh sáng của OpenGL, ánh sáng bao gồm 4 thành phần chính: Emissive Light, Ambient Light, Diffuse Light, và Specular Light. Mỗi thành phần này có thể được tính toán độc lập và sau đó kết hợp lại với nhau để tạo ra hiệu ứng ánh sáng tổng thể. Ambient Light là ánh sáng bị phân tán bởi môi trường và không thể xác định hướng. Nếu không xác định nguồn sáng cụ thể trong một khung cảnh, kết quả sẽ tương tự như khi sử dụng Ambient Light. Một hình ảnh minh họa cho thấy chiếc ấm được chiếu sáng bằng Ambient Light, cho thấy sự phân bố ánh sáng đồng đều trên bề mặt.

III.Phép chiếu và Biến đổi trong Đồ họa 3D

Quá trình hiển thị hình ảnh 3D bao gồm các bước biến đổi quan trọng: biến đổi hiển thị (Viewing Transformation) chuyển đổi từ tọa độ thế giới sang tọa độ mắt; biến đổi chuẩn hóa (Normalization) đưa vùng hiển thị vào khối lập phương chuẩn; và cuối cùng là biến đổi cổng nhìn (Viewport Transformation) ánh xạ tọa độ chuẩn hóa sang tọa độ pixel trên màn hình. Tài liệu giải thích chi tiết về phép chiếu trực giao và phép chiếu phối cảnh, bao gồm cả phép chiếu phối cảnh đối xứng và không đối xứng, cùng các ma trận biến đổi tương ứng. Hiểu rõ các phép chiếu này là nền tảng để tạo ra hiệu ứng phối cảnh chính xác trong hình ảnh.

1. Quá trình Biến đổi Tọa độ trong Đồ họa 3D

Quá trình hiển thị hình ảnh 3D bao gồm ba bước biến đổi chính. Đầu tiên là phép biến đổi hiển thị (Viewing Transformation), chuyển đổi tọa độ từ hệ tọa độ thế giới sang hệ tọa độ mắt (Eye Coordinate System). Đây là một phép biến đổi affine, với tọa độ được biểu diễn dưới dạng tọa độ đồng nhất (Homogeneous Coordinates) có w=1. Bước thứ hai là chuẩn hóa tọa độ mắt sang tọa độ thiết bị chuẩn hóa (Normalized Device Coordinates), đưa vùng không gian cần hiển thị vào một khối lập phương tiêu chuẩn. Các điểm gần điểm nhìn (camera) hơn sẽ có thành phần z nhỏ hơn. Bước cuối cùng là phép biến đổi cổng nhìn (Viewport Transformation), kết hợp phép co giãn tuyến tính và phép tịnh tiến để chuyển đổi tọa độ chuẩn hóa sang tọa độ pixel trên màn hình. Thành phần z được chuyển sang đoạn [0,1] và dùng làm giá trị chiều sâu (Depth-Value) trong thuật toán Z-Buffer để xác định mặt được hiển thị.

2. Phép Chiếu Trực giao và Phép Chiếu Phối cảnh

Tài liệu mô tả hai loại phép chiếu chính: trực giao và phối cảnh. Trong phép chiếu trực giao, vùng không gian hiển thị là một ống song song trong hệ tọa độ mắt, với kích thước và vị trí được xác định bởi các tọa độ mắt (x_left, x_right, y_bottom, y_top, z_front, z_back). Cửa sổ hiển thị cần được đưa về dạng hình vuông [-1, +1]², và khoảng giá trị của z được chuyển về đoạn [-1, +1] làm giá trị chiều sâu. Phép chiếu phối cảnh, đặc biệt là phép chiếu phối cảnh đối xứng, rất quan trọng trong việc tạo ra hiệu ứng ba chiều. Trong trường hợp tổng quát, vùng hiển thị được xác định bởi các thành phần tọa độ z (z_front và z_back) của các mặt cắt trước và sau, và một mặt cắt vuông góc với trục Z. Phép chiếu phối cảnh không đối xứng có thể được đưa về đối xứng bằng phép biến đổi cắt (tịnh tiến vuông góc với trục Z).

IV.Bộ đệm và Phép Kiểm tra trong Kết xuất Đồ họa

Kết xuất đồ họa (rendering) sử dụng các bộ đệm (buffer) để lưu trữ thông tin về mỗi pixel. Tài liệu tập trung vào Z-buffer (bộ đệm chiều sâu) để loại bỏ các bề mặt bị che khuất và Stencil Buffer (bộ đệm khuôn) để tạo ra hiệu ứng bóng và phản xạ. Depth test được sử dụng để xác định xem một pixel có được hiển thị hay không dựa trên giá trị chiều sâu của nó. Các phép kiểm tra này đảm bảo rằng hình ảnh cuối cùng được hiển thị chính xác và hiệu quả.

1. Khái niệm về Bộ đệm Buffer trong Kết xuất Đồ họa

Một mục đích quan trọng của các chương trình đồ họa là vẽ các bức tranh lên màn hình, được cấu tạo từ một mảng các pixel. Dữ liệu trước khi trở thành pixel được gọi là "mảnh" (fragments), chứa thông tin như màu sắc và giá trị chiều sâu. Nơi lưu trữ dữ liệu cho từng pixel được gọi là bộ đệm (Buffer). Mỗi bộ đệm lưu trữ một loại dữ liệu khác nhau, và dung lượng bộ nhớ cho mỗi pixel có thể khác nhau giữa các bộ đệm, nhưng trong cùng một bộ đệm, các pixel đều có cùng dung lượng. Một bitplane là bộ đệm lưu trữ 1 bit thông tin cho mỗi pixel. Một số bộ đệm phổ biến bao gồm Color Buffer, Depth Buffer, Stencil Buffer và Accumulation Buffer.

2. Bộ đệm Chiều sâu Z buffer và Depth Test

Z-buffer là bộ đệm lưu trữ giá trị chiều sâu (z) cho từng pixel, dùng để loại bỏ các bề mặt bị ẩn. Nếu hai điểm được ánh xạ vào cùng một pixel, điểm có giá trị z nhỏ hơn (gần mắt hơn) sẽ được hiển thị, đè lên điểm có giá trị z lớn hơn. Depth test kiểm tra giá trị chiều sâu của một điểm so với giá trị đã lưu trong Z-buffer. Nếu giá trị chiều sâu của điểm nhỏ hơn giá trị trong Z-buffer, điểm đó vượt qua Depth test (depth test pass) và giá trị chiều sâu của nó sẽ thay thế giá trị trong Z-buffer. Ngược lại, nếu giá trị chiều sâu lớn hơn, điểm đó sẽ bị loại bỏ (Depth test Fail).

3. Bộ đệm Khuôn Stencil Buffer và Phép Kiểm tra Stencil

Stencil Buffer dùng để giới hạn một vùng nhất định trong khung cảnh, đánh dấu một vùng trên màn hình. Nó được sử dụng để tạo bóng hoặc tạo ảnh phản xạ của vật thể qua gương. OpenGL cung cấp hàm glStencilOp(GLenum fail, GLenum zfail, GLenum zpass) để xác định cách dữ liệu trong Stencil Buffer thay đổi khi một "mảnh" vượt qua hoặc không vượt qua phép kiểm tra stencil. Các tham số fail, zfail và zpass có thể là GL_KEEP, GL_ZERO, GL_REPLACE, GL_INCR, GL_DECR,... Mặc định, cả ba tham số đều là GL_KEEP.

V. Sinh ảnh bằng Ray Tracing và Radiosity

Tài liệu so sánh hai thuật toán sinh ảnh quan trọng: Ray Tracing (dò tia) và Radiosity. Ray Tracing mô phỏng đường đi của từng tia sáng từ nguồn sáng đến mắt người xem, tạo ra hiệu ứng bóng, phản xạ và khúc xạ chân thực. Radiosity mô phỏng sự tương tác ánh sáng giữa các bề mặt, tạo ra bóng mờ tự nhiên. Kết hợp cả hai thuật toán này có thể tạo ra hình ảnh có chất lượng cao, nhưng đòi hỏi khả năng tính toán lớn. Các vấn đề về hiệu năng và giải pháp cải thiện tốc độ cũng được đề cập.

1. Giới thiệu Ray Tracing

Ray tracing là một phương pháp sinh ảnh tạo ra các hình ảnh giống thật bằng máy tính. Phương pháp này lần theo đường đi của mỗi tia sáng riêng rẽ từ mắt người nhìn đến điểm tới đầu tiên. Thuật toán Ray tracing mô phỏng đường đi của tia sáng, bao gồm cả phản xạ và khúc xạ, để tính toán màu sắc cuối cùng của mỗi điểm ảnh. Việc tính toán cường độ ánh sáng tại điểm giao cắt được thực hiện bằng cách nối điểm giao cắt với tất cả các nguồn sáng, kiểm tra xem có vật thể nào che khuất hay không. Kết quả cuối cùng là sự kết hợp của các hiệu ứng như bóng, phản xạ và khúc xạ, mô phỏng theo quy luật quang học. Những hình ảnh chúng ta thấy được là sự tổng hợp màu sắc của hàng tỷ tia sáng đi vào mắt.

2. Giới thiệu Radiosity

Radiosity là một thuật toán sinh ảnh nổi tiếng, mô phỏng sự tương tác ánh sáng giữa các bề mặt với nhau. Không giống như Ray tracing lần theo đường đi của từng tia sáng, Radiosity tập trung vào việc tính toán sự phân bố ánh sáng trên các bề mặt. Thuật toán này tạo ra hiệu ứng bóng mờ tốt, mô phỏng sự tương tác năng lượng ánh sáng giữa các bề mặt. Một ưu điểm của Radiosity là phân bố độ sáng hợp lý, không phụ thuộc vào góc nhìn, nghĩa là không cần tính toán lại khi thay đổi góc nhìn. Tuy nhiên, Radiosity thường thiếu các hiệu ứng bóng phản xạ chi tiết.

3. Kết hợp Ray Tracing và Radiosity

Kết hợp Ray tracing và Radiosity có thể tạo ra hình ảnh có màu sắc rất gần với ảnh thật vì hai thuật toán này bổ sung cho nhau. Tuy nhiên, việc kết hợp này gặp khó khăn về hiệu năng tính toán. Với mô hình vật thể được chia thành nhiều miếng nhỏ (để phục vụ cho Radiosity), việc tìm giao cắt của một tia với vật thể trong Ray tracing trở nên phức tạp hơn, đòi hỏi kiểm tra giao cắt với tất cả các miếng. Số lượng miếng càng nhiều thì thời gian tính toán càng tăng, dẫn đến tốc độ dựng ảnh chậm lại. Các giải thuật cải thiện tốc độ cần được áp dụng để khắc phục hạn chế này.

VI. Đánh bóng Gouraud và Phong

Để tạo ra bề mặt vật thể mượt mà, tài liệu trình bày hai kỹ thuật đánh bóng phổ biến: Gouraud shading và Phong shading. Gouraud shading tính toán độ sáng tại mỗi đỉnh và nội suy tuyến tính giữa các đỉnh, trong khi Phong shading tính toán vector pháp tuyến tại mỗi điểm và sử dụng nó để tính độ sáng, tạo ra hiệu ứng bóng mượt mà hơn. Sự khác biệt giữa hai kỹ thuật này được minh họa bằng hình ảnh.

1. Đánh bóng Gouraud

Thuật toán đánh bóng Gouraud gán độ sáng cho mỗi đỉnh của một đa giác bằng trung bình độ sáng của các miếng có chung đỉnh đó. Độ sáng của một điểm bên trong đa giác được nội suy tuyến tính từ độ sáng của các đỉnh. Phương pháp này đơn giản và hiệu quả về mặt tính toán, nhưng có thể dẫn đến hiện tượng "banding" (kẻ sọc) trên bề mặt, đặc biệt khi độ sáng thay đổi đột ngột. Hình ảnh minh họa cho thấy kết quả đánh bóng Gouraud, cho thấy hiện tượng kẻ sọc trên bề mặt vật thể nếu không có kỹ thuật xử lý phù hợp. Đây là một phương pháp nội suy nhị phân.

2. Đánh bóng Phong

Thuật toán đánh bóng Phong tính toán vector pháp tuyến tại mỗi đỉnh bằng trung bình các vector pháp tuyến của các miếng có chung đỉnh đó. Vector pháp tuyến của một điểm bên trong miếng được nội suy tuyến tính từ vector pháp tuyến của các đỉnh. Độ sáng tại mỗi điểm phụ thuộc vào góc giữa vector pháp tuyến tại điểm đó và vector từ điểm nhìn đến điểm sáng. So với Gouraud shading, Phong shading tạo ra hiệu ứng bóng mượt mà hơn, chính xác hơn, và giảm thiểu hiện tượng banding. Việc tính toán vector pháp tuyến chính xác hơn giúp tạo ra bóng phản xạ tự nhiên hơn. Đây cũng là một phương pháp nội suy nhị phân.