LỜI CÁM ƠN
Chúng em xin chân thành cảm ơn Khoa Công Nghệ Thông Tin, trường Đại
Học Khoa Học Tự Nhiên, Tp.HCM đã tạo điều kiện tốt cho chúng em thực hiện đề
tài này.
Chúng em xin chân thành cảm ơn Thầy Trần Minh Triết là người đã tận tình
hướng dẫn, chỉ bảo chúng em trong suốt thời gian thực hiện đề tài.
Chúng em cũng xin gửi lời cảm ơn sâu sắc đến quý Thầy Cô trong Khoa đã
tận tình giảng dạy, trang bị cho chúng em những kiến thức quí báu trong những năm
học vừa qua.
Chúng em xin gửi lòng biết ơn sâu sắc đến Ba, Mẹ, các anh chị và bạn bè đã
ủng hộ, giúp đỡ và động viên chúng em trong những lúc khó khăn cũng như trong
suốt thời gian học tập và nghiên cứu.
Mặc dù chúng em đã cố gắng hoàn thành đề tài trong phạm vi và khả năng
cho phép, nhưng chắc chắn sẽ không tránh khỏi những thiếu sót, kính mong sự cảm
thông và tận tình chỉ bảo của quý Thầy Cô và các bạn.
Nhóm thực hiện
Vũ Tuấn Hưng – Nguyễn Vinh Tiệp & Huỳnh Quốc Trí
ĐỀ CƯƠNG CHI TIẾT
Tên Đề Tài: Nghiên cứu và phát triển thử nghiệm một số phương pháp tương
tác với máy tính sử dụng thị giác máy tính
Giáo viên hướng dẫn: TS.Trần Minh Triết
Thời gian thực hiện: từ ngày 15/12/2009 đến ngày 15/07/2010
Sinh viên thực hiện:
Vũ Tuấn Hưng (0612151) – Nguyễn Vinh Tiệp (0612450) – Huỳnh Quốc Trí
(0612483)
Loại đề tài: Tìm hiểu công nghệ và xây dựng ứng dụng
Nội Dung Đề Tài: Khảo sát, nghiên cứu, phân tích một số phương pháp tương
tác người – máy sử dụng thị giác máy tính; đề xuất giải pháp tương tác máy tính để
sử dụng một và hai camera; từ đó xây dựng thử nghiệm một số ứng dụng cho phép
tương tác giữa người – máy. Nội dung chi tiết của đề tài bao gồm:
• Nghiên cứu, khảo sát các kỹ thuật HCI, kiến trúc hệ thống HCI
• Một số vấn đề về camera: mô hình và các tham số của camera
• Hai bài toán quan tâm: Dựng đối tượng 3D ảo dựa trên đối tượng thật sử
dụng một camera, tương tác máy tính dựa vào thông tin 3D của đối tượng sử
dụng 2 camera.
• Ứng dụng thử nghiệm: xây dựng trò chơi “Lá bài ma thuật” dựa trên trò chơi
“Eye of Adjustment” của hãng Sony, xây dựng ứng dụng chuột ảo từ thông
tin 3D rút trích từ 2 camera, ứng dụng Surface tương tác trực tiếp với màn
hình máy tính sử dụng 2 camera
Kế Hoạch Thực Hiện:
-
Xác nhận của GVHD Ngày 27 tháng 7 năm 2010
SV Thực hiện
Mục lục
Danh sách hình
Danh sách bảng
Chương 1
Giới thiệu
Tóm tắt chương:
Nội dung chương 1 trình bày tổng quan về đề tài, mục tiêu của đề tài. Nội dung tóm tắt
của từng chương trong đề tài được trình bày ở cuối phần này.
1.1 Đặt vấn đề
Từ những năm đầu xuất hiện của máy tính, vấn đề giao tiếp giữa con người với máy tính
(Human-Computer Interaction) nổi lên thành một trong những lĩnh vực được quan tâm rất
nhiều. Nếu các nghiên cứu trước kia tập trung vào việc thiết kế các mô hình nhập liệu hiệu
quả, các nghiên cứu gần đây về HCI tập trung vào việc đơn giản và tự nhiên hóa cho quá trình
tương tác giữa người và máy. Với sự đột phá ngày càng mạnh mẽ của các thiết bị phần cứng,
HCI ngày nay đã đạt được nhiều bước tiến quan trọng, khiến cho việc sử dụng máy tính trở
nên tiện dụng và thân thuộc với con người hơn. Xét quá trình đi lên của HCI, từ những ngày
đầu của máy tính, khi dữ liệu được đưa vào bằng việc bật tắt các công tắc hoặc nhét các thẻ
bấm lỗ, đến khi con người có thể sử dụng cử chỉ, giọng nói để làm việc với máy tính như trong
những năm gần đây, ta có thể thấy được những tiến bộ đạt được trong lĩnh vực HCI là rất lớn.
Năm 1995, Brad A. Myers trong bài báo “A brief History of Human Computer Interaction
Technology” [], đã đưa ra một bảng tóm tắt về những thành tựu HCI từ những năm 1960, được
thể hiện ở Hình 1 Có thế nói, những thành tựu trên đều đã làm thay đổi hoàn toàn cách thức
con người sử dụng máy tính, từng bước mang máy tính lại “gần” con người hơn. Ở Chương 2,
chúng tôi sẽ đi sâu tìm hiểu về HCI, bao gồm định nghĩa, kiến trúc của các hệ thống HCI cũng
như trình bày về những hướng tiếp cận đang được quan tâm nhiều trong HCI.
Trong những thập kỷ gần đây, lĩnh vực thị giác máy tính (Computer Vison) đã đạt được
những bước tiến đáng kể, với sự cải thiện lớn về hiệu năng cũng như tính mạnh mẽ
(robustness) của các thuật toán phát hiện, nhận dạng, theo vết và mô hình hóa đối tượng, đặc
biệt là với yêu cầu thực thi thời gian thực []. Đồng thời với sự tăng tốc của thuật toán, các thiết
bị phần cứng sử dụng trong thị giác máy tính, điển hình như camera, ngày càng mạnh mẽ và
11
có giá thành hợp lý. Với những lý do trên đó, thị giác máy tính ngày nay đã trở thành một thể
thức nhập liệu khả thi cho HCI. Hàng loạt những nghiên cứu, dự án về HCI theo hướng tiếp
cận thị giác máy tính xuất hiện. Hệ thống Sixth Sense của MIT Media Lab [] hay dự án Natal
của Microsoft [] đều là những ví dụ cho xu hướng sử dụng thị giác máy tính vào HCI. Đặc
biệt, khi xét về khía cạnh công nghiệp, phản ứng của cộng đồng đối với những dự án trên đều
rất tích cực, là một tín hiệu khả quan cho tương lai không xa của các hệ thống HCI dựa trên
nền tảng thị giác máy tính.
Nhiệm vụ chính của thị giác máy tính trong các hệ thống HCI là phát hiện, nhận dạng và
mô hình những thông tin thị giác bổ sung (có thể có được từ camera) và trả về những thông tin
liên quan như vị trí, biểu lộ nét mặt, cử chỉ của tay, ngón tay,… Những công việc trên cũng có
thể được thực hiện bằng những thiết bị chuyên dụng như các thiết bị cảm ứng ánh sáng, cảm
ứng lực; tuy nhiên, chúng sẽ không thể làm cho người dùng cảm thấy tự nhiên khi sử dụng và
thao tác. Một số công việc chủ yếu của thị giác máy tính trong HCI là làm sao để có thể xác
định được: []
• Vị trí, sự xuất hiện của đối tượng
• Định danh của đối tượng
• Biểu lộ cảm xúc của đối tượng
• Hướng chú ý của đối tượng
• Các cử động cơ thể và sự chuyển động
• Điệu bộ, cử chỉ của đối tượng
• Hoạt động của đối tượng
Những hệ thống HCI tận dụng những thông tin thị giác rút trích từ phía người dùng như
vậy sẽ mang tính “đời thực” hơn, tạo ra cảm giác tự nhiên, thoải mái và thuận tiện khi thao tác.
Việc sử dụng máy tính, do đó, cũng sẽ được mở rộng với nhiều đối tượng hơn, bao gồm cả
những người có những khiếm khuyết cơ thể, gặp khó khăn trong việc thao tác với các thiết bị
tương tác phổ biến như chuột, bàn phím.
12
Hình 1. Những thành tựu trong HCI từ những năm đầu
Xuất phát từ những phân tích trên về việc áp dụng thị giác máy tính vào HCI, có thể thấy
được tiềm năng rất lớn của hướng nghiên cứu này cũng như các ứng dụng liên quan, đứng trên
cả phương diện công nghiệp lẫn xã hội. Điều này đã thúc đẩy nhóm chúng tôi chọn đề tài
nghiên cứu là “Nghiên cứu và phát triển thử nghiệm một số phương pháp tương tác với máy
tính sử dụng thị giác máy tính”.
1.2 Mục tiêu của đề tài
Mục tiêu của đề tài là nghiên cứu một số thuật toán, phương pháp trong lĩnh vực Thị giác
máy tính, và từ đó xây dựng các ứng dụng tương tác với máy tính. Chúng tôi sẽ trình bày hai
ứng dụng mà nhóm đã triển khai xây dựng bao gồm:
• Thực tại ảo tăng cường sử dụng một camera để dựng một thành phố 3D ảo:
mục tiêu là nhận diện và tái tạo thông tin 3D của đối tượng (các lá bài) và đặt trên
đó những kiến trúc ứng với từng loại lá bài. Người dùng có thể tùy ý thay đổi sắp
xếp lại vị trí qua lại lên xuống các kiến trúc. Ý nghĩa thực tế của ứng dụng là xây
13
dựng một thành phố 3D ảo với sự tương tác rất đơn giản từ phía người dùng, tạo
sự tiện lợi cho việc thiết kế và triển khai những dự án xây dựng, các công trình
kiến trúc.
• Hệ thống tương tác với máy tính bằng chuột ảo, sử dụng thông tin 3D tái tạo
từ bàn tay của 2 camera: mục tiêu của ứng dụng là giả lập việc sử dụng chuột
bằng các chuyển động tương ứng của bàn tay và ngón tay. Hệ thống sẽ chỉ sử dụng
2 camera với chi phí thấp để thực hiện rút trích thông tin của tay. Ý nghĩa thực tế
của ứng dụng này là tìm một cách thay thế việc sử dụng chuột thông thường bằng
một phương thức thuận tiện hơn với người dùng.
Trong mỗi ứng dụng, chúng tôi sẽ lần lượt liệt kê những bài toán gặp phải cũng như tìm
hiểu và đề xuất phương án để giải quyết cho từng bài toán. Bên cạnh đó, những kết quả thực
nghiệm và nhận xét đánh giá cũng được đưa vào cuối mỗi phần trình bày.
1.3 Nội dung đề tài
Đề tài sẽ bao gồm 8 chương:
• Chương 1: trong chương này, chúng tôi sẽ trình bày tổng quan về đề tài cũng như
nêu rõ mục tiêu của đề tài mà chúng tôi hướng đến. Bên cạnh đó một số nét khái
quát về những ứng dụng mà chúng tôi xây dựng cũng được đề cập đến ở phần cuối
chương
• Chương 2: nội dung chương 2 sẽ trình bày về HCI, bao gồm các định nghĩa, thuật
ngữ, các hướng nghiên cứu gần đây và một số kỹ thuật tiên tiến cũng như kiến trúc
của hệ thống HCI. Chương sẽ cung cấp cái nhìn tổng quan về HCI đồng thời làm
rõ ý nghĩa thực tế trong việc ứng dụng những lĩnh vực như xử lý âm thanh, xử lý
ảnh… vào các hệ thống HCI.
• Chương 3: trong chương này, chúng tôi sẽ trình bày về nền tảng lý thuyết của mô
hình pinhole camera và hiệu chỉnh thông số camera (calibration)
• Chương 4: trình bày về lý thuyết và thực nghiệm kỹ thuật tương tác máy tính dựa
vào thông tin 3D rút trích từ 1 camera. Chương sẽ trình bày sâu về lý thuyết và các
thực nghiệm thống kê liên quan. Việc xây dựng phần mềm ứng dụng dựa trên cơ
sở lý thuyết ở Chương 4 sẽ được trình bày ở Chương 5
• Chương 5: xây dựng phần mềm ứng dụng dựa trên cơ sở lý thuyết về rút trích
thông tin 3D của đối tượng từ 1 camera.
14
Không có nhận xét nào:
Đăng nhận xét