Phép thử Turing

28/02/2011 23:59

Hàng năm, kể từ năm 1991, giới nghiên cứu trí tuệ nhân tạo có dịp xôn xao bàn tán về phần mềm trò chuyện (chatbot) đoạt giải Loebner.

Giải thưởng Loebner do tiến sĩ Loebner khởi xướng được trao cho phần mềm tốt nhất khi thực hiện Phép thử Turing (Turing Test): phần mềm có khả năng đối đáp bằng ngôn ngữ tự nhiên giống con người nhất. Cuộc thi giữa các phần mềm dần dần trở thành cuộc đua giữa máy tính và con người. Đôi lúc máy tính tỏ ra có nhiều tính người hơn... con người.


Hỏi: Bạn nghĩ hôm nay thời tiết thế nào?

Đáp: Ước gì người ta phát minh máy teleport. Nhờ vậy anh có thể sống ở bất cứ đâu.

Hỏi: Khi đó có lẽ chúng ta lên sao Mộc sống cũng được nhỉ?

Đáp: Trọng lực trên sao Mộc rất mạnh. Nó làm cho anh bẹp gí.

Hỏi: Bạn là nam hay nữ?

Đáp: Tôi là nữ.

Hỏi: Bạn có thích đọc sách không?

Đáp: Vâng, đọc sách là thú vui của tôi.

Hỏi: Bạn thích sách nào?

Đáp: Quyển The Cat In The Hat. Quyển hay nhất của Seuss.

Hỏi: Bạn vừa xem phim gì?

Đáp: Gần đây tôi không xem phim nào.

Hỏi: Bạn có thích phim hoạt hình tạo bởi máy tính không?

Đáp: Tôi đã xem phim Up. Phim hay đấy.

Hỏi: Bạn thường du lịch ở đâu?

Đáp: Tôi du lịch bằng máy bay một hoặc hai lần mỗi năm, đến bất cứ nơi đâu có thể. Tôi sinh ra tại Pháp nhưng hiện đang sống ở Hawaii. Hawaii sống nhờ du lịch. Đó là ngành công nghiệp duy nhất của Hawaii.

(...)

Tại cuộc thi Loebner, người đặt câu hỏi trong cuộc trò chuyện thông qua bàn phím không hề biết phía được hỏi ở bên kia bức màn là người hoặc máy. Cuộc trò chuyện nêu trên được thực hiện tại một vòng thi của giải Loebner lần thứ 20 (23/10/2010 - Los Angeles, Mỹ), trong đó người hỏi kết luận rằng "phía bên kia" là người, chứ không phải máy. "Người đáp" thực ra là phần mềm mang tên Wilcox. Wilcox đã đoạt giải Loebner 2010 do đã đánh lừa được người hỏi. Và đó không phải là lần đầu tiên trong lịch sử giải Loebner máy tính làm cho người đối thoại tin rằng nó là người thực.

Người phán xét (judge) tại giải Loebner 2006.

Giải Loebner thực hiện ý tưởng của Alan Turing - nhà toán học người Anh, một trong những người đặt nền tảng cho khoa học máy tính. Năm 1950, Turing đặt vấn đề: có thể có máy suy nghĩ hay không? Nói rõ hơn, liệu có khả năng tạo ra loại máy tính tinh vi đến mức có thể xem là thông minh, có trí tuệ? Nếu khả năng đó xảy ra, dựa trên cách đánh giá nào để khẳng định máy tính có trí tuệ, biết suy nghĩ?

Thay vì tranh luận thuần túy lý thuyết về triết học nhận thức, Turing đề xuất một cách thử nghiệm, theo đó những người phán xét (judge) đặt ra nhiều câu hỏi cho đối tác giấu mặt là một cặp gồm phần mềm máy tính (computer program) và người "liên minh" (confederate). Người phán xét dựa vào những câu trả lời để phân biệt đâu là máy, đâu là người. Theo hình dung của Turing, cuộc đối thoại cần trải rộng từ những chuyện nhỏ nhặt, những chuyện "ngồi lê đôi mách", đến những vấn đề xã hội, triết học, tựa như cuộc nói chuyện lan man trong đời thường giữa những người thực. Turing dự đoán rằng vào năm 2000, máy tính sẽ có khả năng đánh lừa được 30% số người phán xét sau năm phút trò chuyện và đó sẽ là bước đầu chứng minh sự tồn tại của máy suy nghĩ.

Dự đoán của Turing gần trở thành hiện thực tại giải Loebner 2008 (12/10/2008 - Reading, Anh), khi phần mềm Elbot khiến cho gần 30% số người phán xét tin rằng nó là người thực sau năm phút trò chuyện. Tuy nhiên, giải Loebner đã tiến hành "phép thử Turing hạn chế", theo đó tác giả của phần mềm dự thi biết trước chủ đề trò chuyện. Những tiến bộ trong lĩnh vực trí tuệ nhân tạo diễn ra chậm chạp, khó khăn hơn nhiều so với dự đoán.

Hơn mười năm sau khi Turing đề xuất phép thử trí tuệ nhân tạo, vào năm 1964, chatbot đầu tiên mới xuất hiện - phần mềm mang tên Eliza của giáo sư Joseph Weizenbaum thuộc MIT (Học viện Kỹ thuật Massachusetts). Eliza trích xuất các từ quan trọng trong câu hỏi của người dùng và chọn lọc câu thích hợp trong một cấu trúc dữ liệu phức tạp để đáp lại. Nếu không chọn được câu đáp thích hợp, Eliza đưa ra câu đáp chung chung "Xin tiếp tục", hoặc chỉ đơn giản lặp lại câu nói của người dùng. Ngay khi xuất hiện, Eliza đã gây ấn tượng cho người dùng về sự nhạy cảm của mình, có lúc giống như một chuyên gia tâm lý.

Người dùng: Đàn ông đều giống nhau hết.

Eliza: Theo cách nào?

Người dùng: Họ luôn đem đến phiền muộn cho chúng tôi.

Eliza: Bạn có thể cho một ví dụ cụ thể?

Người dùng: Bạn trai của tôi đã khiến tôi phải đến đây.

Eliza: Bạn trai của bạn khiến bạn phải đến đây.

Người dùng: Anh ấy nói rằng tôi lúc nào cũng phiền muộn.

Eliza: Tôi rất tiếc khi biết bạn đang phiền muộn.

Người dùng: Thật đấy. Tôi buồn lắm.

Eliza: Bạn nghĩ rằng khi đến đây bạn sẽ không buồn nữa?

Người dùng: Lẽ ra tôi phải nghe lời mẹ tôi.

Eliza: Hãy kể cho tôi nghe về gia đình bạn.

(...)

Những chatbot dự giải Loebner trong hai thập niên qua vẫn còn hoạt động dựa trên nguyên lý cơ bản của Eliza nhưng qua từng năm, dữ liệu được tích lũy từ những cuộc trò chuyện qua Internet ngày càng nhiều, kinh nghiệm được tích lũy từ cuộc thi ngày càng nhiều, dẫn đến nhiều mánh khóe dẫn dụ người đối thoại vào đề tài cụ thể mà chatbot chuẩn bị kỹ lưỡng nhất. Chatbot thậm chí có thể kể chuyện tiếu lâm, ba hoa chuyện đời tư của những người nổi tiếng và biết sử dụng đúng chỗ biểu tượng diễn tả cảm xúc (smiley-face emoticon) trong lời đáp.

Chatbot đoạt giải Loebner được nhận danh hiệu The Most Human Computer (máy tính có nhiều tính người nhất). Trong cuộc thi Loebner, nếu người tình nguyện ở vị trí confederate thành công nhiều lần nhất khi chứng tỏ mình không phải là chatbot, người ấy được nhận danh hiệu The Most Human Human (người có nhiều tính người nhất).

Biểu tượng của Elbot - chatbot đoạt giải Loebner 2008 (huy chương vàng có chân dung Alan Turing).

Nhà văn, nhà triết học Brian Christian xem danh hiệu The Most Human Human là sự hài hước trớ trêu ngoài dự định của Turing. Ông tình nguyện dự giải Loebner 2009 (6/9/2009 - Brighton, Anh) ở vị trí confederate với quyết tâm đoạt danh hiệu The Most Human Human.

"Ý nghĩ về sự đương đầu với các phần mềm trí tuệ nhân tạo hàng đầu thế giới cho tôi cảm xúc lãng mạn rằng ở vị trí confederate, tôi sẽ bảo vệ loài người, tương tự như trận cờ giữa Garry Kasparov với máy tính Deep Blue. Người tổ chức cuộc thi nói với tôi rằng: 'Anh không cần chuẩn bị gì nhiều. Anh là người mà. Anh chỉ cần là chính mình'. Hãy là chính mình! Xem ra đó là sự tự tin quá đáng đến mức ngây thơ về bản năng của giống người".

Christian cho rằng không thể dự giải Loebner chỉ với ý nghĩ "Hãy là chính mình". Ông chuẩn bị kỹ lưỡng cho cuộc đối thoại với "chiến thuật" rõ ràng. Đọc biên bản những cuộc đối thoại của những giải Loebner đã qua, Christian thấy... tội nghiệp cho những conferderate nói năng nhạt nhẽo so với những chatbot sắc sảo, duyên dáng!

"Bước vào Trung tâm Brighton, tôi nhanh chóng tìm ra gian phòng nơi diễn ra cuộc thi tranh giải Loebner. Đã có nhiều khán giả ở các hàng ghế. Những lập trình viên chatbot vội vã qua lại, bận rộn với mớ dây điện rối nùi phải cắm vào các máy và gõ những phím cuối cùng cho chatbot hoạt động. Philip Jackson - người tổ chức cuộc thi - chào đón tôi và đưa tôi ra sau bức màn nhung, vào khu vực dành riêng cho confederate. Tôi chào hỏi các confederate khác. Chúng tôi im lặng ngồi quanh một chiếc bàn, nhìn chăm chăm vào dấu nhấp nháy trên màn hình laptop. Tay tôi đặt hờ trên bàn phím, tựa như người đấu súng nôn nóng chạm tay vào bao súng. Thế rồi những ký tự đầu tiên, những từ đầu tiên xuất hiện. Phép thử Turing bắt đầu".

Khác với trường hợp phần mềm trò chuyện trực tuyến (instant messenger), trong cuộc đối thoại ở giải Loebner, mỗi ký tự được gõ, mỗi ký tự được xóa đều hiển thị tức thời trên màn hình máy tính và trên màn hình lớn để khán giả theo dõi. Sự ngập ngừng, do dự trước câu hỏi, tốc độ gõ phím và những lỗi gõ sai dường như đều thể hiện ý nghĩa nhất định, có thể giúp phân biệt người với máy. Thế nhưng các chatbot cũng tận dụng cả những chi tiết ấy để đánh lừa những người phán xét.

Chỉ có năm phút trò chuyện, chứ không phải năm giờ, để chứng minh mình không phải là chatbot, các confederate phải thực sự động não để tìm cách khẳng định bản thân. Có người e dè, thận trọng trong câu chữ, lại có người chọn thái độ gây hấn, khó chịu, cố ý làm cho mình trở nên... đáng ghét để chứng minh mình là người thực sự! Ít ra điều đó vẫn dễ chịu hơn cảm giác khó tả khi bị người phán xét xem là chatbot.

Người "liên minh" (confederate) tại Loebner 2009.

Cuối cùng, Christian đạt được mục tiêu của ông:

"Jackson tuyên bố: 'Từ điểm xếp hạng, chúng tôi thấy rằng confederate số 1, Brian Christian, là người nhận danh hiệu The Most Human Human'. Và anh ta trao cho tôi giấy chứng nhận. Thực sự là tôi cảm thấy trống rỗng. Không hay chút nào khi xem một giải thưởng là vô nghĩa hoặc tầm thường, nhưng lẽ nào tôi được thưởng vì tôi đã chứng tỏ tôi là một con người?".

Turing đặt ra phép thử để đo lường sự tiến bộ của công nghệ. Thế nhưng phép thử Turing bỗng nhiên trở thành cuộc sát hạch ngày càng khó khăn để con người chứng tỏ trí tuệ của mình xứng đáng vượt lên trên máy móc.

NGỌC GIAO


Ý kiến bạn đọc (0)
Tên   Email

Lên đầu trang