Trí tuệ của máy tính Watson

15/03/2013 23:44

Chiến thắng của máy tính IBM Watson trong trò chơi truyền hình Jeopardy tại Mỹ (14-16/2/2011) đánh dấu bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo.

Đó là máy tính có thể trở nên thông minh dựa vào kho kiến thức được tích lũy ở dạng dữ liệu không cấu trúc.

Jeopardy là trò chơi truyền hình trong đó người chơi được cung cấp manh mối để đưa ra câu hỏi thích hợp (hỏi bằng câu đáp, đáp bằng câu hỏi). Về thực chất, Jeopardy là trò chơi "từ điển ngược": người chơi phải phán đoán để xác định thông tin được cung cấp tương ứng với từ ngữ nào, chủ thể nào, khái niệm nào.

Những người chơi Jeopardy phải nhanh tay bấm nút để giành quyền trả lời và không được bấm nút trước khi người dẫn chương trình đọc xong câu hỏi. Tài khoản của người chơi được cộng thêm hoặc bị trừ đi số tiền tương ứng với câu hỏi tùy theo người chơi đáp đúng hoặc sai.

Jeopardy có một số câu hỏi đặt cược: tất cả người chơi trả lời đồng thời bằng cách dùng bút sáng viết trên màn hình dành riêng và đặt cược một số tiền (không quá số tiền họ đã thu được trong trò chơi). Tài khoản của người chơi được cộng thêm hoặc bị trừ đi số tiền đặt cược tùy theo người chơi đáp đúng hoặc sai câu hỏi đặt cược.

Vào tháng 2/2011, người xem chương trình truyền hình Jeopardy có dịp chứng kiến trận đấu "huyền thoại" giữa các kỳ phùng địch thủ: Brad Rutter - người thu được số tiền lớn nhất từ Jeopardy (3,2 triệu USD), Ken Jennings - người có số lần thắng Jeopardy nhiều nhất (74 lần), tranh đua cùng máy tính Watson của IBM - "người chơi không chân dung", tham gia Jeopardy lần đầu tiên.

Máy tính Watson (đặt theo tên của người sáng lập IBM - Thomas Watson) thực ra gồm nhiều máy chủ có năng lực xử lý mạnh ngàn lần hơn máy tính cá nhân, được bố trí phía sau trường quay Jeopardy. Watson không kết nối với Internet. Watson "suy nghĩ" dựa vào kho kiến thức được lưu trữ trong máy. Trong chương trình Jeopardy, màn hình của Watson được đặt giữa Rutter và Jennings. Câu hỏi của Jeopardy hiện ra trên màn hình lớn, đồng thời chuyển đến Watson ở dạng văn bản. Watson trả lời bằng giọng nói tổng hợp. Riêng với câu hỏi đặt cược, Watson hiển thị câu đáp trên màn hình dành riêng.


Tiến sĩ David Ferrucci và máy tính IBM Watson.

Thật kỳ diệu, Watson đã "bấm nút" cực nhanh, trả lời được phần lớn câu hỏi của chương trình Jeopardy (thường lắt léo và hay chơi chữ), giành chiến thắng vượt trội trong cả ba vòng thi.

*Jeopardy (câu 600 USD, vòng thi 1): Wanted for general evil-ness; last seen at the Tower of Barad-Dur; it's a giant eye, folks, kinda hard to miss (bị truy lùng vì là điển hình của tội ác; được nhìn thấy lần cuối ở tháp Barad-Dur; đó là một con mắt khổng lồ, có lẽ không thể nào nhầm lẫn, thưa các bạn).

Watson (đáp đúng): Sauron (lãnh tụ của thế lực đen tối trong bộ tiểu thuyết "Chúa tể của những chiếc nhẫn").

*Jeopardy (câu 1000 USD, vòng thi 1): Wanted for stealing a loaf of bread in "Les Miserables"; really, really wanted, for other thefts too (bị truy nã vì tội trộm ổ bánh mì trong "Những người khốn khổ"; bị truy nã gắt gao vì những tội trộm khác).

Watson (đáp đúng): Jean Valjean (nhân vật chính trong tiểu thuyết "Những người khốn khổ" của nhà văn Pháp Victor Hugo).

...

*Jeopardy (câu 400 USD, vòng thi 2): An etude is a composition that explores a technical musical problem; the name is French for this (ê-tuýt là khúc nhạc nhằm luyện tập kỹ năng âm nhạc; vì thế mà có tên như vậy trong tiếng Pháp).

Watson (đáp đúng): Study (học tập).

*Jeopardy (câu 1200 USD, vòng thi 2): You just need a little more sun! You don't have this hereditary lack of pigment (anh chỉ cần phơi nắng nhiều hơn chút thôi, chứ anh không có chứng thiếu sắc tố di truyền này).

Watson (đáp đúng): Albinism (chứng bạch tạng).

*Jeopardy (câu 2000 USD, vòng thi 2): It's New Zealand's second-largest city (đó là thành phố lớn thứ nhì của New Zealand).

Watson (đáp đúng): Christchurch.

...

*Jeopardy (câu 200 USD, vòng thi 3): "Rocky II", "III" & "IV".

Watson (đáp đúng): Sylvester Stallone (tác giả kịch bản và diễn viên chính của loạt phim Rocky).

*Jeopardy (câu 1000 USD, vòng thi 3): "A Bronx Tale".

Watson (đáp đúng): Robert De Niro (đạo diễn và diễn viên chính của phim "Chuyện ở quận Bronx").

*Jeopardy (câu 3600 USD, vòng thi 3): Senator Obama attended the 2006 groundbreaking for this man's memorial, 1/2 mile from Lincoln's (năm 2006, Thượng nghị sĩ Obama dự lễ động thổ để xây tượng đài của danh nhân này, cách tượng đài Tổng thống Lincoln nửa dặm).

Watson (đáp đúng): Martin Luther King (mục sư, người lãnh đạo cuộc đấu tranh cho quyền bình đẳng của người Mỹ gốc Phi).

...

*Jeopardy (câu đặt cược, vòng thi 2): Its largest airport is named for a World War II hero; its second largest, for a World War II battle (tên của sân bay lớn nhất của thành phố này là tên của một anh hùng trong Thế Chiến II; tên của sân bay lớn thứ nhì là tên của một trận đánh lớn trong Thế Chiến II).

Watson (đáp sai): Toronto.

Rutter và Jennings (đáp đúng): Chicago (sân bay lớn nhất của Chicago là O' Hare; sân bay lớn thứ nhì là Midway).


Cuộc thi Jeopardy giữa Ken Jennings (trái), máy tính Watson và Brad Rutter (2/2011).

Watson tỏ ra am hiểu nhiều lĩnh vực (văn học, điện ảnh, y học, địa lý, lịch sử,...) và thông thạo đủ loại tin tức. Khi được hỏi về loạt phim Rocky, Watson nêu tên tác giả kịch bản Sylvester Stallone, nhưng khi được hỏi về phim Bronx Tale, Watson không tiếp tục nêu tên tác giả kịch bản, mà lại nêu tên đạo diễn Robert De Niro. Phải chăng Watson biết được hai phim đã nêu có ý nghĩa đặc biệt đối với hai diễn viên phim hành động: Stallone lần đầu tiên viết kịch bản phim và De Niro lần đầu tiên ngồi vào ghế đạo diễn?

Về câu hỏi đặt cược của vòng thi thứ hai, thuộc chủ đề U.S. Cities (các thành phố nước Mỹ), trong khi Rutter và Jennings đều đưa ra đáp án đúng (What is Chicago?) trên màn hình của mình, Watson lại hiển thị lời đáp võ đoán kèm theo nhiều dấu chấm hỏi để diễn tả sự không chắc chắn: What is Toronto?????. Sự "ngớ ngẩn" của Watson (Toronto là thành phố của Canada) khiến khán giả trong trường quay Jeopardy bật cười.


Bảng câu hỏi của cuộc thi Jeopardy (hàng trên cùng cho biết chủ đề câu hỏi).

Ở hàng ghế khán giả, có lẽ chỉ một người hiểu thấu diễn biến trong "bộ não" của Watson: Tiến sĩ David Ferrucci - chuyên gia hàng đầu của IBM về tích hợp hệ thống và phân tích ngữ nghĩa. Ferrucci khởi động dự án Watson vào giữa thập niên 2000.

Năm 1997, máy tính Deep Blue của IBM đánh bại Đại kiện tướng cờ vua Garry Kasparov. Chiến thắng đó đem đến sự ngưỡng mộ của công chúng đối với IBM nhưng không tạo ra lợi nhuận cụ thể vì Deep Blue không có ứng dụng thực tế nào cho hoạt động doanh nghiệp. Những người lãnh đạo IBM mong muốn tạo ra sự kiện truyền hình mới, có tính đột phá về công nghệ, vừa có tác dụng quảng bá mạnh mẽ thương hiệu IBM, vừa tạo nên sản phẩm độc đáo, mang lại lợi nhuận lâu dài. Mục tiêu được chọn là phát triển hệ thống hỏi-đáp (question-answering system) đến mức có thể giành chiến thắng trong trò chơi truyền hình Jeopardy trước những người giỏi nhất trong trò chơi đó!

Hệ thống hỏi-đáp hoạt động dựa trên cơ sở kiến thức của máy tính là hướng nghiên cứu trí tuệ nhân tạo được tiến hành tại IBM và nhiều trường đại học từ thập niên 1960. Đó là hướng nghiên cứu khá trì trệ, tuy có những thành tựu nhất định về mặt khoa học nhưng chưa có ứng dụng thực tiễn.

Lúc đầu, phần lớn chuyên gia của IBM đành... lắc đầu với ý tưởng về máy tính Watson tham dự Jeopardy: chưa có giải thuật nào đủ tinh tế để máy tính hiểu biết ngôn ngữ tự nhiên đến mức có thể tranh đua trong trò chơi Jeopardy. Khác với môn cờ vua có quy tắc rõ ràng, chặt chẽ, những câu hỏi trong Jeopardy rất đa dạng, bao gồm hầu như mọi lĩnh vực kiến thức và thường có ẩn ý. Ngoài ra, máy tính Watson phải tìm cho được lời đáp trong thời gian rất ngắn (thời gian người dẫn chương trình đọc câu hỏi).

Ferrucci chấp nhận nhiệm vụ đầy thách thức do lãnh đạo IBM đề ra. Ông muốn tham gia vào một câu chuyện công nghệ hấp dẫn thay vì tiếp tục cuộc đời nghiên cứu phẳng lặng, nhàm chán. IBM cho Ferrucci thời hạn bốn năm để hoàn thành dự án.

Ferrucci tìm đến những chuyên gia giỏi nhất trong lĩnh vực trí tuệ nhân tạo và nhận được không ít lời từ chối. Ông kể lại: "Có nhiều người từng nghiên cứu vấn đề xử lý ngôn ngữ tự nhiên hơn một thập niên. Tôi hỏi họ rằng liệu họ thích tiêu tốn mười năm nữa để có những kết quả nghiên cứu độc lập và nhận được sự tán thưởng khiêm tốn trong một cộng đồng nhỏ hẹp hay là cùng nhau tạo ra điều gì đó lớn lao? Có vài người đắn đo quyết định tham gia nhưng sau đó rời bỏ nhóm dự án vì cho rằng cả công ty đã hóa điên. Cuối cùng chúng tôi tập hợp được một nhóm nòng cốt gồm 12 nhà khoa học máy tính tài năng. Về sau, nhóm có được 25 thành viên. Lòng can đảm tiến về phía trước của nhóm đã là điều đáng tự hào".

Nhóm dự án Watson gồm những chuyên gia thuộc nhiều lĩnh vực của khoa học máy tính. Mỗi người đều cho rằng "chìa khóa vàng" của vấn đề nằm trong lĩnh vực của mình, giải thuật của mình là hiệu quả nhất. Ferrucci chấp nhận thử nghiệm mọi giải thuật khả dĩ và sử dụng toán học thống kê để đánh giá hiệu quả. Khâu đầu tiên là phân tích ngôn ngữ tự nhiên của câu hỏi đa nghĩa trong Jeopardy để xác định những từ chốt. Khâu thứ hai là sử dụng các từ chốt để tìm kiếm trong cơ sở kiến thức và lọc lựa kết quả tìm kiếm để quyết định câu đáp.

Lần đầu tiên thử nghiệm hệ thống hỏi-đáp với những câu hỏi từng được dùng trong chương trình Jeopardy, Ferrucci thu được kết quả thất vọng: máy tính cho những lời đáp ngờ nghệch đến tức cười và có khi mất đến vài phút để "suy nghĩ". Những quán quân trong trò chơi Jeopardy thường tìm ra lời đáp trong chớp mắt và bấm nút ngay khi được phép.

Máy tính dường như vô phương diễn giải những câu hỏi hóm hỉnh thường xuất hiện trong Jeopardy mà con người có thể nắm bắt cực nhanh. Chẳng hạn, để hỏi về loại nón mà thám tử Sherlock Holmes luôn đội, Jeopardy dùng câu "The name of this hat is elementary, my dear contestant" (tên của loại nón này rất đơn giản, bạn thí sinh thân mến của tôi). Người chơi có thể nhận ra ngay câu hỏi sử dụng cách nói quen thuộc của Holmes: "Elementary, my dear Watson" (điều này rất đơn giản, bạn Watson thân mến của tôi). Sự liên tưởng đến Holmes lập tức cho biết loại nón gắn liền với Holmes. Câu đáp đúng là Deerstalker (nón săn). Kể cả khi tìm kiếm câu "Elementary, my dear Watson" bằng Google, kết quả tìm kiếm dễ dàng cho biết đó là câu nói của Holmes nhưng không hề có từ Deerstalker.

Tuy vậy, tìm kiếm theo kiểu Google là một trong những giải pháp mà nhóm Watson chọn dùng. Thay vì tìm kiếm trong cơ sở kiến thức có cấu trúc như các hệ thống hỏi-đáp truyền thống, nhóm Watson quyết định tạo ra kho kiến thức ở dạng văn bản bình thường (không cấu trúc). Hàng trăm triệu văn bản chứa đựng kiến thức, tin tức trong mọi lĩnh vực được tải xuống máy tính Watson từ mạng. Sau khi xác định được các từ chốt trong câu hỏi, máy tính Watson tìm kiếm các từ chốt đó (và các từ chốt khác thường xuất hiện cùng với từ chốt đang xét). Việc tìm kiếm và lọc lựa được thực hiện đồng thời bởi hàng trăm giải thuật độc lập, cho hàng trăm câu đáp khả dĩ. Câu đáp cuối cùng được quyết định bởi một giải thuật thống kê, xếp hạng.

Từ năm 2006, Ferrucci nhiều lần tổ chức cuộc thi Jeopardy thử nghiệm trong phòng họp tại IBM. Phần lớn những người được mời tranh tài với Watson có thành tích nhất định trong trò chơi Jeopardy. Tất cả phải cam kết không tiết lộ chi tiết về cuộc thử nghiệm. Ferrucci thường ngồi cuối phòng, sau những đồng nghiệp của ông. Những lúc mọi người cười rộ vì câu đáp sai của Watson, Ferrucci cau mày, mím môi, đôi khi giậm chân. Ông hiểu rõ điều gì xảy đến nếu Watson thất bại ở cuộc thi Jeopardy chính thức và trở thành trò cười. Danh tiếng của IBM đè nặng lên Ferrucci.

Khi những người tham dự cuộc thử nghiệm bắt đầu gọi Watson là he (anh ta), Ferrucci hiểu rằng thành công đang đến gần. Và thành công đã đến ngay trong lần xuất hiện đầu tiên của Watson trước khán giả truyền hình.


Ferrucci và hai thí sinh (đại diện cho Đại học Carnegie-Mellon và Đại học Pittsburgh) trong một cuộc thi Jeopardy thử nghiệm.

Nhiều chuyên gia kỳ cựu trong khoa học máy tính không xem Watson là thành tựu mới của lĩnh vực trí tuệ nhân tạo: Watson không có giải thuật nào thực sự mới, Watson chỉ chọn câu đáp dựa vào kết quả thống kê trên khối lượng lớn dữ liệu, chứ không thấu hiểu câu hỏi và câu đáp giống như con người. Có ý kiến cho rằng thắng lợi của Watson là sự kết hợp những thành tựu về phần mềm trong quá khứ và sức mạnh của phần cứng trong hiện tại.

Khi đặt ra thuật ngữ artificial intelligence (trí tuệ nhân tạo) vào năm 1956, nhà khoa học máy tính John McCarthy (vừa mất trong năm 2011) hướng đến sự mô phỏng trí tuệ con người bằng máy tính. Tuy nhiên, trước vô vàn khó khăn khi tìm hiểu hoạt động của não bộ con người, trí tuệ nhân tạo dần dần được hình thành theo cách riêng, từ chính đặc thù của máy tính. Dù công nhận máy tính có trí tuệ hay không, con người chắc chắn sẽ phải tiếp tục nhường công việc trí tuệ ngày càng nhiều cho máy tính.

IBM bắt đầu triển khai hệ thống hỏi-đáp trong nhiều lĩnh vực. Với kiến thức y học sâu rộng và khả năng giải đáp cực nhanh, máy tính Watson sẽ là trợ thủ đắc lực trong chẩn đoán và điều trị. Ferrucci dự đoán trong mười năm tới, máy chủ tại các doanh nghiệp nhỏ sẽ có năng lực trí tuệ như máy tính Watson hiện nay.

Cuộc thi Jeopardy đã qua đi nhưng trước mặt Ferrucci và nhóm của ông vẫn là con đường không có điểm cuối.

Hoàng Ngọc Giao

Ý kiến bạn đọc (0)
Tên   Email

Lên đầu trang