Trí tuệ nhân tạo vẫn chưa có khả năng suy luận như con người

24/11/2020 13:16

Bài kiểm tra đánh giá trình độ ngôn ngữ tại Đại học Nam California cho thấy trí tuệ nhân tạo (AI) chưa thể soạn những câu văn hợp lý và đúng ngữ cảnh, theo Techxplore.

Khả năng vận dụng ngôn ngữ của AI còn nhiều thiếu sót ẢNH: GETTY IMAGES

Xử lý ngôn ngữ tự nhiên (Natural language processing - NLP) là một nhánh quan trọng của ngành trí tuệ nhân tạo, tập trung vào việc nghiên cứu tương tác giữa máy tính và ngôn ngữ tự nhiên của con người, với mục tiêu giúp máy tính có thể thực hiện những nhiệm vụ liên quan đến ngôn ngữ.

Trong bài báo công bố vào ngày 16.11 tại hội nghị Phát hiện Phương pháp Thực nghiệm trong Xử lý Ngôn ngữ Tự nhiên (Findings of Empirical Methods in Natural Language Processing - EMNLP), trợ lý giáo sư Xiang Ren và học trò Yuchen Lin trình bày thử nghiệm mới nhất của họ trong lĩnh vực NLP. Hai thầy trò đưa ra một loạt danh từ và động từ rồi giao cho máy tính soạn những câu mô tả tình huống hằng ngày. Chẳng hạn, với tập hợp từ "chó", "đĩa", "ném", "bắt", máy tính đặt câu: “hai con chó ném đĩa vào nhau”. Sau nhiều lần thử nghiệm, Xiang Ren và học trò nhận thấy rằng các câu mà máy tính tạo ra đều đúng ngữ pháp nhưng sai logic.

So sánh kết quả đặt câu giữa con người và máy tính. Những câu máy tính đặt là: "Con chó ném đĩa vào cầu thủ bóng đá", "Hai con chó ném đĩa vào nhau", "Một con chó ném đĩa và một con chó khác bắt đĩa"... ẢNH: CHỤP MÀN HÌNH

Bài kiểm tra này dựa trên giả định rằng trí tuệ nhân tạo vẫn chưa nắm vững những ý niệm thông thường như người ném đĩa và chó bắt đĩa. Mặt khác, một người có khả năng suy luận bình thường sẽ biết rằng hai con chó không thể ném đĩa vào nhau.

Yuchen Lin nhận định: "Robot cần hiểu các kịch bản tự nhiên trong cuộc sống hằng ngày trước khi thực hiện những hành động tương tác với con người. Con người có được khả năng đặt câu nhờ hiểu và ứng dụng các khái niệm mà họ nhận ra trong môi trường xung quanh. Khi AI đạt được khả năng này thì đây sẽ là một cột mốc quan trọng trong sự phát triển của nhân loại. Nhưng chúng tôi muốn kiểm tra xem máy tính có thể đạt được khả năng suy luận phổ quát hay không".

Hiện giờ AI đã có thể viết báo nhưng Yuchen Lin cho rằng chúng chỉ bắt chước từ những gì đã học. Nói cách khác, khả năng suy luận còn quan trọng hơn kiến thức về ngôn ngữ. Nếu không có khả năng suy luận, rất dễ xảy ra những tình huống như chủ nhân yêu cầu robot lấy sữa nóng nhưng robot không hiểu nên lấy một cốc sữa hay cả hộp sữa.

Những bài báo và kiểm tra trắc nghiệm trước đó chưa phản ánh toàn diện khả năng của AI ẢNH: GETTY IMAGES

Hai thầy trò đã tạo chương trình CommonGen để kiểm tra nhiều mô hình máy tính khác nhau. CommonGen tích hợp một tập dữ liệu gồm 35.141 khái niệm, có thể tạo ra 77.449 câu. Ngay cả mô hình ngôn ngữ hoạt động tốt nhất cũng chỉ đạt tỉ lệ chính xác là 31,6%, trong khi đó tỉ lệ này ở con người lên đến 63,5%. Xiang Ren và Yuchen Lin mong rằng chương trình của họ sẽ hỗ trợ các nghiên cứu liên quan đến NLP trong tương lai.

Bộ đôi cũng cho rằng những bài kiểm tra của các nhà nghiên cứu đi trước chủ yếu là làm trắc nghiệm nên không đủ độ khó đối với máy tính. Ví dụ, khi họ đặt câu hỏi là "Người lớn dùng keo dính ở đâu?" với ba đáp án A: phòng học, B: văn phòng, C: ngăn bàn thì các máy tính đều dễ dàng chọn đúng đáp án B. Còn các bài kiểm tra của CommonGen thì đòi hỏi khả năng suy luận phức tạp hơn.

"Bằng cách giới thiệu khả năng suy luận và kiến thức chuyên sâu cho máy tính, tôi tin rằng một ngày nào đó chúng ta sẽ thấy các AI như Samantha trong bộ phim Her, có thể phản ứng và tương tác với chúng ta một cách tự nhiên", Yuchen Lin chia sẻ.

Theo Mai Anh (Thanh Niên)

Đánh giá bài viết

Việt Nam yêu cầu chặn Telegram do không hợp tác xử lý vi phạm

31 quốc gia đã, đang điều tra, cấm, hạn chế sử dụng Telegram. (Ảnh: Tass)

Những quốc gia nào từng cấm Telegram?

Gia Lai: Đề xuất công bố, đăng tải danh mục các bài toán lớn về KH-CN, đổi mới sáng tạo và chuyển đổi số

Đẩy mạnh triển khai bệnh án điện tử

'Cán đích' ở vị trí thứ ba, VNPT tỏa sáng tại Giải Vô địch An ninh mạng quốc tế

32 đội dự thi Vòng chung kết cuộc thi Sáng tạo Robot Việt Nam - Robocon 2025

Giới trẻ bùng nổ trào lưu chỉnh ảnh AI trên One UI 7

Mỹ cảnh báo phần mềm độc hại từ hàng triệu thiết bị Trung Quốc

Amazon thử nghiệm robot hình người trong dịch vụ giao hàng

6 mẹo hay giúp 'thổi bay' phiền nhiễu khi xem YouTube

Tin địa phương

Giá cả thị trường

Nông sản

Giá cà phê	Giá trung bình	Thay đổi
Đắk Lắk		-1,700
Lâm Đồng		-1,500
Gia Lai		-1,800
Đắk Nông		-1,700
Giá tiêu	142,000	-2,000
USD/VND	25,851	0
Theo:	giacaphe.com

Ngoại tệ

Giá vàng

Thông tin quảng cáo

Công ty TNHH một thành viên Cao su Chư Sê: Thông báo

Nhà hàng tiệc cưới lưu động Tuấn Anh chuyên tổ chức tiệc lưu động trọn gói

Cảng Hàng không Pleiku thông báo mời chào giá

Chi nhánh Văn phòng đăng ký đất đai huyện Chư Sê thông báo về làm thủ tục cấp giấy CNQSDĐ

VietinBank Chi nhánh Gia Lai thông báo mời chào hàng Gói thuê dịch vụ bảo vệ trụ sở làm việc

VietinBank Chi nhánh Gia Lai mời chào hàng Gói thuê dịch vụ bảo vệ trụ sở làm việc

Peltier - công nghệ làm mát thế hệ mới

(GLO)- Tập đoàn điện tử Samsung Electronics vừa công bố công nghệ làm lạnh thế hệ tiếp theo, mang tính đột phá, có khả năng loại bỏ nhu cầu sử dụng chất làm lạnh hóa học, mở ra cánh cửa cho các ứng dụng thương mại tiềm năng trong hệ thống làm mát thân thiện với môi trường.

Mỹ xây dựng siêu máy tính Doudna để thúc đẩy nghiên cứu AI và gene học

Doudna không chỉ nhằm giải quyết các bài toán AI phức tạp, mà còn phục vụ các nghiên cứu đòi hỏi sức mạnh tính toán khổng lồ, đặc biệt trong lĩnh vực genomics - nghiên cứu bộ gene người và sinh vật.

Gia Lai: Đề xuất công bố, đăng tải danh mục các bài toán lớn về KH-CN, đổi mới sáng tạo và chuyển đổi số

(GLO)- Sở Khoa học và Công nghệ (KH-CN) tỉnh Gia Lai vừa có Công văn số 721/SKHCN-KHTC đề xuất công bố, đăng tải danh mục các bài toán lớn về KH-CN, đổi mới sáng tạo và chuyển đổi số (CĐS) trên địa bàn tỉnh năm 2025 lên Cổng thông tin điện tử của tỉnh.

Rủi ro lừa đảo trực tuyến từ các chương trình giải trí Gen Z yêu thích

Tội phạm mạng đang ngày càng đẩy mạnh các mánh khóe lừa đảo, lợi dụng sự yêu thích của Gen Z đối với anime - từ Naruto đến Attack on Titan (Đại Chiến Titan) - và các nội dung giải trí phổ biến khác.