Israel dùng AI giải mã kho bản thảo Do Thái nghìn năm tuổi

Theo dõi Báo Gia Lai trên Google News

Bằng cách huấn luyện mô hình AI để đọc và chép lại các văn bản cổ, các nhà nghiên cứu có thể truy cập, phân tích toàn bộ bộ sưu tập nhanh hơn, tra cứu tên, ghép các mảnh rời thành văn bản hoàn chỉnh.

Các nhà nghiên cứu tại Israel kỳ vọng mở ra những khám phá mới về lịch sử Do Thái nhờ đưa cơ sở dữ liệu số gồm hàng nghìn bản thảo kéo dài suốt một thiên niên kỷ vào một công cụ chép lại văn bản mới sử dụng trí tuệ nhân tạo.

israel-ban-do-thai.jpg
Một nhà nghiên cứu thuộc MiDRASH đang cầm trên tay bản thảo của một tác phẩm aggadic-midrashic gồm chú giải kinh Torah và kể lại các câu chuyện Kinh Thánh Nguồn: Reuters

Cairo Geniza - bộ sưu tập tài liệu Do Thái thời Trung cổ lớn nhất thế giới - đã được giới học thuật nghiên cứu trong suốt hơn một thế kỷ, nhưng mới chỉ một phần nhỏ trong hơn 400.000 tài liệu của bộ sưu tập này được khảo cứu đầy đủ.

Dù toàn bộ Geniza đã được số hóa và đưa lên mạng dưới dạng hình ảnh, phần lớn tài liệu vẫn chưa được lập danh mục, nhiều bản chỉ là những mảnh rời từ các văn bản dài hơn, và chỉ khoảng 10% có bản chép lại.

Bằng cách huấn luyện một mô hình AI để đọc và chép lại các văn bản cổ, các nhà nghiên cứu có thể truy cập và phân tích toàn bộ bộ sưu tập nhanh hơn nhiều, tra cứu tên hoặc từ khóa, đồng thời ghép các mảnh rời thành văn bản hoàn chỉnh.

Daniel Stokl Ben Ezra, một trong các nhà nghiên cứu chủ chốt của dự án chép lại văn bản MiDRASH, cho biết: “Chúng tôi liên tục tìm cách cải thiện khả năng giải mã chữ viết cổ của máy”.

Ông nói thêm dự án đã đạt được những tiến bộ đáng kể và có thể mở rộng khả năng tiếp cận đối với các tài liệu - được viết bằng tiếng Hebrew, Arab, Aramaic và Yiddish với nhiều dạng chữ viết tay khác nhau - cho đông đảo nhà nghiên cứu.

Các bản chép lại từ những bản thảo khó hơn sẽ được các chuyên gia kiểm định, qua đó tiếp tục cải thiện việc huấn luyện AI.

Dự án, được Hội đồng Nghiên cứu châu Âu, tài trợ dựa trên cơ sở dữ liệu số của Thư viện quốc gia Israel về tài liệu Cairo Geniza, tập hợp các chuyên gia từ nhiều trường đại học và viện nghiên cứu.

Geniza là nơi lưu giữ trong giáo đường dành cho các tài liệu quan trọng, vốn sau cùng sẽ được chôn cất theo nghi lễ. Geniza của giáo đường Ben Ezra tại Cairo cổ có điều kiện khô ráo lý tưởng để bảo tồn giấy cổ.

Trong thời Trung cổ, Cairo vượt qua Damascus và Baghdad để trở thành thành phố lớn nhất Trung Đông, trung tâm của thương mại, học thuật và khoa học, đồng thời là nơi cư trú của cộng đồng Do Thái thịnh vượng.

Nhà triết học Do Thái vĩ đại Maimonides - vị sultan Hồi giáo đánh bại quân Thập tự chinh ở Jerusalem - từng cầu nguyện tại giáo đường Ben Ezra khi sinh sống tại Cairo.

Qua các triều đại và đế chế, cộng đồng nơi đây vẫn âm thầm duy trì nhịp sống thường nhật, các giáo sĩ của họ lấp đầy Geniza bằng tranh luận giáo luật, hồ sơ dân sự và vô số tài liệu hành chính, học thuật khác.

Kho tài liệu đồ sộ này-bao gồm cả những bản viết tay của chính Maimonides - được phát hiện vào cuối thế kỷ 19. Dù đã được nghiên cứu hơn 100 năm, quy mô khổng lồ của nó đồng nghĩa với việc vẫn còn nhiều khoảng trống lớn.

Stokl Ben Ezra nhấn mạnh: “Khả năng tái dựng lại - tạo nên một dạng ‘Facebook của thời Trung cổ’ - đang ngay trước mắt chúng ta”./.

Theo Thanh Bình (TTXVN/Vietnam+)

Có thể bạn quan tâm

Chủ tịch Hội Vật lý Hoa Kỳ chia sẻ về sóng tô-pô trong khí quyển và đại dương Trái Đất

Chủ tịch Hội Vật lý Hoa Kỳ chia sẻ về sóng tô-pô trong khí quyển và đại dương Trái Đất

(GLO)- Chiều 18-6, tại Trung tâm Quốc tế Khoa học và Giáo dục liên ngành (ICISE), ông Brad Marston - Chủ tịch Hội Vật lý Hoa Kỳ (APS), Giáo sư Vật lý tại Đại học Brown (Hoa Kỳ) đã có buổi nói chuyện đại chúng với chủ đề “Các loại sóng có nguồn gốc tô-pô trong hệ chất lưu của Trái Đất và xa hơn nữa”.

Danh sách các tên miền .vn hai ký tự chuẩn bị bước vào phiên đấu giá.

76 tên miền đặc biệt “.vn” sắp bước vào đợt đấu giá thứ hai

(GLO)- Trung tâm Internet Việt Nam (VNNIC) cho biết: Từ ngày 24 đến 25-6 sẽ tổ chức đấu giá trực tuyến quyền sử dụng 76 tên miền cấp hai có 2 ký tự dưới tên miền quốc gia “.vn”. Đây là đợt đấu giá thứ 2 trong năm 2026 đối với nhóm tên miền ngắn, đẹp và có giá trị cao trên môi trường Internet.

Doanh nghiệp AI đối mặt với rủi ro pháp lý lớn, đặc biệt là quyền sở hữu trí tuệ.

Việt Nam bảo hộ sản phẩm do AI tạo ra như thế nào?

(GLO)- Sự phát triển của trí tuệ nhân tạo (AI) đang đặt ra nhiều câu hỏi về quyền sở hữu trí tuệ đối với các sản phẩm do công nghệ này tạo ra. Từ tranh vẽ, âm nhạc đến các sáng chế, việc xác định ai là chủ sở hữu hợp pháp vẫn là vấn đề gây tranh luận tại nhiều quốc gia, trong đó có Việt Nam.

null