Israel dùng AI giải mã kho bản thảo Do Thái nghìn năm tuổi

Theo dõi Báo Gia Lai trên Google News

Bằng cách huấn luyện mô hình AI để đọc và chép lại các văn bản cổ, các nhà nghiên cứu có thể truy cập, phân tích toàn bộ bộ sưu tập nhanh hơn, tra cứu tên, ghép các mảnh rời thành văn bản hoàn chỉnh.

Các nhà nghiên cứu tại Israel kỳ vọng mở ra những khám phá mới về lịch sử Do Thái nhờ đưa cơ sở dữ liệu số gồm hàng nghìn bản thảo kéo dài suốt một thiên niên kỷ vào một công cụ chép lại văn bản mới sử dụng trí tuệ nhân tạo.

israel-ban-do-thai.jpg
Một nhà nghiên cứu thuộc MiDRASH đang cầm trên tay bản thảo của một tác phẩm aggadic-midrashic gồm chú giải kinh Torah và kể lại các câu chuyện Kinh Thánh Nguồn: Reuters

Cairo Geniza - bộ sưu tập tài liệu Do Thái thời Trung cổ lớn nhất thế giới - đã được giới học thuật nghiên cứu trong suốt hơn một thế kỷ, nhưng mới chỉ một phần nhỏ trong hơn 400.000 tài liệu của bộ sưu tập này được khảo cứu đầy đủ.

Dù toàn bộ Geniza đã được số hóa và đưa lên mạng dưới dạng hình ảnh, phần lớn tài liệu vẫn chưa được lập danh mục, nhiều bản chỉ là những mảnh rời từ các văn bản dài hơn, và chỉ khoảng 10% có bản chép lại.

Bằng cách huấn luyện một mô hình AI để đọc và chép lại các văn bản cổ, các nhà nghiên cứu có thể truy cập và phân tích toàn bộ bộ sưu tập nhanh hơn nhiều, tra cứu tên hoặc từ khóa, đồng thời ghép các mảnh rời thành văn bản hoàn chỉnh.

Daniel Stokl Ben Ezra, một trong các nhà nghiên cứu chủ chốt của dự án chép lại văn bản MiDRASH, cho biết: “Chúng tôi liên tục tìm cách cải thiện khả năng giải mã chữ viết cổ của máy”.

Ông nói thêm dự án đã đạt được những tiến bộ đáng kể và có thể mở rộng khả năng tiếp cận đối với các tài liệu - được viết bằng tiếng Hebrew, Arab, Aramaic và Yiddish với nhiều dạng chữ viết tay khác nhau - cho đông đảo nhà nghiên cứu.

Các bản chép lại từ những bản thảo khó hơn sẽ được các chuyên gia kiểm định, qua đó tiếp tục cải thiện việc huấn luyện AI.

Dự án, được Hội đồng Nghiên cứu châu Âu, tài trợ dựa trên cơ sở dữ liệu số của Thư viện quốc gia Israel về tài liệu Cairo Geniza, tập hợp các chuyên gia từ nhiều trường đại học và viện nghiên cứu.

Geniza là nơi lưu giữ trong giáo đường dành cho các tài liệu quan trọng, vốn sau cùng sẽ được chôn cất theo nghi lễ. Geniza của giáo đường Ben Ezra tại Cairo cổ có điều kiện khô ráo lý tưởng để bảo tồn giấy cổ.

Trong thời Trung cổ, Cairo vượt qua Damascus và Baghdad để trở thành thành phố lớn nhất Trung Đông, trung tâm của thương mại, học thuật và khoa học, đồng thời là nơi cư trú của cộng đồng Do Thái thịnh vượng.

Nhà triết học Do Thái vĩ đại Maimonides - vị sultan Hồi giáo đánh bại quân Thập tự chinh ở Jerusalem - từng cầu nguyện tại giáo đường Ben Ezra khi sinh sống tại Cairo.

Qua các triều đại và đế chế, cộng đồng nơi đây vẫn âm thầm duy trì nhịp sống thường nhật, các giáo sĩ của họ lấp đầy Geniza bằng tranh luận giáo luật, hồ sơ dân sự và vô số tài liệu hành chính, học thuật khác.

Kho tài liệu đồ sộ này-bao gồm cả những bản viết tay của chính Maimonides - được phát hiện vào cuối thế kỷ 19. Dù đã được nghiên cứu hơn 100 năm, quy mô khổng lồ của nó đồng nghĩa với việc vẫn còn nhiều khoảng trống lớn.

Stokl Ben Ezra nhấn mạnh: “Khả năng tái dựng lại - tạo nên một dạng ‘Facebook của thời Trung cổ’ - đang ngay trước mắt chúng ta”./.

Theo Thanh Bình (TTXVN/Vietnam+)

Có thể bạn quan tâm

Hơn 40 nhà khoa học từ 11 quốc gia dự Hội thảo quốc tế về các hệ điện tử tương quan mạnh

Hơn 40 nhà khoa học từ 11 quốc gia dự Hội thảo quốc tế về các hệ điện tử tương quan mạnh

(GLO)- Sáng 1-6, tại Trung tâm Quốc tế Khoa học và Giáo dục liên ngành (ICISE; phường Quy Nhơn Nam, tỉnh Gia Lai), Hội Khoa học Gặp gỡ Việt Nam phối hợp với Viện Vật lý lý thuyết cơ bản (FTPI, Hoa Kỳ) khai mạc Hội thảo quốc tế "Những tiến bộ mới trong nghiên cứu các hệ điện tử tương quan mạnh".

Người dùng ngày càng lo ngại về quyền riêng tư và nguy cơ rò rỉ dữ liệu cá nhân khi sử dụng các ứng dụng nhắn tin phổ biến hiện nay.

Người dùng lo ngại ứng dụng nhắn tin ngày càng kém an toàn

(GLO)- Sự tiện lợi của các ứng dụng nhắn tin đang đi kèm với những lo ngại ngày càng lớn về bảo mật và quyền riêng tư của người dùng. Nhiều nền tảng nhắn tin hiện nay đang bị đặt dấu hỏi về khả năng bảo vệ dữ liệu cá nhân trong bối cảnh tội phạm mạng và lừa đảo công nghệ cao gia tăng mạnh.

TikTok hợp tác với Universal Music Group gỡ bỏ nhạc AI trái phép.

TikTok siết kiểm soát nhạc AI trái phép

(GLO)- Mạng xã hội video ngắn TikTok vừa đạt thỏa thuận mới với “ông lớn” ngành âm nhạc Universal Music Group (UMG), trong đó đáng chú ý là cam kết gỡ bỏ các nội dung âm nhạc do trí tuệ nhân tạo (AI) tạo ra trái phép trên nền tảng.

null