Người Nga tạo ra mô hình AI thú vị không kém DeepSeek R1

Theo dõi Báo Gia Lai trên Google News

Một phương pháp mới trong việc phát triển mô hình trí tuệ nhân tạo (AI) vừa được các nhà khoa học Nga đưa ra.

Phòng thí nghiệm Yandex Research (Nga), hợp tác với các nhà khoa học từ Viện Công nghệ Massachusetts (MIT, Mỹ), Viện Khoa học và Công nghệ Áo (ISTA) và Đại học Khoa học và Công nghệ Johannes Gutenberg (Đức), vừa công bố một phương pháp mới trong việc phát triển mô hình AI.

HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ
HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ

Có tên gọi Hadamard Incoherence với Gaussian MSE-optimal GridS (HIGGS), phương pháp mới cho phép nén mạng nơ-ron mà không cần dữ liệu bổ sung hay tối ưu hóa tham số phức tạp. Điều này đặc biệt hữu ích trong các tình huống thiếu dữ liệu phù hợp để đào tạo thêm cho mô hình AI. HIGGS mang lại sự cân bằng giữa chất lượng, quy mô mô hình và độ phức tạp trong quá trình lượng tử hóa, giúp các mô hình AI có thể hoạt động trên nhiều thiết bị khác nhau.

Với HIGGS, quá trình thử nghiệm và triển khai các giải pháp AI trở nên nhanh chóng và tiết kiệm chi phí hơn. Giờ đây, người dùng chỉ cần một chiếc smartphone hoặc laptop để làm việc với các mô hình AI, thay vì phải sử dụng máy chủ và bộ tăng tốc đồ họa đắt tiền. Trước đây, việc lượng tử hóa mô hình AI trên các thiết bị cá nhân có thể mất từ vài giờ đến vài tuần, nhưng quá trình này giờ đây chỉ mất vài phút.

Phương pháp HIGGS đã được thử nghiệm trên các mô hình AI phổ biến như Llama 3 và Qwen 2.5, với kết quả cho thấy đây là phương pháp lượng tử hóa hiệu quả nhất về tỷ lệ chất lượng trên kích thước mô hình so với các phương pháp tương tự không cần dữ liệu hiện có.

Hiện tại, HIGGS đã có sẵn cho các nhà phát triển và nhà nghiên cứu trên nền tảng Hugging Face và GitHub. Một bài báo khoa học chi tiết về phương pháp này đã được đăng trên arXiv và được chấp nhận trình bày tại hội nghị AI lớn nhất thế giới NAACL diễn ra từ ngày 29.4 đến 4.5 tại Albuquerque, New Mexico (Mỹ). Bài viết này đã thu hút sự chú ý từ nhiều tổ chức, bao gồm Red Hat AI, Đại học Bắc Kinh và Đại học Khoa học và Công nghệ Hồng Kông.

Theo Kiến Văn (TNO)

Có thể bạn quan tâm

Chủ tịch Hội Vật lý Hoa Kỳ chia sẻ về sóng tô-pô trong khí quyển và đại dương Trái Đất

Chủ tịch Hội Vật lý Hoa Kỳ chia sẻ về sóng tô-pô trong khí quyển và đại dương Trái Đất

(GLO)- Chiều 18-6, tại Trung tâm Quốc tế Khoa học và Giáo dục liên ngành (ICISE), ông Brad Marston - Chủ tịch Hội Vật lý Hoa Kỳ (APS), Giáo sư Vật lý tại Đại học Brown (Hoa Kỳ) đã có buổi nói chuyện đại chúng với chủ đề “Các loại sóng có nguồn gốc tô-pô trong hệ chất lưu của Trái Đất và xa hơn nữa”.

Các công cụ AI ngày càng hiểu con người, nhưng nhân loại lại dần mù mờ trước cách AI hoạt động.

Cảnh báo AI đang tiến hóa vượt ngoài tầm hiểu biết của con người

(GLO)- Các chuyên gia công nghệ hàng đầu thế giới vừa đưa ra cảnh báo về tốc độ phát triển của trí tuệ nhân tạo (AI), công nghệ này đang tiến gần đến ngưỡng mà con người không còn thực sự hiểu rõ cách nó vận hành, trong khi AI ngày càng hiểu sâu hơn về hành vi, tâm lý và động cơ của con người.

Danh sách các tên miền .vn hai ký tự chuẩn bị bước vào phiên đấu giá.

76 tên miền đặc biệt “.vn” sắp bước vào đợt đấu giá thứ hai

(GLO)- Trung tâm Internet Việt Nam (VNNIC) cho biết: Từ ngày 24 đến 25-6 sẽ tổ chức đấu giá trực tuyến quyền sử dụng 76 tên miền cấp hai có 2 ký tự dưới tên miền quốc gia “.vn”. Đây là đợt đấu giá thứ 2 trong năm 2026 đối với nhóm tên miền ngắn, đẹp và có giá trị cao trên môi trường Internet.

Doanh nghiệp AI đối mặt với rủi ro pháp lý lớn, đặc biệt là quyền sở hữu trí tuệ.

Việt Nam bảo hộ sản phẩm do AI tạo ra như thế nào?

(GLO)- Sự phát triển của trí tuệ nhân tạo (AI) đang đặt ra nhiều câu hỏi về quyền sở hữu trí tuệ đối với các sản phẩm do công nghệ này tạo ra. Từ tranh vẽ, âm nhạc đến các sáng chế, việc xác định ai là chủ sở hữu hợp pháp vẫn là vấn đề gây tranh luận tại nhiều quốc gia, trong đó có Việt Nam.

null