Người Nga tạo ra mô hình AI thú vị không kém DeepSeek R1

Theo dõi Báo Gia Lai trên Google News

Một phương pháp mới trong việc phát triển mô hình trí tuệ nhân tạo (AI) vừa được các nhà khoa học Nga đưa ra.

Phòng thí nghiệm Yandex Research (Nga), hợp tác với các nhà khoa học từ Viện Công nghệ Massachusetts (MIT, Mỹ), Viện Khoa học và Công nghệ Áo (ISTA) và Đại học Khoa học và Công nghệ Johannes Gutenberg (Đức), vừa công bố một phương pháp mới trong việc phát triển mô hình AI.

HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ
HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ

Có tên gọi Hadamard Incoherence với Gaussian MSE-optimal GridS (HIGGS), phương pháp mới cho phép nén mạng nơ-ron mà không cần dữ liệu bổ sung hay tối ưu hóa tham số phức tạp. Điều này đặc biệt hữu ích trong các tình huống thiếu dữ liệu phù hợp để đào tạo thêm cho mô hình AI. HIGGS mang lại sự cân bằng giữa chất lượng, quy mô mô hình và độ phức tạp trong quá trình lượng tử hóa, giúp các mô hình AI có thể hoạt động trên nhiều thiết bị khác nhau.

Với HIGGS, quá trình thử nghiệm và triển khai các giải pháp AI trở nên nhanh chóng và tiết kiệm chi phí hơn. Giờ đây, người dùng chỉ cần một chiếc smartphone hoặc laptop để làm việc với các mô hình AI, thay vì phải sử dụng máy chủ và bộ tăng tốc đồ họa đắt tiền. Trước đây, việc lượng tử hóa mô hình AI trên các thiết bị cá nhân có thể mất từ vài giờ đến vài tuần, nhưng quá trình này giờ đây chỉ mất vài phút.

Phương pháp HIGGS đã được thử nghiệm trên các mô hình AI phổ biến như Llama 3 và Qwen 2.5, với kết quả cho thấy đây là phương pháp lượng tử hóa hiệu quả nhất về tỷ lệ chất lượng trên kích thước mô hình so với các phương pháp tương tự không cần dữ liệu hiện có.

Hiện tại, HIGGS đã có sẵn cho các nhà phát triển và nhà nghiên cứu trên nền tảng Hugging Face và GitHub. Một bài báo khoa học chi tiết về phương pháp này đã được đăng trên arXiv và được chấp nhận trình bày tại hội nghị AI lớn nhất thế giới NAACL diễn ra từ ngày 29.4 đến 4.5 tại Albuquerque, New Mexico (Mỹ). Bài viết này đã thu hút sự chú ý từ nhiều tổ chức, bao gồm Red Hat AI, Đại học Bắc Kinh và Đại học Khoa học và Công nghệ Hồng Kông.

Theo Kiến Văn (TNO)

Có thể bạn quan tâm

Trung Quốc công bố chip điện toán quang học có tốc độ và hiệu suất gấp 100 lần chip AI của Nvidia

Trung Quốc công bố chip điện toán quang học có tốc độ và hiệu suất gấp 100 lần chip AI của Nvidia

(GLO)- Các nhà khoa học Trung Quốc vừa công bố loại chip điện toán quang học LightGen có tốc độ và hiệu suất năng lượng vượt xa phần cứng AI của Nvidia tới 100 lần. Công nghệ mới này đặc biệt hiệu quả trong các tác vụ tạo sinh như sản xuất video và tổng hợp hình ảnh.

Chỉ mất 1,5 giây để cấy chip vào não người

Chỉ mất 1,5 giây để cấy chip vào não người

(GLO)- Mới đây, Neuralink-Công ty chip não do tỷ phú Elon Musk sáng lập-đã công bố một bước tiến vượt bậc khi rút ngắn thời gian cấy ghép điện cực xuống mức kỷ lục chỉ còn 1,5 giây; đồng thời giảm 95% chi phí sản xuất và mở rộng thử nghiệm cho bệnh nhân.

Hội thảo đánh giá kết quả thực hiện đề án về truy xuất nguồn gốc

Gia Lai: Tiếp tục hoàn thiện cơ chế, hỗ trợ doanh nghiệp ứng dụng hệ thống truy xuất nguồn gốc

(GLO)- Sáng 12-12, Sở Khoa học và Công nghệ tỉnh Gia Lai tổ chức hội thảo đánh giá kết quả thực hiện Đề án triển khai, áp dụng và quản lý hệ thống truy xuất nguồn gốc (Đề án 100) giai đoạn 2020-2025; đồng thời thảo luận định hướng, giải pháp cho giai đoạn 2026-2030.

null