Người Nga tạo ra mô hình AI thú vị không kém DeepSeek R1

Theo dõi Báo Gia Lai trên Google News

Một phương pháp mới trong việc phát triển mô hình trí tuệ nhân tạo (AI) vừa được các nhà khoa học Nga đưa ra.

Phòng thí nghiệm Yandex Research (Nga), hợp tác với các nhà khoa học từ Viện Công nghệ Massachusetts (MIT, Mỹ), Viện Khoa học và Công nghệ Áo (ISTA) và Đại học Khoa học và Công nghệ Johannes Gutenberg (Đức), vừa công bố một phương pháp mới trong việc phát triển mô hình AI.

HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ
HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ

Có tên gọi Hadamard Incoherence với Gaussian MSE-optimal GridS (HIGGS), phương pháp mới cho phép nén mạng nơ-ron mà không cần dữ liệu bổ sung hay tối ưu hóa tham số phức tạp. Điều này đặc biệt hữu ích trong các tình huống thiếu dữ liệu phù hợp để đào tạo thêm cho mô hình AI. HIGGS mang lại sự cân bằng giữa chất lượng, quy mô mô hình và độ phức tạp trong quá trình lượng tử hóa, giúp các mô hình AI có thể hoạt động trên nhiều thiết bị khác nhau.

Với HIGGS, quá trình thử nghiệm và triển khai các giải pháp AI trở nên nhanh chóng và tiết kiệm chi phí hơn. Giờ đây, người dùng chỉ cần một chiếc smartphone hoặc laptop để làm việc với các mô hình AI, thay vì phải sử dụng máy chủ và bộ tăng tốc đồ họa đắt tiền. Trước đây, việc lượng tử hóa mô hình AI trên các thiết bị cá nhân có thể mất từ vài giờ đến vài tuần, nhưng quá trình này giờ đây chỉ mất vài phút.

Phương pháp HIGGS đã được thử nghiệm trên các mô hình AI phổ biến như Llama 3 và Qwen 2.5, với kết quả cho thấy đây là phương pháp lượng tử hóa hiệu quả nhất về tỷ lệ chất lượng trên kích thước mô hình so với các phương pháp tương tự không cần dữ liệu hiện có.

Hiện tại, HIGGS đã có sẵn cho các nhà phát triển và nhà nghiên cứu trên nền tảng Hugging Face và GitHub. Một bài báo khoa học chi tiết về phương pháp này đã được đăng trên arXiv và được chấp nhận trình bày tại hội nghị AI lớn nhất thế giới NAACL diễn ra từ ngày 29.4 đến 4.5 tại Albuquerque, New Mexico (Mỹ). Bài viết này đã thu hút sự chú ý từ nhiều tổ chức, bao gồm Red Hat AI, Đại học Bắc Kinh và Đại học Khoa học và Công nghệ Hồng Kông.

Theo Kiến Văn (TNO)

Có thể bạn quan tâm

OpenAI “bắt tay” với Broadcom sản xuất chip AI

OpenAI “bắt tay” với Broadcom sản xuất chip AI

(GLO)- OpenAI sẽ “bắt tay” hợp tác với Tập đoàn bán dẫn Broadcom (Mỹ) sản xuất hàng loạt chip trí tuệ nhân tạo (AI) của riêng mình từ năm 2025. Đây được xem là nỗ lực đáp ứng nhu cầu tính toán khổng lồ và giảm sự phụ thuộc vào nhà cung cấp GPU Nvidia.

Bệnh viện Phong - Da liễu Trung ương Quy Hòa nhận tài trợ chuyển đổi số từ VietinBank

Bệnh viện Phong - Da liễu Trung ương Quy Hòa nhận tài trợ chuyển đổi số từ VietinBank

(GLO)-Ngày 28-8, Ngân hàng TMCP Công Thương Việt Nam (Vietinbank) - Chi nhánh khu công nghiệp Phú Tài tặng hệ thống phần mềm thanh toán viện phí trực tuyến; hệ thống phần mềm đăng ký khám bệnh; thiết bị Kiosk TAG, phần mềm tiếp đón bệnh nhân tự động cho Bệnh viện Phong - Da liễu Trung ương Quy Hòa.

Từ 'trái tim' đến con người

Từ 'trái tim' đến con người

Vừa được khai trương trên khu đất rộng 20 ha, Trung tâm dữ liệu quốc gia số 1 do Bộ Công an xây dựng là một trong những trung tâm dữ liệu có quy mô lớn nhất Đông Nam Á, đạt chứng chỉ quốc tế với cấp độ cao nhất.

Khai mạc Thế vận hội robot hình người đầu tiên trên thế giới tại Bắc Kinh

Khai mạc Thế vận hội robot hình người đầu tiên trên thế giới tại Bắc Kinh

(GLO)- Tối 14-8, lễ khai mạc Thế vận hội robot hình người thế giới lần thứ nhất diễn ra tại Bắc Kinh (Trung Quốc) với các màn trình diễn hip-hop, võ thuật, chơi đàn và thời trang của các robot hình người. Nhiều robot cũng tham gia mô phỏng thi đấu thể thao như tại một sự kiện thực thụ.

null