Người Nga tạo ra mô hình AI thú vị không kém DeepSeek R1

Theo dõi Báo Gia Lai trên Google News

Một phương pháp mới trong việc phát triển mô hình trí tuệ nhân tạo (AI) vừa được các nhà khoa học Nga đưa ra.

Phòng thí nghiệm Yandex Research (Nga), hợp tác với các nhà khoa học từ Viện Công nghệ Massachusetts (MIT, Mỹ), Viện Khoa học và Công nghệ Áo (ISTA) và Đại học Khoa học và Công nghệ Johannes Gutenberg (Đức), vừa công bố một phương pháp mới trong việc phát triển mô hình AI.

HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ
HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ

Có tên gọi Hadamard Incoherence với Gaussian MSE-optimal GridS (HIGGS), phương pháp mới cho phép nén mạng nơ-ron mà không cần dữ liệu bổ sung hay tối ưu hóa tham số phức tạp. Điều này đặc biệt hữu ích trong các tình huống thiếu dữ liệu phù hợp để đào tạo thêm cho mô hình AI. HIGGS mang lại sự cân bằng giữa chất lượng, quy mô mô hình và độ phức tạp trong quá trình lượng tử hóa, giúp các mô hình AI có thể hoạt động trên nhiều thiết bị khác nhau.

Với HIGGS, quá trình thử nghiệm và triển khai các giải pháp AI trở nên nhanh chóng và tiết kiệm chi phí hơn. Giờ đây, người dùng chỉ cần một chiếc smartphone hoặc laptop để làm việc với các mô hình AI, thay vì phải sử dụng máy chủ và bộ tăng tốc đồ họa đắt tiền. Trước đây, việc lượng tử hóa mô hình AI trên các thiết bị cá nhân có thể mất từ vài giờ đến vài tuần, nhưng quá trình này giờ đây chỉ mất vài phút.

Phương pháp HIGGS đã được thử nghiệm trên các mô hình AI phổ biến như Llama 3 và Qwen 2.5, với kết quả cho thấy đây là phương pháp lượng tử hóa hiệu quả nhất về tỷ lệ chất lượng trên kích thước mô hình so với các phương pháp tương tự không cần dữ liệu hiện có.

Hiện tại, HIGGS đã có sẵn cho các nhà phát triển và nhà nghiên cứu trên nền tảng Hugging Face và GitHub. Một bài báo khoa học chi tiết về phương pháp này đã được đăng trên arXiv và được chấp nhận trình bày tại hội nghị AI lớn nhất thế giới NAACL diễn ra từ ngày 29.4 đến 4.5 tại Albuquerque, New Mexico (Mỹ). Bài viết này đã thu hút sự chú ý từ nhiều tổ chức, bao gồm Red Hat AI, Đại học Bắc Kinh và Đại học Khoa học và Công nghệ Hồng Kông.

Theo Kiến Văn (TNO)

Có thể bạn quan tâm

Hơn 40 nhà khoa học từ 11 quốc gia dự Hội thảo quốc tế về các hệ điện tử tương quan mạnh

Hơn 40 nhà khoa học từ 11 quốc gia dự Hội thảo quốc tế về các hệ điện tử tương quan mạnh

(GLO)- Sáng 1-6, tại Trung tâm Quốc tế Khoa học và Giáo dục liên ngành (ICISE; phường Quy Nhơn Nam, tỉnh Gia Lai), Hội Khoa học Gặp gỡ Việt Nam phối hợp với Viện Vật lý lý thuyết cơ bản (FTPI, Hoa Kỳ) khai mạc Hội thảo quốc tế "Những tiến bộ mới trong nghiên cứu các hệ điện tử tương quan mạnh".

Người dùng ngày càng lo ngại về quyền riêng tư và nguy cơ rò rỉ dữ liệu cá nhân khi sử dụng các ứng dụng nhắn tin phổ biến hiện nay.

Người dùng lo ngại ứng dụng nhắn tin ngày càng kém an toàn

(GLO)- Sự tiện lợi của các ứng dụng nhắn tin đang đi kèm với những lo ngại ngày càng lớn về bảo mật và quyền riêng tư của người dùng. Nhiều nền tảng nhắn tin hiện nay đang bị đặt dấu hỏi về khả năng bảo vệ dữ liệu cá nhân trong bối cảnh tội phạm mạng và lừa đảo công nghệ cao gia tăng mạnh.

TikTok hợp tác với Universal Music Group gỡ bỏ nhạc AI trái phép.

TikTok siết kiểm soát nhạc AI trái phép

(GLO)- Mạng xã hội video ngắn TikTok vừa đạt thỏa thuận mới với “ông lớn” ngành âm nhạc Universal Music Group (UMG), trong đó đáng chú ý là cam kết gỡ bỏ các nội dung âm nhạc do trí tuệ nhân tạo (AI) tạo ra trái phép trên nền tảng.

null