Người Nga tạo ra mô hình AI thú vị không kém DeepSeek R1

Theo dõi Báo Gia Lai trên Google News

Một phương pháp mới trong việc phát triển mô hình trí tuệ nhân tạo (AI) vừa được các nhà khoa học Nga đưa ra.

Phòng thí nghiệm Yandex Research (Nga), hợp tác với các nhà khoa học từ Viện Công nghệ Massachusetts (MIT, Mỹ), Viện Khoa học và Công nghệ Áo (ISTA) và Đại học Khoa học và Công nghệ Johannes Gutenberg (Đức), vừa công bố một phương pháp mới trong việc phát triển mô hình AI.

HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ
HIGGS yêu cầu sức mạnh hoạt động không quá mạnh mẽ

Có tên gọi Hadamard Incoherence với Gaussian MSE-optimal GridS (HIGGS), phương pháp mới cho phép nén mạng nơ-ron mà không cần dữ liệu bổ sung hay tối ưu hóa tham số phức tạp. Điều này đặc biệt hữu ích trong các tình huống thiếu dữ liệu phù hợp để đào tạo thêm cho mô hình AI. HIGGS mang lại sự cân bằng giữa chất lượng, quy mô mô hình và độ phức tạp trong quá trình lượng tử hóa, giúp các mô hình AI có thể hoạt động trên nhiều thiết bị khác nhau.

Với HIGGS, quá trình thử nghiệm và triển khai các giải pháp AI trở nên nhanh chóng và tiết kiệm chi phí hơn. Giờ đây, người dùng chỉ cần một chiếc smartphone hoặc laptop để làm việc với các mô hình AI, thay vì phải sử dụng máy chủ và bộ tăng tốc đồ họa đắt tiền. Trước đây, việc lượng tử hóa mô hình AI trên các thiết bị cá nhân có thể mất từ vài giờ đến vài tuần, nhưng quá trình này giờ đây chỉ mất vài phút.

Phương pháp HIGGS đã được thử nghiệm trên các mô hình AI phổ biến như Llama 3 và Qwen 2.5, với kết quả cho thấy đây là phương pháp lượng tử hóa hiệu quả nhất về tỷ lệ chất lượng trên kích thước mô hình so với các phương pháp tương tự không cần dữ liệu hiện có.

Hiện tại, HIGGS đã có sẵn cho các nhà phát triển và nhà nghiên cứu trên nền tảng Hugging Face và GitHub. Một bài báo khoa học chi tiết về phương pháp này đã được đăng trên arXiv và được chấp nhận trình bày tại hội nghị AI lớn nhất thế giới NAACL diễn ra từ ngày 29.4 đến 4.5 tại Albuquerque, New Mexico (Mỹ). Bài viết này đã thu hút sự chú ý từ nhiều tổ chức, bao gồm Red Hat AI, Đại học Bắc Kinh và Đại học Khoa học và Công nghệ Hồng Kông.

Theo Kiến Văn (TNO)

Có thể bạn quan tâm

Sáng tạo gắn với thực tiễn đào tạo

Sáng tạo gắn với thực tiễn đào tạo

(GLO)- Gần 17 năm gắn bó với Trường Cao đẳng Kỹ thuật Công nghệ Quy Nhơn, thầy Lê Tấn Hòa (SN 1985, giảng viên Khoa Điện tử - Tin học) không ngừng nghiên cứu, sáng tạo các mô hình, thiết bị đào tạo từ chính nhu cầu thực tiễn của giảng đường.

Chủ tịch Hội Vật lý Hoa Kỳ chia sẻ về sóng tô-pô trong khí quyển và đại dương Trái Đất

Chủ tịch Hội Vật lý Hoa Kỳ chia sẻ về sóng tô-pô trong khí quyển và đại dương Trái Đất

(GLO)- Chiều 18-6, tại Trung tâm Quốc tế Khoa học và Giáo dục liên ngành (ICISE), ông Brad Marston - Chủ tịch Hội Vật lý Hoa Kỳ (APS), Giáo sư Vật lý tại Đại học Brown (Hoa Kỳ) đã có buổi nói chuyện đại chúng với chủ đề “Các loại sóng có nguồn gốc tô-pô trong hệ chất lưu của Trái Đất và xa hơn nữa”.

Các công cụ AI ngày càng hiểu con người, nhưng nhân loại lại dần mù mờ trước cách AI hoạt động.

Cảnh báo AI đang tiến hóa vượt ngoài tầm hiểu biết của con người

(GLO)- Các chuyên gia công nghệ hàng đầu thế giới vừa đưa ra cảnh báo về tốc độ phát triển của trí tuệ nhân tạo (AI), công nghệ này đang tiến gần đến ngưỡng mà con người không còn thực sự hiểu rõ cách nó vận hành, trong khi AI ngày càng hiểu sâu hơn về hành vi, tâm lý và động cơ của con người.

null