Google ra mắt chip Ironwood mới để tăng tốc ứng dụng AI

Theo dõi Báo Gia Lai trên Google News

(GLO)- Ngày 9-4, trong khuôn khổ hội nghị Cloud Next, Google đã công bố về chip trí tuệ nhân tạo (AI) thế hệ thứ 7 của mình có tên Ironwood. Theo Google, chip này được thiết kế để tăng tốc hiệu suất của các ứng dụng AI.

Ironwood là chip đầu tiên được tối ưu hóa cho suy luận, tức là quá trình vận hành mô hình AI đã được huấn luyện sẵn để đưa ra kết quả hoặc dự đoán từ dữ liệu đầu vào.

Bộ xử lý Ironwood hướng đến loại dữ liệu cần thiết khi người dùng truy vấn phần mềm như ChatGPT của OpenAI. Được biết đến trong ngành công nghệ là điện toán "suy luận", chip thực hiện các phép tính nhanh để đưa ra câu trả lời trong chatbot hoặc tạo ra các loại phản hồi khác.

z6489903010741-31a4731d59719067700f5bc501b200c0.jpg
Ironwood là TPU mạnh mẽ, có khả năng và tiết kiệm năng lượng nhất của Google từ trước đến nay. Ảnh: Internet

Ironwood là kết quả của sự nỗ lực kéo dài gần 1 thập kỷ với trị giá hàng tỷ đô la của Google. Dự kiến ra mắt vào cuối năm 2025 dành cho khách hàng Google Cloud, Ironwood sẽ có 2 cấu hình: cụm gồm 256 chip và cụm lớn hơn với 9.216 chip.

Được biết, Ironwood có hiệu suất gấp đôi về lượng năng lượng cần thiết so với chip Trillium của Google mà hãng này công bố vào năm ngoái. "Ironwood là TPU mạnh mẽ nhất, linh hoạt nhất và tiết kiệm năng lượng nhất của chúng tôi tính đến nay. Nó được thiết kế chuyên biệt để hỗ trợ các mô hình AI suy luận ở quy mô lớn"-ông Amin Vahdat-Phó chủ tịch Google Cloud khẳng định.

Ironwood được thiết kế để tăng tốc hiệu suất của các ứng dụng AI. Ảnh: Internet
Ironwood được thiết kế để tăng tốc hiệu suất của các ứng dụng AI. Ảnh: Internet

Theo các bài kiểm thử nội bộ của Google, Ironwood có thể đạt sức mạnh tính toán ở mức cao nhất là 4.614 TFLOPs (4.614 nghìn tỷ phép toán dấu phẩy động mỗi giây). Mỗi chip có 192 GB RAM chuyên dụng với băng thông lên tới 7,4 Tbps.

Ironwood cũng được trang bị lõi chuyên biệt nâng cao có tên SparseCore, được thiết kế để xử lý các loại dữ liệu phổ biến trong các tác vụ như "xếp hạng nâng cao" và "gợi ý". Kiến trúc của Ironwood được tối ưu để giảm thiểu di chuyển dữ liệu và độ trễ trong chip, từ đó tiết kiệm điện năng.

Cũng theo ông Amin Vahdat, Google có kế hoạch tích hợp Ironwood vào AI Hypercomputer trong tương lai gần.

Trước đó, Google đã giới thiệu Gemini 2.5, dòng mô hình AI mới có khả năng "tạm dừng" để suy nghĩ trước khi phản hồi. Google cho biết tất cả mô hình Gemini mới sẽ mặc định có khả năng suy luận logic.

Hãng cũng triển khai Gemini 2.5 Pro Experimental bản thử nghiệm miễn phí cho tất cả người dùng, với giới hạn số lần sử dụng trong ngày nhằm "đưa mô hình AI thông minh nhất đến tay càng nhiều người dùng, càng sớm càng tốt".

Có thể bạn quan tâm

Hơn 40 nhà khoa học từ 11 quốc gia dự Hội thảo quốc tế về các hệ điện tử tương quan mạnh

Hơn 40 nhà khoa học từ 11 quốc gia dự Hội thảo quốc tế về các hệ điện tử tương quan mạnh

(GLO)- Sáng 1-6, tại Trung tâm Quốc tế Khoa học và Giáo dục liên ngành (ICISE; phường Quy Nhơn Nam, tỉnh Gia Lai), Hội Khoa học Gặp gỡ Việt Nam phối hợp với Viện Vật lý lý thuyết cơ bản (FTPI, Hoa Kỳ) khai mạc Hội thảo quốc tế "Những tiến bộ mới trong nghiên cứu các hệ điện tử tương quan mạnh".

Người dùng ngày càng lo ngại về quyền riêng tư và nguy cơ rò rỉ dữ liệu cá nhân khi sử dụng các ứng dụng nhắn tin phổ biến hiện nay.

Người dùng lo ngại ứng dụng nhắn tin ngày càng kém an toàn

(GLO)- Sự tiện lợi của các ứng dụng nhắn tin đang đi kèm với những lo ngại ngày càng lớn về bảo mật và quyền riêng tư của người dùng. Nhiều nền tảng nhắn tin hiện nay đang bị đặt dấu hỏi về khả năng bảo vệ dữ liệu cá nhân trong bối cảnh tội phạm mạng và lừa đảo công nghệ cao gia tăng mạnh.

null