Ironwood là chip đầu tiên được tối ưu hóa cho suy luận, tức là quá trình vận hành mô hình AI đã được huấn luyện sẵn để đưa ra kết quả hoặc dự đoán từ dữ liệu đầu vào.
Bộ xử lý Ironwood hướng đến loại dữ liệu cần thiết khi người dùng truy vấn phần mềm như ChatGPT của OpenAI. Được biết đến trong ngành công nghệ là điện toán "suy luận", chip thực hiện các phép tính nhanh để đưa ra câu trả lời trong chatbot hoặc tạo ra các loại phản hồi khác.

Ironwood là kết quả của sự nỗ lực kéo dài gần 1 thập kỷ với trị giá hàng tỷ đô la của Google. Dự kiến ra mắt vào cuối năm 2025 dành cho khách hàng Google Cloud, Ironwood sẽ có 2 cấu hình: cụm gồm 256 chip và cụm lớn hơn với 9.216 chip.
Được biết, Ironwood có hiệu suất gấp đôi về lượng năng lượng cần thiết so với chip Trillium của Google mà hãng này công bố vào năm ngoái. "Ironwood là TPU mạnh mẽ nhất, linh hoạt nhất và tiết kiệm năng lượng nhất của chúng tôi tính đến nay. Nó được thiết kế chuyên biệt để hỗ trợ các mô hình AI suy luận ở quy mô lớn"-ông Amin Vahdat-Phó chủ tịch Google Cloud khẳng định.

Theo các bài kiểm thử nội bộ của Google, Ironwood có thể đạt sức mạnh tính toán ở mức cao nhất là 4.614 TFLOPs (4.614 nghìn tỷ phép toán dấu phẩy động mỗi giây). Mỗi chip có 192 GB RAM chuyên dụng với băng thông lên tới 7,4 Tbps.
Ironwood cũng được trang bị lõi chuyên biệt nâng cao có tên SparseCore, được thiết kế để xử lý các loại dữ liệu phổ biến trong các tác vụ như "xếp hạng nâng cao" và "gợi ý". Kiến trúc của Ironwood được tối ưu để giảm thiểu di chuyển dữ liệu và độ trễ trong chip, từ đó tiết kiệm điện năng.
Cũng theo ông Amin Vahdat, Google có kế hoạch tích hợp Ironwood vào AI Hypercomputer trong tương lai gần.
Trước đó, Google đã giới thiệu Gemini 2.5, dòng mô hình AI mới có khả năng "tạm dừng" để suy nghĩ trước khi phản hồi. Google cho biết tất cả mô hình Gemini mới sẽ mặc định có khả năng suy luận logic.
Hãng cũng triển khai Gemini 2.5 Pro Experimental bản thử nghiệm miễn phí cho tất cả người dùng, với giới hạn số lần sử dụng trong ngày nhằm "đưa mô hình AI thông minh nhất đến tay càng nhiều người dùng, càng sớm càng tốt".

Mỹ tăng cường kiểm soát chip AI trên toàn cầu
