Khác với các hệ thống dịch truyền thống thường phải chờ người nói kết thúc câu mới xử lý, Gemini 3.5 Live Translate có khả năng dịch đồng thời khi người dùng đang nói.
Công nghệ này sử dụng mô hình dịch giọng nói sang giọng nói (speech-to-speech), giúp bản dịch được truyền tải gần như tức thì với độ trễ rất thấp. Theo Google, hệ thống có thể duy trì nhịp điệu, ngữ điệu và cảm xúc của người nói, mang lại trải nghiệm hội thoại tự nhiên hơn.
Một điểm nổi bật là khả năng hoạt động hiệu quả trong môi trường nhiều tiếng ồn như sân bay, quán cà phê hay khu vực công cộng. Công nghệ cũng tự động nhận diện ngôn ngữ đang được sử dụng và hỗ trợ hơn 2.000 cặp ngôn ngữ khác nhau. Người dùng có thể trò chuyện trực tiếp với người nước ngoài mà không cần dừng lại để chờ dịch từng câu như trước đây.
Theo thông tin từ Google, tính năng này đã có mặt trên ứng dụng Google Dịch dành cho Android và iOS. Người dùng chỉ cần mở chế độ hội thoại, chọn ngôn ngữ mong muốn và bắt đầu trò chuyện.
Ngoài việc phục vụ khách du lịch, Gemini 3.5 Live Translate còn được kỳ vọng hỗ trợ đắc lực cho các cuộc họp quốc tế, hoạt động giáo dục, chăm sóc khách hàng và giao tiếp xuyên biên giới.
Việc hỗ trợ tiếng Việt là điểm đáng chú ý đối với người dùng trong nước. Với khả năng dịch trực tiếp, tự nhiên và gần như không có độ trễ, Gemini 3.5 Live Translate được xem là bước tiến lớn của Google trong lĩnh vực trí tuệ nhân tạo ngôn ngữ. Công nghệ này cũng dự kiến sẽ sớm được tích hợp vào các dịch vụ khác như Google Meet, mở rộng khả năng giao tiếp đa ngôn ngữ trên nhiều nền tảng.