Google Antigravity – Gemini 3: Công Nghệ AI Đột Phá Mới

Vừa rồi Google tiếp tục gây chú ý toàn cầu khi giới thiệu Antigravity – Gemini 3, thế hệ AI mới nhất được thiết kế để nâng cấp tốc độ xử lý, khả năng hiểu ngữ cảnh và tạo nội dung ở mức độ chính xác vượt trội. Công nghệ này không chỉ cải thiện hiệu năng so với các phiên bản trước, mà còn mở ra khả năng ứng dụng mạnh mẽ trong hình ảnh, video, lập trình, tự động hóa và nhiều lĩnh vực chuyên sâu. Với Google Antigravity – Gemini 3 trở thành một trong những mô hình AI đa năng và đột phá nhất năm 2025, hứa hẹn thay đổi cách con người làm việc và sáng tạo.

Google tung Gemini 3: Trí tuệ nhân tạo thế hệ mới

Từ khi dòng Gemini xuất hiện cách đây gần 2 năm, Google liên tục mở rộng hệ sinh thái AI của mình đến nhiều nhóm người dùng khác nhau. Hiện tại, hãng cho biết tính năng AI Overviews đã đạt khoảng 2 tỷ lượt người dùng mỗi tháng, ứng dụng Gemini có khoảng 650 triệu người dùng mỗi tháng, hơn 70% khách hàng Google Cloud đã tích hợp AI vào hệ thống của họ và khoảng 13 triệu lập trình viên đang phát triển sản phẩm dựa trên các mô hình AI tạo sinh của Google. Những con số này cho thấy Gemini không còn là sản phẩm thử nghiệm, mà đã trở thành một phần quan trọng trong chiến lược AI của Google.

Với Gemini 3, Google lần đầu tiên cho phép người dùng truy cập Gemini 3 Pro ngay trong ứng dụng Gemini từ ngày đầu, đồng thời triển khai thêm AI Mode dành cho người dùng trả phí. Điều này cho thấy mức độ tự tin của Google, khi chính thức gọi đây là “mô hình thông minh nhất của công ty” và đưa thẳng vào sản phẩm dành cho số đông, chứ không chỉ giới hạn trong môi trường thử nghiệm hay khách hàng doanh nghiệp.

Theo chia sẻ của Tulsee Doshi, Giám đốc cấp cao kiêm Trưởng bộ phận sản phẩm Google DeepMind, Gemini 3 được xem là bước tiến tiếp theo giúp Google tiến gần hơn tới mục tiêu làm cho thông tin “có thể truy cập rộng rãi và hữu ích” cho mọi người. Không chỉ dừng ở việc trả lời câu hỏi tốt hơn, Gemini 3 còn được dùng để tiếp tục nâng cấp trải nghiệm tìm kiếm trên Google Search, giúp người dùng tra cứu, tổng hợp, và hiểu thông tin nhanh hơn.

Điểm nhấn quan trọng nhất của Gemini 3 Pro là khả năng xử lý đa phương thức (multimodal), có nghĩa là mô hình có thể xử lý văn bản, hình ảnh và âm thanh cùng lúc. Chẳng hạn, Gemini 3 có thể đọc ảnh chụp công thức nấu ăn rồi tự động chuyển thành sách công thức hoàn chỉnh, hoặc phân tích video bài giảng và tạo thành thẻ ghi chú tương tác phục vụ học tập, ôn luyện. Trong thực tế, điều này mở ra rất nhiều ứng dụng: từ giáo dục, marketing nội dung, sản xuất video, đến trợ lý làm việc cá nhân cho người dùng phổ thông.

Gemini 3 Pro dẫn đầu hàng loạt bài kiểm tra chuẩn

Thông báo từ Google cho biết Gemini 3 Pro đang giữ vị trí dẫn đầu trên nhiều thang đo chuẩn. Cụ thể, mô hình đạt 1.501 điểm trên bảng xếp hạng LMArena, tạm thời đứng đầu trong số các mô hình AI được so sánh. Về năng lực lập luận, Gemini 3 Pro được đánh giá ở mức “trình độ tiến sĩ” khi đạt 37,5% trong bài thi Humanity’s Last Exam và 91,9% ở bài GPQA Diamond. Trên thang đo MathArena Apex – tập trung vào các bài toán toán học nâng cao – mô hình đạt 23,4%, hiện là mức cao nhất trong nhóm các mô hình ngôn ngữ lớn (LLM). Ở mảng lập luận đa phương thức, Gemini 3 Pro cũng cho kết quả ấn tượng: 81% trên MMMU-Pro, 87,6% trên Video-MMMU và 72,1% trên thang đo SimpleQA Verified. Theo Google, những con số này cho thấy Gemini 3 Pro có khả năng xử lý các vấn đề phức tạp trong nhiều lĩnh vực, từ khoa học đến toán học, với độ tin cậy cao.

Song song đó, Google còn giới thiệu Gemini 3 Deep Think – phiên bản tối ưu cho lập luận sâu. Mô hình này đạt điểm số còn cao hơn Gemini 3 Pro ở một số thang đo quan trọng: 41% trong Humanity’s Last Exam, 93,8% ở GPQA Diamond và 45,1% trên ARC-AGI, một thang đo hướng đến khả năng suy luận gần với trí tuệ nhân tạo tổng quát (AGI). Điều này cho thấy Deep Think được thiết kế để giải các bài toán cần nhiều bước suy nghĩ và yêu cầu khả năng lập luận ở mức độ cao hơn.

Google Antigravity – Gemini 3 làm được gì?

Gemini 3 được Google tích hợp sâu vào nhiều sản phẩm, mở ra cách trải nghiệm hoàn toàn mới với AI. Trong ứng dụng Gemini, tính năng Dynamic View đang được thử nghiệm giúp biến kết quả trả lời thành dạng tương tác trực quan hơn, như một “tạp chí” với ảnh minh họa, đoạn thông tin ngắn gọn, hoặc giao diện được tùy biến theo nhu cầu người dùng. Gemini 3 còn có thể phân tích video, chẳng hạn như video bạn chơi pickleball, chỉ ra điểm yếu trong kỹ thuật và gợi ý kế hoạch luyện tập cụ thể để cải thiện phong độ.

Trên Google Search, chế độ AI Mode có thể tạo hình ảnh, bảng biểu, video mô phỏng… dựa trên truy vấn thông qua Generative UI, đồng thời cho phép người dùng tiếp tục đặt câu hỏi sâu hơn trên nền dữ liệu đã tạo ra. Google cho biết AI Mode được nâng cấp với kỹ thuật “query fan-out”, chia nhỏ câu hỏi để hiểu rõ hơn ý định và tìm thêm những nội dung trước đây dễ bị bỏ sót. Gemini 3 Pro cũng được nhấn mạnh là có xu hướng đưa ra góc nhìn thực tế, thẳng thắn, không chỉ “nói điều bạn muốn nghe” mà tập trung vào “điều bạn cần nghe”.

Đối với lập trình viên, Gemini 3 Pro hỗ trợ tốt hơn cho các tác vụ agentic coding (lập trình tác nhân) và “vibe coding” (lập trình theo cảm tính/ý tưởng), thông qua các công cụ như Google AI Studio, Vertex AI, Gemini CLI và nền tảng Antigravity mới, tập trung vào tác nhân và tự động hóa. Ở mảng “agent”, Gemini 3 có thể thay mặt người dùng thực hiện các quy trình phức tạp như phân loại – sắp xếp email, tìm kiếm thông tin, hay hỗ trợ đặt vé du lịch. Hiện tại, người dùng gói Google AI Ultra đã có thể trải nghiệm những tính năng tác nhân này trong ứng dụng Gemini với chế độ Gemini Agent.