- Tại CES 2026, NVIDIA đã giới thiệu các hệ thống AI mới để đưa ra quyết định trong thế giới thực.
- Trọng tâm là lý luận và các tình huống hiếm gặp.
Làn sóng phát triển AI mới nhất đang vượt ra ngoài giao diện Chat và hướng tới các hệ thống phải hoạt động trong thế giới thực. Ô tô, robot và máy móc công nghiệp phải đối mặt với những tình huống không thể giải quyết bằng cách khớp mẫu một mìnhđặc biệt khi xảy ra các sự kiện hiếm gặp hoặc bất ngờ.
Một tập hợp các mô hình và nền tảng mới của NVIDIA nêu bật cách ngành ứng phó với thách thức đó. Các bản phát hành bao gồm các mô hình xe tự hành dựa trên lý luận, công cụ robot cũng như các thiết kế lưu trữ và điện toán mới, tất cả đều nhằm mục đích hỗ trợ AI có thể lập kế hoạch, điều chỉnh và giải thích hành động của nó trong thế giới thực.
Lý luận đi vào lái xe tự động
Một trong những khó nhất các bài kiểm tra AI vật lý là lái xe tự động. Phương tiện phải vận hành an toàn trong vô số điều kiện, bao gồm cả những sự kiện hiếm gặp và khó lường thường được mô tả là “đuôi dài”. Các thiết kế truyền thống tách biệt nhận thức khỏi việc lập kế hoạch, điều này có thể hạn chế mức độ phản hồi của hệ thống khi có điều gì đó bất thường xảy ra.
Các phương pháp tiếp cận mới tập trung vào việc học từ đầu đến cuối, nhưng những cái này vẫn phải đối mặt giới hạn khi các kịch bản nằm ngoài dữ liệu huấn luyện. Giải quyết khoảng cách đó đòi hỏi các mô hình có thể suy luận từng bước, thay vì phản ứng chỉ dựa vào những ví dụ trong quá khứ.
Nhóm các mô hình và công cụ mở Alpamayo được thiết kế xung quanh ý tưởng này. Thay vì chạy trực tiếp bên trong xe, các mô hình này hoạt động như một hệ thống giáo viên lớn. Các nhà phát triển có thể tinh chỉnh và chắt lọc chúng thành các thành phần nhỏ hơn phù hợp với hệ thống lái tự động hiện có.
Alpamayo 1, được phát hành cho cộng đồng nghiên cứu, sử dụng đầu vào video để tạo cả quỹ đạo lái xe và dấu vết lý luận cho thấy các quyết định như thế nào được thực hiện. Bằng cách phơi bày logic đằng sau mỗi hành động, mô hình có nghĩa là để giúp các nhóm kiểm tra hành vi trong những tình huống hiếm gặp và cải thiện khả năng giải thích, cái còn lại mối quan tâm chính về sự an toàn và tin cậy.
các khuôn khổ cho phép tự chủ cấp độ 4 dựa trên lý luận. (Nguồn – Nvidia)
Jensen Huang, người sáng lập và CEO của NVIDIA cho biết: “Thời điểm ChatGPT dành cho AI vật lý đã đến – khi máy móc bắt đầu hiểu, suy luận và hành động trong thế giới thực”. “Robotaxis là một trong những công ty đầu tiên được hưởng lợi. Alpamayo mang lý luận đến các phương tiện tự hành, cho phép chúng suy nghĩ qua các tình huống hiếm gặp, lái xe an toàn trong môi trường phức tạp và giải thích các quyết định lái xe của mình — đó là nền tảng cho khả năng tự chủ an toàn và có thể mở rộng.”
Bên cạnh các mô hình, Alpamayo còn bao gồm một khung mô phỏng mở và các bộ dữ liệu quy mô lớn được rút ra từ hàng nghìn giờ lái xe qua các khu vực và điều kiện khác nhau. Cùng với nhau, những mảnh này dự định để tạo thành một vòng lặp trong đó các mô hình được đào tạo, thử nghiệm trong mô phỏng, tinh chỉnh và sau đó được chắt lọc để sử dụng trong thế giới thực.
Sự quan tâm của ngành phản ánh thách thức lớn hơn mà quyền tự chủ vẫn phải đối mặt. Sarfraz Maredia, người đứng đầu toàn cầu về di chuyển và giao hàng tự động tại Uber cho biết: “Xử lý các tình huống lái xe đường dài và không thể đoán trước là một trong những thách thức rõ ràng của quyền tự chủ”. “Alpamayo tạo ra những cơ hội mới thú vị cho ngành để tăng tốc AI vật lý, cải thiện tính minh bạch và tăng cường triển khai cấp độ 4 an toàn.”
Từ máy đơn nhiệm đến robot suy luận
Những giới hạn tương tự cũng xuất hiện trong chế tạo robot. Nhiều máy móc ngày nay được chế tạo cho một nhiệm vụ và yêu cầu kỹ thuật nặng để thay đổi hoạt động của chúng. Vượt ra ngoài mô hình đó có nghĩa là dạy robot hiểu môi trường xung quanh, lập kế hoạch hành động và thích ứng khi nhiệm vụ hoặc điều kiện thay đổi.
Các mô hình mở mới cho robot nhằm mục đích giảm chi phí và công sức cần thiết để đạt được mục tiêu đó. Thay vì bắt đầu từ đầu, các nhà phát triển có thể xây dựng trên các hệ thống được đào tạo trước để nắm bắt cách thế giới vật chất hoạt động.
Các bản phát hành gần đây bao gồm các mô hình thế giới tạo ra dữ liệu tổng hợp và kiểm tra hành vi của robot trong mô phỏng, cũng như các mô hình ngôn ngữ thị giác lý luận liên kết những gì máy nhìn thấy với những gì nó nên làm tiếp theo. Đối với robot hình người, điều này mở rộng sang khả năng điều khiển toàn thân, cho phép các hệ thống điều phối chuyển động dựa trên bối cảnh thay vì các tập lệnh cố định.
Jensen Huang cho biết: “Thời điểm ChatGPT dành cho robot đã đến. Những đột phá trong AI vật lý — các mô hình hiểu được thế giới thực, lý do và lập kế hoạch hành động — đang mở khóa các ứng dụng hoàn toàn mới”. “Bộ xử lý robot Jetson đầy đủ của NVIDIA, CUDA, Omniverse và các mô hình AI vật lý mở hỗ trợ hệ sinh thái đối tác toàn cầu của chúng tôi để chuyển đổi các ngành công nghiệp bằng robot điều khiển bằng AI.”
Các nhà phát triển trong lĩnh vực sản xuất, hậu cần và chăm sóc sức khỏe đã thử nghiệm các phương pháp này. Ví dụ, trong môi trường phẫu thuật, các hệ thống tự động đang được đào tạo về mô phỏng để hướng dẫn các dụng cụ sử dụng phân tích thời gian thực. Trong môi trường công nghiệp, robot đang học các hành vi mới mà không cần lập trình lại từng dòng một.
Chủ đề chung là sự chuyển đổi từ tự động hóa cứng nhắc sang các hệ thống có thể khái quát hóa các nhiệm vụ, ngay cả khi các điều kiện khác với những gì chúng thực hiện. đã được đào tạo TRÊN.
Cơ sở hạ tầng bắt kịp AI lý luận
Khi các mô hình trở nên phức tạp hơn, nhu cầu đặt ra về cơ sở hạ tầng cũng tăng lên. Các hệ thống suy luận lớn dựa vào lượng lớn bối cảnh, đặc biệt là đối với việc ra quyết định nhiều bước. Bối cảnh này thường được lưu trữ như bộ nhớ đệm khóa-giá trị giúp các mô hình duy trì tính nhất quán trên dài tương tác.
Việc lưu giữ dữ liệu đó trên GPU là không thực tế ở quy mô lớn. Nó tạo ra những trở ngại và giới hạn bao nhiêu hệ thống có thể chạy cùng một lúc. Để hỗ trợ AI đa tác nhân, bối cảnh dài, bản thân bộ nhớ phải thay đổi.
Các cách tiếp cận mới tập trung vào việc xử lý bối cảnh như một tài nguyên được chia sẻ có thể được truy cập nhanh chóng trên các cụm. Bằng cách mở rộng bộ nhớ ra ngoài các GPU riêng lẻ và quản lý nó ở cấp hệ thống, khối lượng công việc AI có thể duy trì khả năng phản hồi trong khi mở rộng sang các mô hình lớn hơn.
Jensen Huang cho biết: “AI đang cách mạng hóa toàn bộ nền tảng điện toán – và bây giờ là lưu trữ”. “AI không còn là những chatbot dùng một lần mà là những cộng tác viên thông minh hiểu được thế giới vật chất, lý luận trong tầm nhìn xa, bám sát thực tế, sử dụng các công cụ để thực hiện công việc thực tế và lưu giữ cả trí nhớ ngắn hạn và dài hạn.”
Đồng thời, các nền tảng điện toán được thiết kế lại để hỗ trợ các khối lượng công việc này từ đầu đến cuối. Mới gia đình chip tập hợp các CPU, GPU, mạng và các đơn vị xử lý dữ liệu thành một hệ thống duy nhất, thay vì các thành phần riêng biệt được ghép lại với nhau sau này.
Huang nói: “Rubin xuất hiện vào đúng thời điểm, khi nhu cầu tính toán AI cho cả đào tạo và suy luận đang tăng cao. “Với nhịp độ hàng năm của chúng tôi trong việc cung cấp một thế hệ siêu máy tính AI mới — và thiết kế mã cực đoan trên sáu con chip mới — Rubin đã có một bước nhảy vọt lớn hướng tới biên giới tiếp theo của AI.”
Đối với các nhà phát triển và nhà cung cấp đám mây, sự hấp dẫn nằm ở tính hiệu quả. Chi phí đào tạo và suy luận cũng quan trọng như hiệu suất thô, đặc biệt khi các mô hình phát triển lớn hơn và chuyên biệt hơn. Việc giảm số lượng chip cần thiết cho khối lượng công việc phức tạp sẽ giúp giảm cả mức sử dụng năng lượng và chi phí vận hành.
Sam Altman, Giám đốc điều hành của OpenAI cho biết: “Trí thông minh mở rộng theo khả năng tính toán. Khi chúng tôi bổ sung thêm nhiều tính toán, các mô hình sẽ có nhiều khả năng hơn, giải quyết các vấn đề khó hơn và tạo ra tác động lớn hơn cho mọi người”. “Nền tảng NVIDIA Rubin giúp chúng tôi tiếp tục nhân rộng tiến trình này để trí thông minh tiên tiến mang lại lợi ích cho mọi người.”
Hướng đi chung cho AI vật lý
Trên các phương tiện, robot và cơ sở hạ tầng, hướng đi đều nhất quán. AI vật lý đang chuyển từ tối ưu hóa hẹp sang các hệ thống có thể suy luận, thích ứng và giải thích hành động của chúng. Các mô hình mở, công cụ mô phỏng và bộ dữ liệu dùng chung đang hạ thấp các rào cản đối với thử nghiệm, trong khi các thiết kế phần cứng và bộ lưu trữ mới nhằm mục đích biến lý luận theo ngữ cảnh dài trở nên thực tế trên quy mô lớn.
Điều vẫn chưa được giải quyết là các hệ thống này có thể chuyển từ môi trường được kiểm soát sang môi trường sử dụng hàng ngày nhanh đến mức nào. Các sự kiện hiếm gặp, mối lo ngại về an toàn và độ phức tạp trong thế giới thực tiếp tục thử thách ngay cả những mẫu máy tiên tiến nhất. Nhưng trọng tâm đã thay đổi. Thách thức không còn là liệu máy móc có thể hành động hay không mà là liệu chúng có thể suy nghĩ thấu đáo về những gì chúng đang làm khi thế giới hành xử không như mong đợi hay không.

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra trí tuệ nhân tạo & Triển lãm dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này là một phần của TechEx Và được đồng vị trí cùng các sự kiện công nghệ hàng đầu khácbấm vào đây để biết thêm thông tin.
Tin tức AI được cung cấp bởi Truyền thông TechForge. Khám phá các sự kiện và hội thảo trực tuyến về công nghệ doanh nghiệp sắp tới khác đây.



