Giá thấp hơn đang thay đổi cách xây dựng và vận hành các tác nhân AI

Các đại lý AI đang gây ra mối lo ngại về chi phí mã thông báo đằng sau sự hỗ trợ Kimi K2.5 của OpenClaw.
Giá thấp hơn làm giảm áp lực chi tiêu, với những rủi ro vẫn đang được xem xét.

Vào cuối năm 2025 và đầu năm 2026, một sự thay đổi thầm lặng đã diễn ra trong cách xây dựng và tiêu thụ các dịch vụ AI. Điều từng là sự phân chia rõ ràng – sự phụ thuộc nặng nề vào các mô hình ngôn ngữ độc quyền đắt tiền của các công ty phương Tây – giờ đây đang mờ dần. Ngày càng nhiều người dùng và nhà phát triển đang thử nghiệm các lựa chọn thay thế nguồn mở, đặc biệt là những cái mới nổi từ Trung Quốc cắt giảm chi phí sắc nét mà không bị giảm hiệu suất đáng kể.

Sự thay đổi này xuất hiện trong sự hỗ trợ gần đây được bổ sung bởi tác nhân AI tự trị OpenClaw cho các mô hình nguồn mở của Trung Quốc như AI của Moonshot Kimi K2.5 mới và biến thể mã hóa của nó. Động thái của OpenClaw cho thấy các mô hình này hiện ở mức đủ thấp trên đường cong hiệu suất chi phí để trở nên quan trọng đối với khán giả toàn cầu, chứ không chỉ là một nhóm nhỏ những người áp dụng kỹ thuật sớm.

Trọng tâm của sự phát triển này là tính kinh tế của các mô hình này. Giá dịch vụ AI thường được gắn ĐẾN sử dụng mã thông báo—các đơn vị văn bản mà mô hình xử lý và tạo ra. Khối lượng token cao hơn có nghĩa là chi phí cao hơn cho người dùng và nhà phát triển. Trong thế giới mô hình độc quyền truyền thống, những mức giá đó có thể tăng lên nhanh chóng khi sử dụng nhiều, đặc biệt là khi các tác nhân AI chạy các nhiệm vụ tự trị tạo ra số lượng token lớn. Đó là một lý do khiến một số người dùng báo cáo những khoản hóa đơn lớn bất ngờ khi để các đại lý hoạt động mà không có rào chắn chặt chẽ.

Ngược lại, các mô hình mở của Trung Quốc được xây dựng trên giấy phép minh bạch đang thu hút sự chú ý chủ yếu vì cái mà các nhà phân tích gọi là “giá trị đồng tiền”. Ví dụ như Kimi K2.5 của Moonshot được cung cấp với một phần chi phí mã thông báo được tính bởi các mô hình tiên tiến của phương Tây—khoảng 0,58 đô la vì 1 triệu token đầu vào và 3 USD vì đầu ra, đó là khoảng một phần chín và một phần tám giá của một số hệ thống độc quyền hàng đầu.

Khoảng cách đó không phải là trường hợp cá biệt. So sánh ngành rộng hơn cho thấy các mô hình nguồn mở hiện có ngày nay có thể khiến các nhà phát triển phải trả giá một bậc độ lớn ít hơn để xử lý mã thông báo tương đương với nhiều hệ thống đóng mà không làm giảm chất lượng tương ứng cho nhiều tác vụ.

Sự khác biệt về chi phí này quan trọng hơn bao giờ hết bởi vì doanh nghiệp và người dùng có khối lượng lớn là bắt đầu cân không chỉ hiệu suất mà còn tính bền vững. Một nghiên cứu gần đây về các mô hình mở và đóng cho thấy rằng, mặc dù cái thẻ giá thấp hơn, mô hình đóng vẫn đại diện khoảng 80% lượng sử dụng toàn cầu và 96% doanh thu, phần lớn là do niềm tin thương hiệu đã được thiết lập và quán tính hội nhập. Các nhà phân tích ước tính rằng nếu việc áp dụng nghiêng về các mô hình mở hoàn toàn dựa trên hiệu suất và giá cả, nền kinh tế AI toàn cầu có thể tiết kiệm hàng chục tỷ đô la mỗi năm.

Lựa chọn của OpenClaw để hỗ trợ Kimi và các mô hình tương tự phản ánh những áp lực này. Mặc dù người sáng lập OpenClaw không bình luận công khai về quyết định này, nhưng việc cho phép người dùng truy cập miễn phí các mô hình này gợi ý một chiến lược rộng hơn: giảm rào cản chi phí và mở rộng sự hấp dẫn của đại lý. Liệu phương pháp này có cải thiện khả năng giữ chân lâu dài hay khả năng kiếm tiền hay không vẫn là một câu hỏi mở.

Kỹ thuật khả năng của những mô hình này có được cải thiện từng bước với giá của họ điểm. Dòng Kimi K2 của Moonshot, một trong những mẫu mở cao cấp hơn của Trung Quốc, đã được đang phát triển liên tục dựa trên một kiến trúc hỗn hợp của các chuyên gia, cao cửa sổ ngữ cảnh mã thông báo và chiến lược tối ưu hóa tích cực.

Người dùng OpenClaw có nhiều cách khác nhau để tương tác với hệ thống. Một số người, như giáo sư về AI và máy học Wang Shuyi ở Thiên Tân, sử dụng nó như một loại “bộ định tuyến tác vụ”: đưa ra nghiên cứu, viết báo cáohoặc chỉ thị sáng tạo vào ban đêm và xem xét kết quả vào ngày hôm sau. Những người khác dựa vào nó để tăng cường quy trình làm việc hàng ngày, xem đại lý như một loại trợ lý ảo.

Các mô hình chi phí thấp hơn có ý nghĩa gì đối với các đại lý và người dùng AI

Nhưng việc chuyển sang các mô hình mở không chỉ liên quan đến giá cả và hiệu suất. Các công ty và nhà nghiên cứu cảnh báo rằng chi phí vận hành cho các mô hình mở không chỉ giới hạn ở việc định giá mã thông báo. Việc tích hợp, duy trì và bảo mật các mô hình trong hệ thống doanh nghiệp có thể yêu cầu đầu tư kỹ thuật để bù đắp một số lợi thế về chi phí. Một phân tích của ngành lưu ý rằng “nguồn mở không miễn phí” theo nghĩa tổng thể và các doanh nghiệp phải tính đến chi phí cơ sở hạ tầng, bảo trì, giám sát và tuân thủ.

Điểm đó tạo được tiếng vang trong các cuộc Chat của người dùng ngoài các diễn đàn kỹ thuật. Một số người dùng OpenClaw gạt bỏ những lo ngại về quyền riêng tư để ủng hộ tiện íchtrong khi những người khác do dự hoặc áp dụng cách giải quyết giống chạy các dịch vụ trên đám mây do nỗi sợ hãi hơn bảo mật dữ liệu trên hệ thống cá nhân. Sự cân bằng giữa rủi ro và phần thưởng sẽ khác nhau tùy theo người dùng và trường hợp sử dụng.

Hệ sinh thái AI của Trung Quốc đã tăng tốc trên nhiều mặt, không chỉ thông qua Moonshot. Các công ty trong nước khác, chẳng hạn như DeepSeek và ByteDance, đã phát hành các mô hình giá rẻ, thu hút sự chú ý ở nước ngoài về hiệu suất trên mỗi đô la điện toán. Những phát triển này cho thấy cạnh tranh về chi phí sẽ vẫn là chủ đề trọng tâm trong việc áp dụng mô hình AI trong tương lai gần.

Điều rút ra được rộng hơn là thị trường mô hình AI đang bị phân mảnh. Đối với các nhà phát triển doanh nghiệp và người dùng số lượng lớn, phép tính không còn đơn giản là “mô hình tốt nhất hiện có”. Nó ngày càng bao gồm các câu hỏi về giá cả, tính linh hoạt, khả năng kiểm soát và tính bền vững về chi phí lâu dài. Khi các đại lý như OpenClaw nắm bắt các lựa chọn thay thế rẻ hơn, phép tính đó sẽ chỉ trở nên rõ ràng hơn—và có nhiều hệ quả hơn đối với các nhà phát triển, doanh nghiệp cũng như người dùng cuối.

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra trí tuệ nhân tạo & Triển lãm dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này là một phần của TechEx Và được đồng vị trí cùng các sự kiện công nghệ hàng đầu khácbấm vào đây để biết thêm thông tin.

Tin tức AI được cung cấp bởi Truyền thông TechForge. Khám phá các sự kiện và hội thảo trực tuyến về công nghệ doanh nghiệp sắp tới khác đây.