OpenAI tái tập trung vào ChatGPT với việc phát hành GPT-5.2

OpenAI phát hành GPT-5.2 khi áp lực từ Google và Anthropic ngày càng lớn.
GPT-5.2 cải thiện hiệu suất trong khi OpenAI cân nhắc sự an toàn và niềm tin của người dùng.

Áp lực bên trong OpenAI ngày càng tăng khi sự cạnh tranh xung quanh các mô hình AI ngày càng gay gắt. Căng thẳng đó đã xuất hiện trong tuần này với việc phát hành GPT-5.2, một mô hình mới mà công ty cho biết sẽ cải thiện khả năng viết, mã hóa và lý luận, đồng thời tuân theo “mã màu đỏ” nội bộ nhằm mục đích nâng cao hiệu suất của ChatGPT.

Sự thúc đẩy nội bộ có nghĩa là theo các giám đốc điều hành OpenAI, để tập trung sự chú ý, thay vì vội vàng phát hành.

Cạnh tranh thắt chặt khi OpenAI tung ra GPT-5.2

Fidji Simo, Giám đốc điều hành ứng dụng của OpenAI, cho biết trong cuộc họp giao ban với các phóng viên hôm thứ Năm: “Chúng tôi đã công bố mã màu đỏ này để thực sự báo hiệu cho công ty rằng chúng tôi muốn tập trung các nguồn lực vào một lĩnh vực cụ thể và đó là cách để thực sự xác định các ưu tiên”. “Chúng tôi đã tăng cường các nguồn lực tập trung vào Trò chuyệnGPT nói chung.”

Simo cho biết công việc trên GPT-5.2 đã được tiến hành trong nhiều tháng và đã từng là không đã di chuyển phía trước vì mã màu đỏ. Tuy nhiên, cô thừa nhận rằng việc chuyển nhiều người và nỗ lực hơn sang ChatGPT là “hữu ích”. Việc phát hành diễn ra sau GPT-5.1 chưa đầy một tháng, phản ánh nhịp độ nhanh hơn khi các đối thủ tiếp tục giành được chỗ đứng.

Khi ChatGPT ra mắt lần đầu tiên vào năm 2022, vị trí dẫn đầu thị trường của OpenAI có vẻ được đảm bảo. Lợi thế đó đã bị thu hẹp. Google đã nổi lên như một trong những đối thủ mạnh nhất, với mô hình Gemini 3 của họ đã thu hút được phản ứng tích cực trong toàn ngành công nghệ. Ứng dụng Gemini của nó đã phát triển nhanh chóng, đạt hơn 650 triệu người dùng hoạt động hàng tháng. Để so sánh, OpenAI cho biết ChatGPT hiện có khoảng 800 triệu người dùng hoạt động hàng tuần.

Áp lực cũng đến từ Anthropic, công ty có mô hình Claude đã thu hút được khách hàng doanh nghiệp, đặc biệt là đối với các tác vụ viết mã. Một số số liệu trong ngành cho thấy Claude đã vượt qua OpenAI trong một số lĩnh vực của thị trường doanh nghiệp, nâng cao hiệu suất của GPT-5.2 trong phát triển phần mềm.

Sự cạnh tranh đó đã buộc OpenAI phải đánh giá lại các ưu tiên của mình. Một số ý tưởng dài hạn hơn, chẳng hạn như thêm quảng cáo vào ChatGPTđã lùi lại phía sau trong khi công ty tập trung vào việc cải thiện các mô hình cốt lõi và trải nghiệm người dùng.

Mức tăng điểm chuẩn và kết quả thử nghiệm sớm

GPT-5.2 tuân theo cách tiếp cận theo cấp độ tương tự như các bản phát hành OpenAI gần đây. Phiên bản tức thì được thiết kế để có câu trả lời nhanh hơn và các tác vụ thông tin cơ bản. Tư duy hướng đến những công việc phức tạp hơn, bao gồm mã hóa, toán học và lập kế hoạch. Pro nằm ở vị trí hàng đầu, nhắm đến người dùng cần độ chính xác cao hơn cho những câu hỏi khó.

OpenAI định vị GPT-5.2 là lựa chọn mạnh nhất cho đến nay cho các tác vụ chuyên môn hàng ngày. Trên GDPval, một chuẩn mực nội bộ so sánh các mô hình AI với các chuyên gia con người trong 44 ngành nghề, GPT-5.2 Thought đã đạt được điểm số cao nhất mà công ty từng ghi nhận. OpenAI cho biết mô hình này phù hợp hoặc vượt quá hiệu suất của chuyên gia con người trong chỉ hơn 70% nhiệm vụ, vượt xa các mô hình OpenAI trước đó cũng như các bản phát hành gần đây của Google và Anthropic.

Công ty cũng chỉ ra những lợi ích trong việc phát triển phần mềm. Trên SWE-Bench Pro, một điểm chuẩn tập trung vào các tác vụ mã hóa trong thế giới thực, GPT-5.2 đạt điểm cao hơn so với phiên bản tiền nhiệm và vượt trội hơn Gemini 3 Pro. OpenAI cho biết mô hình cũng cho thấy mạnh mẽ hơn khả năng sử dụng các công cụ phần mềm bên ngoài để hoàn thành nhiệm vụ, dựa trên phản hồi từ những người thử nghiệm ban đầu.

Những người thử nghiệm đó bao gồm một nhóm “khách hàng alpha” đã có quyền truy cập vào mô hình trong vài tuần trước khi ra mắt, chẳng hạn như công ty khởi nghiệp AI hợp pháp Harvey, ứng dụng ghi chú Notion, công ty quản lý tệp Box và các công ty bao gồm Shopify và Zoom.

OpenAI cũng nêu bật sự tiến bộ về độ chính xác. Max Schwarzer, trưởng nhóm sau đào tạo của công ty, cho biết mô hình mới cho thấy ảo giác giảm đáng kể. Về các điểm chuẩn tập trung vào các câu hỏi thực tế, OpenAI cho biết Tư duy GPT-5.2 tạo ra ảo giác ít hơn 38% so với GPT-5.1.

Các mô hình mới được đang được triển khai cho cả người dùng và nhà phát triển ChatGPT thông qua API của OpenAI. Công ty cho biết các bản cập nhật cải thiện hiệu suất trên cả mục đích sử dụng thông thường và nâng cao hơn.

Áp lực tăng trưởng và những lo ngại về an toàn đang diễn ra

Tuy nhiên, lịch sử gần đây của OpenAI cho thấy kết quả benchmark tốt không phải lúc nào cũng phù hợp với cảm nhận của người dùng trong thực tế. Khi GPT-5 ra mắt vào đầu năm nay, nhiều người dùng phàn nàn rằng phản hồi của nó có vẻ xa cách và thiếu cá tính. Vấn đề không được phản ánh trong các thử nghiệm tiêu chuẩn và OpenAI đã phát hành bản cập nhật vài ngày sau đó để làm cho mô hình nghe có vẻ “ấm áp hơn”.

Tình tiết đó nêu bật một hành động cân bằng đang diễn ra đối với công ty. OpenAI muốn ChatGPT mang lại cảm giác hấp dẫn và tự nhiên, không đẩy nó đến mức phải thỏa thuận hoặc phụ thuộc quá mức về mặt cảm xúc. Trong năm qua, công ty đã phải đối mặt với sự giám sát ngày càng tăng về sức khỏe tâm thần và mọi người dựa vào thế nào về AI đàm thoại.

Vào tháng 10, OpenAI đã công bố một báo cáo cho thấy hơn một triệu người nói chuyện với ChatGPT về vấn đề tự tử mỗi tuần. Cùng lúc đó, một nhà lãnh đạo nghiên cứu liên quan đến nỗ lực chăm sóc sức khỏe tâm thần của công ty đã thông báo kế hoạch rời đi, theo các tin nhắn nội bộ. Công ty cũng phải đối mặt với một số vụ kiện liên quan đến những tuyên bố về vai trò của ChatGPT trong các trường hợp liên quan đến đau khổ tâm lý nghiêm trọng.

Bất chấp những thách thức đó, sự cạnh tranh từ Google, Anthropic và Meta đã làm tăng nguy cơ tăng trưởng người dùng. Trong một bản ghi nhớ được gửi vào tháng 10, Nick Turley, người đứng đầu ChatGPT của OpenAI, đã cảnh báo các nhân viên rằng công ty đang phải đối mặt với “áp lực cạnh tranh lớn nhất mà chúng tôi từng thấy”. Thời báo New York. Turley được cho là đã đặt mục tiêu tăng 5% số người dùng hoạt động hàng ngày trước năm 2026.

Cùng với GPT-5.2, OpenAI cho biết họ đã tiếp tục cải thiện cách ChatGPT xử lý các lời nhắc nhạy cảm liên quan đến việc tự làm hại bản thân, đau khổ về tinh thần hoặc phụ thuộc vào mô hình. Công ty cũng đang bắt đầu triển khai hệ thống dự đoán độ tuổi ở một số quốc gia. hệ thống có nghĩa là để ước tính xem người dùng có dưới 18 tuổi hay không và áp dụng các biện pháp kiểm soát nội dung chặt chẽ hơn khi cần.

Nhìn về phía trước, Simo cho biết OpenAI có kế hoạch giới thiệu “chế độ người lớn” vào quý đầu tiên của năm 2026. Sam Altman trước đây đã cho biết tính năng này sẽ cho phép người dùng trên 18 tuổi tham gia vào các cuộc Chat “khiêu dâm” với ChatGPT.

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Kiểm tra Triển lãm AI & Dữ liệu lớn diễn ra ở Amsterdam, California và London. Sự kiện toàn diện này là một phần của TechEx và được tổ chức cùng với các sự kiện công nghệ hàng đầu khác, hãy nhấp vào đây để biết thêm thông tin.

Tin tức AI được cung cấp bởi Truyền thông TechForge. Khám phá các sự kiện và hội thảo trực tuyến về công nghệ doanh nghiệp sắp tới khác đây.