OpenAI “khuấy đảo” giới công nghệ với mô hình o3 mới

09:38 22/12/2024

3 phút đọc

Trong ngày cuối cùng của sự kiện “shipmas” kéo dài 12 ngày, OpenAI đã công bố o3, thế hệ tiếp theo của mô hình suy luận o1 được phát hành đầu năm nay. o3 là một họ mô hình, bao gồm o3 và o3-mini, một phiên bản thu gọn được tinh chỉnh cho các tác vụ cụ thể.

OpenAI đưa ra tuyên bố đáng chú ý rằng o3, trong một số điều kiện nhất định, đã tiến gần đến AGI (trí tuệ nhân tạo tổng quát), mặc dù vẫn còn nhiều hạn chế.

Tại sao lại là o3, không phải o2?

OpenAI đã bỏ qua o2 để tránh xung đột thương hiệu với nhà mạng viễn thông Anh Quốc O2.

Khả năng suy luận và những rủi ro tiềm ẩn

o3 chưa được phát hành rộng rãi, nhưng các nhà nghiên cứu an toàn AI có thể đăng ký dùng thử o3-mini từ hôm nay. Bản xem trước o3 sẽ ra mắt sau đó, mặc dù OpenAI chưa xác định thời gian cụ thể.

Các thử nghiệm cho thấy khả năng suy luận của o1 khiến nó cố gắng đánh lừa người dùng ở mức độ cao hơn so với các mô hình thông thường. Điều này đặt ra nguy cơ o3 cũng có thể có xu hướng tương tự.

OpenAI cho biết họ đang sử dụng kỹ thuật “căn chỉnh thận trọng” để căn chỉnh các mô hình như o3 với các nguyên tắc an toàn.

Cơ chế suy luận

Không giống như hầu hết các AI khác, mô hình suy luận như o3 có khả năng tự kiểm tra thực tế, giúp chúng tránh được một số sai lầm thường gặp. Quá trình này khiến o3 mất nhiều thời gian hơn để đưa ra câu trả lời, nhưng đổi lại nó có độ tin cậy cao hơn trong các lĩnh vực như vật lý, khoa học và toán học.

o3 được huấn luyện thông qua học tăng cường để “suy nghĩ” trước khi trả lời. Mô hình có thể lý luận thông qua một nhiệm vụ và lập kế hoạch trước, thực hiện một loạt hành động trong một khoảng thời gian dài để tìm ra giải pháp.

Tiến gần đến AGI?

Trên ARC-AGI, một bài kiểm tra đánh giá khả năng học hỏi kỹ năng mới của AI, o3 đạt điểm 87.5% ở cài đặt tính toán cao. Tuy nhiên, o3 vẫn thất bại trong một số nhiệm vụ đơn giản, cho thấy sự khác biệt cơ bản giữa trí tuệ của nó và con người.

Trên các bài kiểm tra khác, o3 vượt trội so với các đối thủ. Nó đạt điểm cao trong các nhiệm vụ lập trình, giải đề thi toán và trả lời câu hỏi về sinh học, vật lý và hóa học.

Xu hướng mới trong AI

Sự ra mắt của o1 đã mở ra làn sóng phát triển mô hình suy luận từ các công ty AI đối thủ. Tuy nhiên, vẫn còn nhiều tranh cãi về tính hiệu quả và chi phí của các mô hình này. o3 là một bước tiến đáng kể trong nghiên cứu AI, cho thấy tiềm năng của mô hình suy luận trong việc tiếp cận AGI. Tuy nhiên, vẫn còn nhiều thách thức cần vượt qua trước khi AGI trở thành hiện thực.

Chia sẻ bài viết:

Từ khoá:

Có thể bạn sẽ thích

Tin tài trợ

Premium
Vũ trụ
Xuan Chinh Nguyen
15:50 23/09/2025

Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […]
Premium
Thủ thuật
Xuan Chinh Nguyen
17:05 21/09/2025

Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […]
Premium
Mobile
Xuan Chinh Nguyen
00:55 21/09/2025

iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […]
Premium
Khám phá
Xuan Chinh Nguyen
18:01 19/09/2025

Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]