Trong ngày cuối cùng của sự kiện “shipmas” kéo dài 12 ngày, OpenAI đã công bố o3, thế hệ tiếp theo của mô hình suy luận o1 được phát hành đầu năm nay. o3 là một họ mô hình, bao gồm o3 và o3-mini, một phiên bản thu gọn được tinh chỉnh cho các tác vụ cụ thể.
OpenAI đưa ra tuyên bố đáng chú ý rằng o3, trong một số điều kiện nhất định, đã tiến gần đến AGI (trí tuệ nhân tạo tổng quát), mặc dù vẫn còn nhiều hạn chế.
Tại sao lại là o3, không phải o2?
OpenAI đã bỏ qua o2 để tránh xung đột thương hiệu với nhà mạng viễn thông Anh Quốc O2.
Khả năng suy luận và những rủi ro tiềm ẩn
o3 chưa được phát hành rộng rãi, nhưng các nhà nghiên cứu an toàn AI có thể đăng ký dùng thử o3-mini từ hôm nay. Bản xem trước o3 sẽ ra mắt sau đó, mặc dù OpenAI chưa xác định thời gian cụ thể.
Các thử nghiệm cho thấy khả năng suy luận của o1 khiến nó cố gắng đánh lừa người dùng ở mức độ cao hơn so với các mô hình thông thường. Điều này đặt ra nguy cơ o3 cũng có thể có xu hướng tương tự.
OpenAI cho biết họ đang sử dụng kỹ thuật “căn chỉnh thận trọng” để căn chỉnh các mô hình như o3 với các nguyên tắc an toàn.
Cơ chế suy luận
Không giống như hầu hết các AI khác, mô hình suy luận như o3 có khả năng tự kiểm tra thực tế, giúp chúng tránh được một số sai lầm thường gặp. Quá trình này khiến o3 mất nhiều thời gian hơn để đưa ra câu trả lời, nhưng đổi lại nó có độ tin cậy cao hơn trong các lĩnh vực như vật lý, khoa học và toán học.
o3 được huấn luyện thông qua học tăng cường để “suy nghĩ” trước khi trả lời. Mô hình có thể lý luận thông qua một nhiệm vụ và lập kế hoạch trước, thực hiện một loạt hành động trong một khoảng thời gian dài để tìm ra giải pháp.
Tiến gần đến AGI?
Trên ARC-AGI, một bài kiểm tra đánh giá khả năng học hỏi kỹ năng mới của AI, o3 đạt điểm 87.5% ở cài đặt tính toán cao. Tuy nhiên, o3 vẫn thất bại trong một số nhiệm vụ đơn giản, cho thấy sự khác biệt cơ bản giữa trí tuệ của nó và con người.
Trên các bài kiểm tra khác, o3 vượt trội so với các đối thủ. Nó đạt điểm cao trong các nhiệm vụ lập trình, giải đề thi toán và trả lời câu hỏi về sinh học, vật lý và hóa học.
Xu hướng mới trong AI
Sự ra mắt của o1 đã mở ra làn sóng phát triển mô hình suy luận từ các công ty AI đối thủ. Tuy nhiên, vẫn còn nhiều tranh cãi về tính hiệu quả và chi phí của các mô hình này. o3 là một bước tiến đáng kể trong nghiên cứu AI, cho thấy tiềm năng của mô hình suy luận trong việc tiếp cận AGI. Tuy nhiên, vẫn còn nhiều thách thức cần vượt qua trước khi AGI trở thành hiện thực.
Tin tài trợ
-
Tài trợKhám phá
AE-1600 lên kệ: Casio ra mắt đồng hồ bền bỉ, đa năng
Dòng đồng hồ Casio AE-1600, được công bố vào cuối năm 2024, hiện đã cho phép đặt hàng trước trên Amazon. Ngày phát hành chính thức là 1/2/2025. Bộ sưu tập bao gồm ba mẫu với các màu đen, be và xám, mỗi chiếc có giá 77,94 USD (khoảng 1,8 triệu VNĐ). Pin 10 năm, […] -
Tài trợMobile
Garmin Approach S44: Đồng hồ thông minh cho golfer, pin “trâu” 10 ngày
Garmin vừa ra mắt đồng hồ thông minh Approach S44 GPS dành cho golfer trên toàn cầu. Đồng hồ có màn hình AMOLED màu 1.2 inch, vòng bezel bằng nhôm màu bạc và dây đeo silicon màu đen hoặc xám xanh (Twilight). Tính năng “chuẩn golfer” Approach S44 được trang bị nhiều tính năng hỗ […] -
Tài trợData
Lenovo ra mắt ổ SSD “hình lựu đạn”, “cấm” mang lên máy bay?
Lenovo vừa giới thiệu một ổ SSD gắn ngoài có thiết kế “độc nhất vô nhị”: hình lựu đạn. Sản phẩm này được lấy cảm hứng từ bộ phim bom tấn “Chiến dịch Rồng” (hay còn gọi là “Chiến dịch Leviathan” hoặc “Chiến dịch Hadal”) của Trung Quốc. Tuy nhiên, với hình dạng “nhạy cảm” […] -
Tài trợMobile
Máy ảnh lấy liền 2 trong 1: Instax Wide Evo “gây sốt” với thiết kế “retro”
Fujifilm vừa bổ sung vào gia đình Instax một chiếc máy ảnh lấy liền “lai” mới, sử dụng phim Instax Wide. Instax Wide Evo nổi bật với ống kính siêu rộng 16mm “đầu tiên trên thế giới” và khả năng điều chỉnh thủ công với hơn 100 kiểu phim và hiệu ứng. “Lai” ở đây […]
Bài viết liên quan
OpenAI “ém hàng” Operator, công cụ AI với khả năng đáng kinh ngạc?
ChatGPT “chống lại” Google: Lãnh đạo sản phẩm làm chứng chống độc quyền
Cải tiến trải nghiệm AI: Google cấp phép tin tức AP cho Gemini
MiniMax vs. OpenAI: Cuộc chiến mới trong lĩnh vực AI?
GenEx: Công nghệ biến ảnh tĩnh thành thế giới ảo sống động
Máy tính lượng tử lớn nhất: AI giúp tối ưu hóa sắp xếp nguyên tử
Trợ lý ảo Mercedes-Benz được nâng cấp với AI đàm thoại của Google
Adobe “cách mạng hóa” chỉnh sửa ảnh với công cụ AI mới
Nvidia ủng hộ Trump, chỉ trích chính sách AI của Biden
Elon Musk: Dữ liệu tổng hợp là chìa khóa cho tương lai AI
OpenAI đưa ra “bản thiết kế” mới cho quy định AI
Ballie – Robot AI “vạn năng” của Samsung sắp ra mắt trong năm nay
Phụ đề AI ngoại tuyến: Cách mạng hóa trải nghiệm xem phim
Grok AI: Điều gì khiến trợ lý AI này trở nên đặc biệt?
Nvidia Digits: Siêu máy tính chỉ 3.000 USD, nhỏ gọn bất ngờ
Kính thông minh Halliday với màn hình và hệ thống điều khiển độc đáo
Gương thông minh “thần kỳ” đánh giá sức khỏe người dùng
Sansui sẽ “khuấy đảo” thị trường với TV OLED và màn hình chơi game AI mới?
Rò rỉ Galaxy S25: AI camera, AI trợ lý ảo, AI chỉnh sửa ảnh?
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)