Summary

Có bí mật gì mới từ OpenAI thế nhỉ 🤔

OpenAI vừa tung ra 'o3', một mô hình AI siêu tân tiến với nhiều kỷ lục đáng gờm. Điều này mở ra nhiều bàn luận sôi nổi về tiềm năng của trí tuệ nhân tạo.

Mô hình 'o3' của OpenAI vượt trội hơn hẳn những mô hình trước đó trong nhiều tiêu chí. Trên ARC-AGI, 'o3' nhân ba điểm số của 'o1' trên mức độ xử lý thấp, vượt ngưỡng 87%. Với EpochAI’s Frontier Math, 'o3' phá kỷ lục mới khi giải được 25.2% vấn đề, trong khi không mô hình nào khác vượt quá 2%. Đồng thời, tại SWE-Bench Verified, 'o3' vượt trội hơn 'o1' đến 22.8 điểm phần trăm.
Ngoài ra, trên Codeforces, 'o3' đạt điểm 2727, cao hơn cả điểm số của Chief Scientist của OpenAI là 2665. Và đỉnh cao là trên AIME 2024, 'o3' chỉ thiếu đúng một câu hỏi, đạt 96.7%. Trên GPQA Diamond thì 'o3' cũng vượt mặt hiệu suất của chuyên gia con người khi đạt 87.7%.

Tuy nhiên, mô hình 'o3' hiện chỉ đang ở giai đoạn 'xem trước' và chỉ mở cho những nhà nghiên cứu về an toàn và bảo mật. Sam Altman cũng nhấn mạnh là cần có khung kiểm tra liên bang để đảm bảo an toàn trước khi phát hành, nên việc làm cẩn thận như vậy cũng hợp lý phải không?

Các ae thắc mắc sao OpenAI không có 'o2', đúng không? Nó là do có vấn đề bản quyền liên quan đến 'o2' với nhà mạng O2 bên Anh đấy, nên họ đã nhảy thẳng lên 'o3'.

Tất cả những thông tin trên được chia sẻ bởi @rowancheung. Mình thấy đây là một chủ đề khá thú vị, đáng để mình quan tâm trong tương lai.

View original tweet →