حقق نموذج جديد للذكاء الاصطناعي AI نتائج على مستوى البشر في اختبار مصمم لقياس “الذكاء العام”، حيث سجل نظام o3 التابع لشركة OpenAI نسبة 85% في معيار ARC-AGI، وهو أعلى بكثير من أفضل نتيجة سابقة للذكاء الاصطناعي والتي بلغت 55%، ويتساوى مع متوسط النتيجة البشرية، كما سجل نتائج جيدة في اختبار رياضيات صعب للغاية.
وفقا لما ذكره موقع “Techxplore”، فإن إنشاء الذكاء العام الاصطناعي، أو AGI، هو الهدف المعلن لجميع مختبرات أبحاث الذكاء الاصطناعي الرئيسية، ويبدو أن OpenAI قد قطعت خطوة كبيرة على الأقل نحو هذا الهدف.
يشعر العديد من الباحثين والمطورين في مجال الذكاء الاصطناعي أن شيئًا ما قد تغير، وبالنسبة للكثيرين، يبدو احتمال الذكاء العام الاصطناعي الآن أكثر واقعية وإلحاحًا وأقرب مما كان متوقعًا.
كما أنه لفهم ما تعنيه نتيجة o3، تحتاج إلى فهم ما يدور حوله اختبار ARC-AGI، فمن الناحية الفنية، إنه اختبار لـ “كفاءة العينة” لنظام الذكاء الاصطناعي في التكيف مع شيء جديد.
لا يتمتع نظام الذكاء الاصطناعي مثل ChatGPT (GPT-4) بكفاءة كبيرة في التعامل مع العينات، فقد تم “تدريبه” على ملايين الأمثلة من النصوص البشرية، وبناء قواعد احتمالية حول مجموعات الكلمات الأكثر احتمالية، لذلك النتيجة جيدة جدًا في المهام الشائعة، وهو سيئ في المهام غير الشائعة، لأنه يحتوي على بيانات أقل (عينات أقل) حول هذه المهام.
تحتاج أنظمة الذكاء الاصطناعي إلى التعلم من أعداد صغيرة من الأمثلة والتكيف بكفاءة أكبر في التعامل مع العينات، وحتى تصل إلى ذلك، فلن تُستخدم إلا في الوظائف المتكررة للغاية وتلك التي يكون فيها الفشل العرضي مقبولاً.
تُعرف القدرة على حل المشكلات غير المعروفة أو الجديدة بدقة من عينات محدودة من البيانات بالقدرة على التعميم، ويُنظر إليها على نطاق واسع على أنها عنصر ضروري، بل وحتى أساسي، للذكاء.
تشبه اختبارات الـAI اختبارات الذكاء التي قد تتذكرها أحيانًا من المدرسة، ولا نعرف بالضبط كيف فعلت OpenAI ذلك، لكن النتائج تشير إلى أن نموذج o3 قابل للتكيف بدرجة كبيرة، من خلال بضعة أمثلة فقط، يجد قواعد يمكن تعميمها.
بدأت OpenAI بإصدار عام الغرض من نموذج o3، الذي يختلف عن معظم النماذج الأخرى، لأنه يمكن أن يقضي وقتًا أطول في “التفكير” في الأسئلة الصعبة، ثم دربته خصيصًا لاختبار ARC-AGI.