مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

52 خبر
  • نبض الملاعب
  • هدنة وحصار المضيق
  • العملية العسكرية الروسية في أوكرانيا
  • نبض الملاعب

    نبض الملاعب

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • هدنة بين حزب الله وإسرائيل

    هدنة بين حزب الله وإسرائيل

الذكاء الاصطناعي على بعد أشهر من تحقيق العلامة الكاملة في "الامتحان الأخير للبشرية"

يدعي مطورون أنه خلال بضعة أشهر فقط، ستتمكن أنظمة الذكاء الاصطناعي من الحصول على العلامة الكاملة في أحد أصعب الاختبارات المعرفية في العالم، المسمى "الامتحان الأخير للبشرية" (HLE).

الذكاء الاصطناعي على بعد أشهر من تحقيق العلامة الكاملة في "الامتحان الأخير للبشرية"
Gettyimages.ru

وهذا الاختبار صممه مسؤولو التكنولوجيا لقياس مدى ذكاء أنظمتهم، ويتكون من 2500 سؤال تم اختيارها بدقة، وتغطي نحو مائة موضوع مختلف، بدءا من علوم الصواريخ والأساطير وصولا إلى علم وظائف الأعضاء.

وكل سؤال يتطلب مستوى فهم لا يقل عن درجة الدكتوراه، وأي شخص يحصل على درجة قريبة من 100% يعد "خبيرا عالميا".

وقبل عامين فقط، حصل نظام ChatGPT من OpenAI على نسبة 3% فقط في هذا الاختبار، ولم تكن نتائج أنظمة "غوغل" وAnthropic أفضل بكثير. وقتها، ساعدت هذه النتائج في تهدئة المخاوف من تفوق الذكاء الاصطناعي، حيث أثبتت وجود فجوة كبيرة بين نماذج اللغة الكبيرة وأفضل الأكاديميين في العالم.

لكن يبدو أن هذا الاختبار المستحيل قد يصبح مجرد محطة أخرى في المسيرة السريعة للذكاء الاصطناعي. ففي الشهر الماضي فقط، سجل نظام Gemini من "غوغل" نسبة 45.9%، بعد أن كان قد حصل على 18.8% بعد أشهر فقط من محاولته الأولى.

ويقول كالفن تشانغ، رئيس الأبحاث في شركة Scale (الشركة المسؤولة عن الاختبار): "أردنا إنشاء اختبار أكاديمي بمستوى خبراء بشر، لا يستطيع حله سوى حفنة من الناس على وجه الأرض. لكننا رأينا تقدما مذهلا في نماذج اللغة خلال السنوات الماضية، والمطورون يقومون بعمل رائع في تحسين قدرات هذه النماذج على التفكير".

وتضيف كيت أولشيفسكا، مديرة المنتج في Google DeepMind: "إذا كان هذا هو هدفنا الوحيد في الحياة، أعتقد أننا سنصل إليه بسرعة كبيرة". وقد حققت شركة Anthropic (صانعة نظام Claude AI) نسبة 34.2%، وهي تحسن نتائجها بسرعة.

والحصول على درجة 100% في هذا الاختبار سيكون تطورا مهما، لأن الاختبار "مصمم ليكون آخر اختبار أكاديمي مغلق من نوعه"، كما يقول مبتكروه. وهذا يعني أنه إذا تمكن الذكاء الاصطناعي من حل هذا الاختبار، فسوف نحتاج في المستقبل إلى اختباره بأسئلة لا يعرف أي إنسان إجابتها.

وقد تم إنشاء الاختبار بالتعاون مع "مركز سلامة الذكاء الاصطناعي"، وهو منظمة غير ربحية، لقياس مدى معرفة الذكاء الاصطناعي وعمق تفكيره. 

وفي سبتمبر 2024، أطلق القائمون على الاختبار نداء عالميا لجمع الأسئلة، وقدموا جائزة قدرها 500 ألف دولار. وقد استجاب خبراء من نحو 50 دولة، وقدموا 70 ألف سؤال، بشرط أن تكون الإجابات قصيرة وواضحة وغير متوفرة بسهولة على الإنترنت.

وتم استبعاد الأسئلة التي استطاعت أي نماذج ذكاء اصطناعي حالية الإجابة عليها، ما قلص القائمة إلى 13 ألف سؤال. ثم تم اختيار 2500 سؤال نهائي، مع إجراء بعض التعديلات لاحقا بناء على ملاحظات المستخدمين. وما يزال عدد كبير من هذه الأسئلة سريا، لمنع الأنظمة من الاستفادة من الإجابات المتداولة عبر الإنترنت.

والنجاح في هذا الاختبار يذكرنا بفوز كمبيوتر IBM العملاق "ديب بلو" على بطل العالم في الشطرنج غاري كاسباروف عام 1997، وهو الأمر الذي حير توقعات معظم الخبراء. ومنذ ذلك الحين، تم تجاوز العديد من اختبارات الذكاء الاصطناعي الكبرى، مثل اختبار "المهام المتعددة الضخمة لفهم اللغة" (MMLU) الذي صدر عام 2020، ثم تم إيقافه بعد أن أصبح سهلا للغاية على الأنظمة، حيث كانت تسجل أكثر من 90%.

وتضيف أولشيفسكا أنه مع اقتراب الذكاء الاصطناعي من إتقان الاختبارات البشرية، أصبح التركيز الرئيسي للمطورين هو تجاوز حدود المعرفة البشرية الحالية. لكن تشانغ يرى أن هناك دائما مجالا للتخصص البشري، حيث يصعب على الذكاء الاصطناعي إتقان المجالات العملية مثل الجراحة، وكذلك المهارات القائمة على القرار مثل الحكم السليم والإبداع.

المصدر: ديلي ميل

التعليقات

سوريا.. القبض على أمجد يوسف المتهم الأول بارتكاب مجزرة حي التضامن الدمشقي (فيديو)

الدفاعات الجوية في طهران تتصدى لهدف معاد وسماع دوي إطلاق نار غربا وشرقا

نجل شاه إيران يتعرض لاعتداء في برلين (فيديو)

بيان إيراني حاد حول "استخدام" الولايات المتحدة أراضي وأجواء 5 دول خليجية

حديث بين السيسي والشرع في قبرص بعد تداول لقطات أثارت جدلا (فيديو)

ترامب: الوقت ليس في صالح إيران وأي اتفاق لن يتم إلا إذا كان مناسبا للولايات المتحدة وحلفائها والعالم

الشرع يعلق على "تجاوزات" في حفل افتتاح صالة رياضية بدمشق (فيديو)

"غيابه غصة في القلب".. الشرع يستقبل البويضاني بعد سنة من سجنه بالإمارات (فيديو+صور)

لحظة بلحظة.. الهدنة الهشة مستمرة بين الولايات المتحدة وإيران وانتهاكات في مضيق هرمز

‏وزير الحرب الأمريكي: قدمنا هدية للعالم بما فعلناه في إيران

"4000 بيضة يوميا".. مفاجأة من مطبخ أكبر السفن الحربية الأمريكية في الشرق الأوسط

إسرائيل تفجر مسجد الداغستان ومباني مدنية وخدمية في القنيطرة جنوب سوريا (صورة)

"أكسيوس": قرد يمنع بحارا أمريكيا من التوجه إلى مضيق هرمز

شبكة CNN: إيران تمسك بزمام حرب الاستنزاف مع الولايات المتحدة

طهران: سنضرب المواقع النفطية في الدول التي ينطلق منها أي عدوان علينا وردنا سيتجاوز مبدأ العين بالعين

لبنان لحظة بلحظة.. تمديد الهدنة ومفاوضات في البيت الأبيض وسط خروقات ميدانية في الجنوب

كاتس: الهجوم هذه المرة على ايران سيكون قاتلا وسنوجه ضربات مدمرة وسنهز أركانها وندمرها

بوتين حول تقييد الإنترنت في روسيا: سلامة الناس دائما في المقام الأول في حالة وجود تهديد إرهابي

إيران ترد على ترامب وتقارير "الانقسام الداخلي": لا متشددين ولا معتدلين.. نحن جميعا "ثوريون"

ترامب يرد على "نصيحة" الأمير هاري بشأن أوكرانيا ويؤكد مواصلة الجهود الأمريكية لتسوية الصراع

ترامب بحاجة ماسة للمساعدة

بريطانيا تدرس إرسال مقاتلات تايفون المتمركزة في قطر لتنفيذ مهمة في مضيق هرمز

سفير إيران في كازاخستان: الاعتداء على ميناء أنزلي تهديد للتعاون بين دول قزوين