دراسة تكشف أن قدرات الذكاء الاصطناعي مبالغ فيها بسبب اختبارات معيبة
آخر تحديث GMT 11:36:36
المغرب اليوم -
7 شهداء و7 مصابين جراء غارات إسرائيلية على جنوب وشرق لبنان مقتل 24 شخصًا وإصابة العشرات في تفجير استهدف قطارًا يقل عسكريين في باكستان سكان يضرمون النار في مركز لعلاج الإيبولا بشرق جمهورية الكونغو الديمقراطية وسط تصاعد التوترات السلطات الباكستانية تعلن إصابة 20 شخصاًًَعلى الأقل إثر وقوع انفجار بالقرب من خط سكة حديد في مدينة كويتا إيران تعلن إعدام جاسوس متهم بتسريب معلومات حساسة عن الصناعات الدفاعية لإسرائيل تفش غامض لبكتيريا السالمونيلا يثير القلق بعد إصابات متزايدة في الولايات المتحدة ارتفاع حصيلة ضحايا فيروس إيبولا في جمهورية الكونغو الديمقراطية إلى 204 اندلاع حريق في مستودع نفطي في نوفوروسيسك نتيجة سقوط مسيرة أوكرانية دون تسجيل أي إصابات راكب مشاغب يجبر طائرة أميركية على الهبوط الاضطراري بعد محاولة فتح الباب أثناء التحليق ارتفاع ضحايا انهيار المبنى السكني في مدينة فاس المغربية إلى 15 وفاة وتحقيقات لكشف ملابسات الحادث
أخر الأخبار

دراسة تكشف أن قدرات الذكاء الاصطناعي مبالغ فيها بسبب اختبارات معيبة

المغرب اليوم -

المغرب اليوم - دراسة تكشف أن قدرات الذكاء الاصطناعي مبالغ فيها بسبب اختبارات معيبة

قدرات الذكاء الاصطناعي تحت المجهر
واشنطن - المغرب اليوم

قال باحثو دراسة جديدة إن الأساليب المستخدمة لتقييم قدرات أنظمة الذكاء الاصطناعي غالبًا ما تُبالغ في تقدير أدائها وتفتقر إلى الدقة العلمية.

وفحصت الدراسة التي قادها باحثون في معهد أكسفورد للإنترنت بالشراكة مع أكثر من 30 باحثًا من مؤسسات أخرى، 445 اختبارًا بارزًا للذكاء الاصطناعي، تُسمى معايير الأداء المرجعية، وتُستخدم غالبًا لقياس أداء نماذج الذكاء الاصطناعي في مجالات موضوعية متنوعة.

ويستخدم مطورو وباحثو الذكاء الاصطناعي هذه المعايير لتقييم قدرات النماذج والترويج للتقدم التقني الذي يحرذونه، بالاستناد إليها لتقديم ادعاءات حول موضوعات تتراوح بين أداء هندسة البرمجيات والقدرة على التفكير المجرد.

ومع ذلك، تزعم الدراسة، التي صدرت الأسبوع الماضي، أن هذه الاختبارات الأساسية قد لا تكون موثوقة، وتُشكك في صحة العديد من نتائج معايير الأداء المرجعية.

ووفقًا للدراسة، يفشل عدد كبير من معايير الأداء المرجعية البارزة في تحديد ما تهدف إلى اختباره تحديدًا، وتعيد استخدام البيانات وطرق الاختبار من معايير الأداء الموجودة مسبقًا بشكل مقلق، ونادرًا ما تستخدم أساليب إحصائية موثوقة لمقارنة النتائج بين النماذج.

وجادل آدم مهدي، وهو باحث أول في معهد أكسفورد للإنترنت وأحد المؤلفين الرئيسيين للدراسة، بأن هذه المعايير قد تكون مضللة بشكل مثير للقلق.

وقال مهدي، لـ"إن بي سي نيوز": "عندما نطلب من نماذج الذكاء الاصطناعي أداء مهام معينة، فغالبًا ما نقيس في الواقع مفاهيم أو تراكيب مختلفة تمامًا عما نهدف إلى قياسه".

واتفق معه أندرو بين، الباحث في معهد أكسفورد للإنترنت وأحد المؤلفين الرئيسيين للدراسة، على أنه حتى معايير الأداء المرجعية الموثوقة غالبًا ما تُمنح ثقة عمياء وأنها تستحق مزيدًا من التدقيق.

تقيس بعض المعايير التي فحصتها الدراسة مهارات محددة، مثل مهارات اللغة الروسية أو العربية، بينما تقيس معايير أخرى قدرات أكثر عمومية، مثل التفكير المكاني والتعلم المستمر.

وكانت إحدى القضايا الجوهرية بالنسبة للباحثين هي ما إذا كان معيار الأداء يُعدّ اختبارًا جيدًا للظاهرة الواقعية التي يهدف إلى قياسها. فبدلًا من اختبار نموذج على سلسلة لا نهائية من الأسئلة لتقييم قدرته على التحدث بالروسية، على سبيل المثال، يقيس أحد المعايير المرجعية التي تم مراجعتها في الدراسة أداء النموذج في تسع مهام مختلفة، مثل الإجابة بنعم أو لا باستخدام معلومات مأخوذة من ويكيبيديا الروسية.

ومع ذلك، فإن حوالي نصف معايير الأداء التي فحصتها الدراسة تفشل في تعريف المفاهيم التي تدعي قياسها بشكل واضح، مما يثير الشك حول قدرة هذه المعايير على تقديم معلومات مفيدة عن نماذج الذكاء الاصطناعي التي يتم اختبارها.

وفي الورقة البحثية الجديدة، يقدم المؤلفون ثماني توصيات، ويقدمون قائمة تدقيق لتنظيم معايير المقارنة وتحسين الشفافية والثقة بها. وتشمل التحسينات المقترحة تحديد نطاق الإجراء المُقيَّم، وبناء مجموعات من المهام تُمثل بشكل أفضل القدرات الإجمالية المُقاسة، ومقارنة أداء النماذج عبر التحليل الإحصائي.

وتستند هذه الدراسة إلى أبحاث سابقة أشارت إلى وجود عيوب في العديد من معايير الأداء المرجعية للذكاء الاصطناعي.

وفي العام الماضي، دعا باحثون من شركة الذكاء الاصطناعي "أنثروبيك" إلى زيادة الاختبارات الإحصائية لتحديد ما إذا كان أداء النموذج في معيار مرجعي محدد يُظهر فعلًا فرقًا في القدرات، أم أنه مجرد نتيجة محظوظة بناءً على المهام والأسئلة المدرجة في هذا المعيار.

قد يهمك أيضــــــــــــــا

أبوظبي تجمع رواد الذكاء الاصطناعي والتنقل الذكي والروبوتات

وزير التعليم العالي السورى :إحداث ماجستير في هندسة البرمجيات ونظم المعلومات العام الجاري

 

 

almaghribtoday
almaghribtoday

الإسم *

البريد الألكتروني *

عنوان التعليق *

تعليق *

: Characters Left

إلزامي *

شروط الاستخدام

شروط النشر: عدم الإساءة للكاتب أو للأشخاص أو للمقدسات أو مهاجمة الأديان أو الذات الالهية. والابتعاد عن التحريض الطائفي والعنصري والشتائم.

اُوافق على شروط الأستخدام

Security Code*

 

دراسة تكشف أن قدرات الذكاء الاصطناعي مبالغ فيها بسبب اختبارات معيبة دراسة تكشف أن قدرات الذكاء الاصطناعي مبالغ فيها بسبب اختبارات معيبة



يارا السكري تخطف الأنظار بإطلالات راقية في مهرجان كان 2026

باريس - المغرب اليوم

GMT 03:59 2026 الأربعاء ,20 أيار / مايو

"الناتو "يدرس" المساهمة في ضمان حماية مضيق هرمز

GMT 07:13 2026 الثلاثاء ,27 كانون الثاني / يناير

سعر الذهب في المغرب اليوم الثلاثاء 27 يناير/ كانون الثاني 2026

GMT 08:20 2019 السبت ,16 شباط / فبراير

المغرب وصيفًا لبطل شمال إفريقيا لكرة اليد

GMT 01:40 2016 السبت ,24 كانون الأول / ديسمبر

عواصف ثلجية مذهلة تُوضح جنون تغير الطقس

GMT 18:09 2018 الإثنين ,10 كانون الأول / ديسمبر

عبد الغني معاوي خارج حسابات الجيش الملكي

GMT 12:04 2018 الجمعة ,02 تشرين الثاني / نوفمبر

"دي بروين" يغيب عن ديربي مانشستر للإصابة

GMT 10:46 2018 الثلاثاء ,22 أيار / مايو

طريقة تحضير الزبادي في المنزل
 
almaghribtoday

Maintained and developed by Arabs Today Group SAL
جميع الحقوق محفوظة لمجموعة العرب اليوم الاعلامية 2023 ©

Maintained and developed by Arabs Today Group SAL
جميع الحقوق محفوظة لمجموعة العرب اليوم الاعلامية 2023 ©

almaghribtoday almaghribtoday almaghribtoday almaghribtoday
almaghribtoday almaghribtoday almaghribtoday
almaghribtoday
RUE MOHAMED SMIHA ETG 6 APPT 602 ANG DE TOURS CASABLANCA MOROCCO
almaghrib, Almaghrib, Almaghrib