راه ترقی | هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد! دانش

بزرگنمايي:

راه ترقی - ایسنا / گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-4»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.
به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود 46 درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.
«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.
پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس 1500 سال پس از آن دوره در مصر ظاهر شد.
چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.
به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.
چانونا گفت: اگر 100 بار به شما A و B و 1 بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.
پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.
«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.
با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.
در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

دوشنبه ۱ بهمن ۱۴۰۳ - ۲۳:۱۰:۰۵
۲۳ بازديد
راه ترقی

https://www.rahetaraghi.ir/Fa/News/1017276/

آخرین وضعیت پرداخت سود سهام عدالت به مردم

تعیین و تکلیف حذف کارت سوخت خودرو در سه ماه اول 1404

افزایش مجدد قیمت لبنیات تکذیب شد

استایل کهکشانی هانده ارچل در عربستان

آخرين مطالب

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد! دانش

نظرات شما

ساير مطالب

چالش انتخاب بهترین دروازه‌بان تاریخ ایران با رحمتی

کارشناسی داوری دیدار آلومینیوم - استقلال خوزستان

تمرین بازیکنان نساجی و آماده سازی برای بازی با فولاد

حواشی بازی استقلال و شمس آذر

کارشناسی داوری دیدار استقلال - شمس آذر قزوین

کارشناسی داوری دیدار خیبر خرم آباد - هوادار

کارشناسی داوری دیدار گل گهر سیرجان - ملوان

خلاصه بازی چلسی 3 - ولورهمپتون 1

تایم لاین وضعیت پرسپولیس در دی ماه 1403؛ از برکناری گاریدو تا شکست در سوپرجام

موج جدید شعارهای نژادپرستانه در مستایا این‌بار علیه تاکه‌فوسا کوبو!

گل مردود جکسون؛ چلسی 3-1 ولورهمپتون

مهدی رحمتی: آزادی مهاجم خوبی است، فشار زیاد بازیها باعث مصدومیت ماشاریپوف شد

امیر شبانی بازیکن شمس آذر: موسیمانه حالا به بازیکنانش بیشتر تعطیلی بدهد

پیش بینی مهدی رحمتی از رتبه استقلال در پایان لیگ بیست و چهارم

ترکیب احتمالی پرسپولیس برای تقابل با ذوب‌آهن

توضیحات علیرضا اسدی عضو هیات مدیره استقلال درباره نقل و انتقالات باشگاه

گل اول ولورهمپتون به چلسی توسط مت دوهرتی

ترس اصلی لوکا مودریچ پیدا شد

گل دوم چلسی به ولورهمپتون توسط کوکوریا

گل سوم چلسی به ولورهمپتون توسط نونی مادوئکه

گل سجاد شهباززاده در بازی امروز استقلال خوزستان با آلومینیوم اراک از نمایی متفاوت

مهدی رحمتی: استقلال با هیات مدیره جدید موفق خواهد شد اما زمان نیاز است

مهدی رحمتی:مرور زمان باعث خواهد شد استقلال به روزهای خوب خودش نزدیک شود

مهدی رحمتی: بازیکنان ایرانی دیگر به دنبال پیشرفت نیستند و به پول فکر می کنند

صحبت های مهدی رحمتی درباره برتری شمس آذر مقابل استقلال

توضیحات علیرضا اسدی عضو هیات مدیره استقلال درباره وضعیت بحرانی استقلال

علیرضا اسدی: موسیمانه سرمربی توانمندی است و بازیکنان استقلال ارزشمند هستند

مهدی رحمتی: مشکلات استقلال ریشه در اول فصل دارد

بادامکی: دو گزینه خارجی سرمربیگری پرسپولیس قصد آمدن به ایران را نداشتند

توضیحات بادامکی درباره نقل و انتقالات و احتمال جدایی سعید صادقی و ژوائو

مصاحبه ها و کری بازیکنان سپاهان پس از قهرمانی سوپرکاپ

بادامکی: آقای درویش فردا برای مذاکره جدی با گزینه سرمربیگری پرسپولیس به ترکیه می رود

کارشناسی داوری بازی سپاهان و پرسپولیس

توصیحات مهدی رحمتی درباره چگونگی حضور روی نیمکت شمس آذر

کفاشیان: باید برای فدراسیون فوتبال مدیر بسازیم

گل اول چلسی به ولورهمپتون توسط آدارابیو

در مکان و در زمان مناسب، بازیکنان NBA از یک خبرنگار به عنوان چوب لباسی استفاده کردند

مهدی رحمتی: بودجه تیم هوادار 55 میلیارد بود، اگر به عقب برگردم، هوادار را انتخاب نمی کنم

از نظر «بهزاد فراهانی» شقایق بازیگر بهتری است یا گلشیفته؟!

دلش از عروسش پره!

بهزاد فراهانی: صدای من به وسیله رادیو به گوش پدر و مادرم رسید

علی مصفا بخاطر بازی در کدام فیلم سیمرغ بلورین گرفت؟

بهزاد فراهانی: در کودکی بخاطر یک مداد و گلابی فلک شدم

تمام قوانین فیزیک را نقض کرد!

تسلط خاص بانو «مریلا زارعی» بر گویش‌ها و لهجه‌های مختلف

چهره ها/ آقای گلزار از بچگی باکلاس بود!

جشن تولد 59 سالگی «سیدجواد هاشمی» در کنار نوه اش

سناریوهای ترور

ابوطالبی: چرا باید به سمت مذاکرات با آمریکا رفت؟

اقتصاددان آمریکایی: تورم ترامپ را پیروز کرد

تبليغات