پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1403
پدیدآورندگان:
مژگان اکابری [پدیدآور اصلی]، مریم خدابخش[استاد راهنما]
چکیده: چکیده
گسترش و توسعهی وب و افزایش اطلاعات دیجیتال، نیاز به سیستمهای بازیابی اطلاعات (IR) قوی و موثر را تشدید کرده است. پیشبینی عملکرد پرسوجو (QPP) نقشی محوری در شناسایی پرسوجوهای دشوار و بهبود روشهای بازیابی ایفا میکند. با این حال، روشهای QPP موجود از محدودیتهای متعددی رنج میبرند: (1) رویکردهای مبتنی بر امتیاز نمیتوانند روابط ساختاری بین اسناد بازیابی شده را به تصویر بکشند (2) روشهای نظارت شده به دادههای آموزشی برچسبگذاری شده نیاز دارند و آنها را برای حوزههای جدید پرهزینه و غیرعملی میسازد و (3) پیشبینیکنندههای پس از بازیابی بدون نظارت، اغلب تنها بر پراکندگی امتیاز بازیابی تکیه میکنند و از اثرات خوشهبندی اسناد غفلت میکنند.
برای پرداختن به این چالشها، ما یک روش جدید QPP مبتنی بر خوشهبندی پس از بازیابی را پیشنهاد میکنیم. به طور خاص، ما سه پیشبینیکننده بدون نظارت را معرفی مینمائیم: تمایز خوشهبندی شده: که قابلیت تفکیک پرسوجوی خاص خوشههای بازیابی شده را اندازهگیری میکند. رانش پرسوجوی خوشهبندی شده: که انحراف اسناد با رتبه برتر را از هدف پرسوجو تخمین میزند و یک رویکرد ترکیبی که هر دو را ترکیب میکند. با تجزیه و تحلیل ساختار خوشهبندی اسناد بازیابی شده، روش ما قابلیت تفسیر را بهبود میبخشد و در عین حال نیاز به دادههای برچسب دار را حذف میکند. ما عملکرد رویکرد خود را بر روی مجموعه دادهی رتبهبندی مقیاس بزرگ MS MARCO ارزیابی میکنیم. نتایج تجربی نشان میدهد که روش ما به طور قابل توجهی بهتر از مدلهای QPP مبتنی بر امتیاز پیشرفته عمل میکند. این یافتهها پتانسیل QPP آگاه از خوشه را برای تقویت سیستمهای بازیابی اطلاعات و کاهش تأثیر پرسوجوهای دشوار برجسته میکند.
کلید واژه ها (نمایه ها):
#کلمات کلیدی: پیشبینی عملکرد پرسوجو #خوشهبندی اسناد #دشواری پرسوجو
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: