تفاصيل الوثيقة

نوع الوثيقة : رسالة جامعية 
عنوان الوثيقة :
كشف الشائعات العربية باستخدام نقل المعرفة بالاعتماد على السمات النصية و المرئية
Arabic Rumor Detection Using Transfer Learning Based on Textual and Visual Features
 
الموضوع : كلية الحاسبات وتقنية المعلومات 
لغة الوثيقة : العربية 
المستخلص : في الآونة الأخيرة ، ازداد استخدام منصات الوسائط الاجتماعية مع سهولة الاستخدام وسهولة الوصول إليها ، مما جعل هذه المنصات مكانًا لانتشار الشائعات بسبب عدم وجود قيود على النشر ومصادقة المحتوى. لذلك ، هناك حاجة للاستفادة من تقنيات الذكاء الاصطناعي للكشف عن الشائعات على منصات التواصل الاجتماعي لمنع آثارها السلبية على المجتمع والأفراد. تستهدف معظم الدراسات الحالية التي تكشف عن الشائعات باللغة العربية نص التغريدة. ومع ذلك ، تحتوي التغريدات على أنواع مختلفة من المحتوى ، بما في ذلك النصوص والصور ومقاطع الفيديو وعناوين URL ، وتلعب الميزات المرئية دورًا أساسيًا في نشر الشائعات. تقترح هذه الدراسة نموذجًا عربيًا لكشف الشائعات لكشف الشائعات على تويتر باستخدام الميزات النصية والمرئية للتغريدات من خلال نوعين من الاندماج متعدد الوسائط: الاندماج المبكر والمتأخر. علاوة على ذلك ، استفدنا من نقل التعلم Transfer Learning للإصدارات العربية الحديثة من نماذج اللغة المدربة مسبقا BERT ، ونماذج تحويل النص إلى نص T5 ، ونماذج الرؤية الشائعة VGG-19 و ResNet50 و InceptionV3 . تم إجراء تجارب مختلفة لاختيار أفضل مستخرج ميزات نصية من بين ستة عشر نموذجًا للغة ونماذج استخراج الميزات المرئية لبناء النموذج متعدد الوسائط. تم استخدام MARBERTv2كمستخرج للميزات النصية، في حين تم استخدام ensemble of ResNet50 and VGG-19 كمستخرج للميزات المرئية. بعد ذلك، تم استخدام نماذج اللغة والرؤية للنماذج الفردية كخط أساس لمقارنة النتائج مع تلك الخاصة بالنماذج متعددة الوسائط. تم تقييم النماذج المقترحة باستخدام مجموعة البيانات المتاحة للجمهور AraFacts، وفيما يتعلق بقضايا الفصول غير المتوازنة، قمنا بجمع مجموعة بيانات الوسائط المتعددة الخاصة بنا ودمجها مع AraFacts. حققت نتائج التجارب لنموذجنا متعدد الوسائط للاندماج المبكر والمتأخر84, 85 f1-scores على التوالي. مقارنة بالنماذج أحادية الوسائط، يحقق نموذجا MARBERTv2 و ensemble of ResNet50 and VGG-19 79, 90 على التوالي. أظهرت نتائج التجارب أن النماذج متعددة الوسائط تعمل بشكل أفضل من نماذج الرؤية القائمة على الصور ولا يمكنها أن تتفوق على النماذج القائمة على النص. توضح النتائج التي توصلنا إليها فعالية الميزات النصية في مهام الكشف عن الشائعات مقارنة بالنماذج متعددة الوسائط. الكلمات المفتاحية : معالجة اللغات الطبيعية، الذكاء الصناعي، التعلم العميق، كشف الشائعات ، نقل المعرفة ، الاندماج متعدد الوسائط 
المشرف : د.أماني طارق جمال 
نوع الرسالة : رسالة ماجستير 
سنة النشر : 1445 هـ
2023 م
 
المشرف المشارك : د. علاء عمر خديدوس 
تاريخ الاضافة على الموقع : Friday, November 10, 2023 

الباحثون

اسم الباحث (عربي)اسم الباحث (انجليزي)نوع الباحثالمرتبة العلميةالبريد الالكتروني
رشا مسلم البلويAlbalawi, Rasha Musallamباحثماجستير 

الملفات

اسم الملفالنوعالوصف
 49528.pdf pdf 

الرجوع إلى صفحة الأبحاث