شنبه، 13 شهريور ماه ، 1389
منو
تبلیغات

لینک های مرتبط
لينکها
مجلات تخصصی نور


مرکز تحقیقات کامپیوتری علوم اسلامی


فاوا نیوز


خبرگذاری قرآنی ایران


فروشگاه اینترنی نورشاپ


پایگاه اطلاع رسانی حوزه


کتابخانه دیجیتالی نور


پایگاه شبکه اطلاع رسانی نور


پایگاه امام علی(ع)


پایگاه راهنمای پایگاه های اسلامی


پایگاه اطلاع رسانی رسول نور


راهنمای پایگاه های نبی اعظم(ص)


راهنمای پایگاه های امام مهدی(عج)


پایگاه فاضلین نراقی


پایگاه طوبی گرافیک


پایگاه سازمان آموزش نور


پایگاه خبرگان رهبری


پایگاه اطلاع رسانی اندیشوران


پایگاه گرداب


بنیاد ملی بازی های رایانه ای


شورای عالی انقلاب فرهنگی


پایگاه اطلاع رسانی جهاد دانشگاهی


خبرگزاری فارس


خبرنامه

ایمیل شما::

عضویت لغو عضویت
 
مقالات
فناوری اطلاعات

فضای مجازی، هويت و جامعه


بحران هویت جنسی دختران در فضای مجازی


نگاهی به مفهوم هویت در فضای مجازی


امضاي ديجيتال؛ هويت در فضاي مجازي


جنگ فرکانس‌ها بر مدار خانواده


آرشیو مقالات
گروه مقالهدین،فرهنگ و فناوری اطلاعات 
عنوان مقالهراهكارهاى رايانه‏اى شناسايى احاديث مشابه گفتگو با حجة الاسلام مجتبى سقايى
نویسندهانتخاب کنید
بازدید98
تاریخ انتشار1383-09-18
فایل مطلب
متن مقاله
 موضوع بازيابى و شناخت احاديث مشابه در كتب روايى و تهيه متونى خالى از روايات شبيه به هم، از ديرباز مورد توجه عالمان و انديشمندان اسلامى بوده است و تا به حال اقدامات شايسته‏اى در اين مسير صورت گرفته و كارهاى پراكنده‏اى نيز در حال انجام است.
 براى روشن‏سازى زواياى مختلف اين بحث، نشريه ره‏آورد نور گفتگويى را كه با جناب آقاى «سقايى» معاونت فنى مركز تحقيقات كامپيوترى علوم اسلامى به انجام رسانده، در معرض مطالعه خوانندگان و علاقه‏مندان محترم قرار مى‏دهد و افق‏هاى جديدى را فراسوى متوليان اين موضوع مى‏گشايد. ايشان در بحث خود به الگوريتم‏ها يا همان منطق پردازش داده‏ها در اين زمينه پرداختند و فرض‏هاى مختلفى را براى برنامه‏نويسى رايانه‏اى به منظور شناسايى احاديث مشابه ارائه دادند.
 
در ابتداى بحث، لطفاً بفرماييد كه مقارنة الاحاديث چيست و چه جايگاهى دارد؟
در مورد مقارنةالاحاديث دو ديدگاه وجود دارد: اوّل، تعريف حديث از نظر سندى و رجالى صرف نظر از متن آن. دوم، تعريف حديث از لحاظ محتوا و متن حديث بدون توجه به سند آن. بحث مقارنة الاحاديث در هر دو مورد مطرح است؛ به اين معنا كه گاهى پژوهشگر رجالى روى سندهاى مشابه تفحص مى‏كند و ممكن است متن حديثى كه از طريق سلسله سندهاى مقارن و شبيه به هم نقل شده، با يكديگر متفاوت باشند. از اين‏رو، يافتن روايات تكرارى از نظر سند، صرف نظر از محتوا، مبحث مقارنة الاحاديث در حيطه سند حديث را تشكيل مى‏دهد.
 گاهى نيز محقق روى متن روايت پژوهش مى‏كند و عنايتى به سند آن ندارد، چون ممكن است كه روايت مورد نظر پژوهنده، از طريق سندهاى متفاوتى نقل شده باشد؛ كه در متن و محتوا مشترك‏اند. البته اجتماع دو مورد فوق؛ يعنى تقارن احاديث در زمينه سند و متن نيز قابل تصور است و مى‏توان اين امر را مورد تحقيق قرار دهيم كه مجموع متن و سند يك حديث در چه منابعى وارد شده است.
 بنابراين، مقارنة الاحاديث به معناى بررسى و يافتن روايات مشابه از نظر سند، متن و يا هر دو است.
 
به طور كلى براى يافتن متون مشابه در زبان‏هاى مختلف چه روشهائى وجود دارد؟
فرايند يافتن متون مشابه و روشهاى پردازش متن براى اين منظور موضوع مباحث مهمى مانند «پردازش زبان طبيعى -Datamining(داده‏كاوى)» است كه امروزه در مهندسى نرم‏افزار مطرح مى‏باشد و براى اين كار پروژه‏هاى مطالعاتى و تحقيقاتى در دنيا انجام گرفته كه برخى از آنها نيز عملى گرديده است. بطور مشخص در برنامه‏هاى تحت وب و موتورهاى جستجوى آن بكار رفته است. براى مثال «Stemming» (استفاده از ريشه‏هاى كلمات) براى جستجو در بانك‏هاى اطلاعاتى(Sql-Server,Index server )با قابليت جستجوى متن كامل(Search,full teut) براى برخى از زبانها مانند انگليسى ارائه شده و مورد استفاده است.
 اين فرايند در زبانهاى مختلف، داراى ويژگيهاى خاص خود مى‏باشد. پيچيدگى زبانى از لحاظ دستورى، لغوى، رسم‏الخط و املاء مى‏تواند موجب فراهم نيامدن مقدمات و پيش‏نيازهاى چنين پردازشى گردد و انجام آن را تا مرز غير مفيد و يا حتى غير ممكن باعث شود.
 در اين رابطه زبانهائى چون: فارسى و عربى، به دليل اين گونه پيچيدگى‏ها و ساختارهاى مدرن دستورى و در عين حال نارسائى‏هائى كه در كتابت و رسم الخط آن مانند نبود مصوّت‏ها و چسبيدگى وندها به كلمه معتل و مضاعف بودن واژگان وجود دارد، انجام روشهاى بكار رفته در زبانهاى ديگر را مورد ترديد قرار داده است و بايستى با در نظر داشت خصوصيت و مشكلات آنها روشهاى ديگرى براى اين منظور ابداع و ارائه داد.
 چنين روشهائى مى‏تواند با استفاده از عناصر مفهومى و علمى در حوزه‏هاى علوم بهينه و كاراتر گردند براى مثال در موضوع حديث يا فقه براى اجراى اين فرايند، ضمن تحليل دقيق و مطالعه زمينه‏ها و جوانب آنها مى‏توان از ابزارهاى نرم‏افزارى خاص حديث يا فقه در عمليات مقارنة استفاده كرده و روشهاى يافتن متون مشابه را تقويت نمود.
 
مشكلات موجود در زمينه استخراج متون مشابه حديثى و ارائه آنها در قالب نرم‏افزار را چگونه ارزيابى مى‏كنيد؟ و اصولاً چه روش يا روش‏هايى براى برطرف كردن اين موانع پيشنهاد مى‏نماييد؟
يكى از مشكلات اين مسير، پيشوندها و پسوندهايى است كه در زبان عربى و يا فارسى به قبل يا بعد يك كلمه مى‏چسبد، زيرا در اين حالت، شكل املايى كلمات تغيير پيدا مى‏كند و اين موضوع در بازخوانى متون توسط رايانه مشكل ايجاد مى‏كند. چنين واژه‏هايى از لحاظ تركيبى از دو يا چند كلمه تشكيل شده‏اند و شامل يك اسم و يك حرف، يك فعل و يك اسم، و مواردى از اين دست مى‏باشند. در حالى كه در زبان انگليسى كلمات گوناگون به دليل استقلال و جدايى حروف از يكديگر، قابل تشخيص است.
 مشكل ديگر، وجود انبوهى از الفاظ مشترك چه در حوزه لغت و چه در حوزه كتابت (با لحاظ عدم وجود مصوتها) است كه در ارائه پاسخ‏هاى نادرست به كاربر مؤثر است و گاهى نيز يك لفظ مشترك در دو معناى كاملاً متفاوت و يا متناقض به كار مى‏رود. بديهى است اين نوع موارد، مدّ نظر كاربر نبوده و نمى‏توان آنها را يكى فرض كرد. اگرچه ساختار زبانى، چنين اشكال‏هايى را در مسير تهيه برنامه رايانه‏اى مقارنة الاحاديث موجب مى‏شود، اما پايه‏هاى زبان عربى صرف نظر از نارسائى كتابتى آن به گونه‏اى است كه مى‏توان از طريق راه‏هائى اين مشكلات را از پيش‏رو برداشت.
 از جمله اين روش‏ها تهيه فهرست «كلمات پيراسته» است. در اين روش بايد نخست كلمات يك عبارت را از پيشوندها و پسوندهاى گوناگون پيراسته نمود و آنگاه در متن به جستجوى كلمه پيراسته با تمامى تركيب‏هاى آن پرداخت.
 به عنوان مثال، كلمه تركيبى «فَضَرَبَ» از يك حرف (فاء عاطفه) و يك فعل (ضَرَبَ) تشكيل شده است. در اينجا چون بار مفهومى كلام به روى فاء كمتر از ضَرَبَ است، كلمه پيراسته‏شده و اين واژه مركب، ضرب خواهد بود و در فرايند جستجو كلمات مشابه اين كلمه بازيابى مى‏گردد. بنابراين عمليات مقارنة الاحاديث را مى‏توان بر روى واژه‏هاى پيراسته انجام داد.
 در اين ميان، برخى كلمات وجود دارند كه نمى‏توان شكل پيراسته آن را به آسانى مشخص نمود، خاصه اين‏كه اگر اعراب نداشته باشند؛ مثلاً كلمه «بعد» اگر حرف نخست آن غير مكسور باشد، مى‏تواند خود يك واژه پيراسته به حساب آيد؛ ولى چنانچه حرف اوّل آن مكسور باشد (بِعدٍ)، كلمه پيراسته‏اش «عد» خواهد بود. بنابراين، در كلماتى از اين دست، به دليل وجود احتمالات مختلف تعيين واژه، پيراسته به راحتى صورت نمى‏گيرد. در اينجا بايد به موارد استعمال و قراين موجود در كلام توجه كرد و كلمه پيراسته را تشخيص داد.
 
آيا مى‏توان با اعراب‏گذارى درست كلمات، از بروز چنين مشكلاتى در امر بازيابى احاديث مشترك جلوگيرى كرد؟
اعراب‏گذارى يكى از مشكلات كه نبود مصوتها است را از پيش‏رو بر مى‏دارد ولى وجود اشتراك‏هاى لغوى و كتابتى باز ممكن است حتى فرايند پيراسته ساختن كلمات را هم دچار چالش كند كه در اين صورت بايد متن را نيز مورد دقت قرار داد؛ مثلاً كلمه «أهْلَكَ» هم محتمل است كه فعل ماضى باب افعال باشد، هم احتمال دارد كه دو اسم مضاف باشد (أهْلَ + كَ). در اينجا اعراب‏گذارى به پيراسته‏سازى كلمات كمك نمى‏كند؛ بلكه بايد به متن رجوع كرد و شكل پيراسته را شناخت.
 البته راه‏حل ديگرى نيز وجود دارد و آن اين است كه بدون مراجعه به متن، احتمالات گوناگون يك كلمه را در نظر گرفت و با ارائه فهرستى از كلمات محتمل در هر يك، به انجام جستجو پرداخت؛ به عنوان نمونه، در مورد واژه «أهَلَكَ» يك بار كلمه «أهْلَكَ» را به عنوان فعل ماضى مورد جستجو قرار مى‏دهيم و يك بار ديگر كلمه «أهْل» را در خط ورود جستجو درج مى‏نماييم.
 كاستى اين روش آن است كه قابليت پيراسته‏سازى، در خصوص الفاظ مشترك و يا در مواردى كه بار مفهومى كلام روى قسمتى است كه در فهرست واژگان پيراسته قرار نمى‏گيرد، مشكل خواهد بود.
 
جهت دستيابى به احاديث مشابه، آيا فقط از طريق امكان پيراسته‏سازى مى‏توان اقدام كرد؟ با توجه به نقصى كه اين روش دارد، چه راه حل‏هاى ديگرى را پيشنهاد مى‏كنيد؟
گاهى استفاده از فهرست كلمات پيراسته موجب بروز احتمالات و به تبع سردرگمى بيشتر كاربر خواهد شد. از اين‏رو، بايد به راهكارهاى ديگرى تمسك جست. قدم اوّل، اين است كه عبارت انتخابى را بدون هيچ كم و كاستى جستجو كنيم. در اين حالت، ممكن است برخى جوابهاى موجود ارائه نگردد.
 قدم بعدى اين است كه كاربر به وسيله ريشه عبارات به انجام پژوهش اقدام نمايد؛ زيرا ريشه كلمات بسيار كارآمدتر از كلمات پيراسته پژوهشگر را در امر تحقيق يارى مى‏رساند و در واقع، پاسخ‏هاى ارائه شده بيشتر به موارد دلخواه كاربر نزديك است. و در عين حال كامل‏تر و جامع‏تر ارائه خواهد شد.
 
در مواردى ممكن است كه نقل‏هاى متفاوتى از يك متن صورت گرفته باشد؛ مثل اينكه عبارت‏ها جابه‏جا شده يا ضمير به جاى اسم آمده است. در اين گونه مواقع، چه بايد كرد؟
قبل از توضيح برخى از اين الگوريتم‏ها، بعنوان يكى از مقدمات كار بايستى اين مطلب را در نظر داشت كه در ميان كلمات واژه‏هائى وجود دارند كه به آنهاNoise word)كلمات پر ارزش) گفته مى‏شود. تهيه فهرستى از اين واژه‏گان و جدا كردن آنها از پردازش، بسيار مؤثر و مهم است.
1-جستجوى عبارت:
 اين روش ابتدائى‏ترين روش براى يافتن يك عبارت از متون و استخراج مشابهات آن مى‏باشد در اين گام عين عبارت (البته صرف نظر ازNoise wordها) مورد جستجو قرار مى‏گيرد.
2-جستجوى كلمات عبارت با حفظ ترتيب:
 در اين روش كلمات عبارت مورد نظر با در نظرداشت توالى كلمات و ترتيب آنها (ضمن آنكه مى‏توان فاصله كلمات را نيز تنظيم كرد) مورد پردازش خواهد بود.
3-جستجوى كلمات عبارت:
 در اين مرحله كلمات عبارت در متون مورد جستجو قرار گرفته و به ميزان فراوانى كلمات مى‏توان حكم به مشابهت متون يا عدم مشابهت داد.
4-جستجوى كلمات پيراسته عبارت مورد نظر با حفظ تركيب:
 در اين روش واژگان به شكل پيراسته آنها تبديل شده ولى تركيب عبارتى آنها حفظ مى‏گردد آنگاه عبارت پيراسته مورد جستجو قرار مى‏گيرد و موارد مشابه استخراج مى‏شود.
5-جستجوى كلمات پيراسته عبارت با حفظ ترتيب:
 در اين جا نيز واژگانِ پيراسته مورد پردازش خواهد بود ولى نسبت به تركيب حساسيت از بين مى‏رود و در حدّ ترتيب و توالى كلمات پيراسته (با امكان تنظيم ميزان فاصله بين كلمات) عمليات مشابه‏يابى انجام خواهد شد.
6-جستجوى كلمات پيراسته بدون در نظر گرفتن ترتيب و تركيب:
 در اين روش، كلمات پيراسته در متن مورد جستجو قرار گرفته و به ميزان جواب و نسبت آن مى‏توان مشابه‏يابى كرد.
7-جستجوى واژگان ريشه با حفظ تركيب
8-جستجوى واژگان ريشه با حفظ ترتيب (با تنظيم ميزان فاصله بين ريشه‏ها)
9-جستجوى واژگان ريشه (با در نظر گرفتن نسبت وجود ريشه‏ها در متون)
 در اين سه روش اخير كلمات عبارت به ريشه برگردانده شده و عمليات فوق مانند پردازش‏هاى قبلى انجام خواهد شد.
 از آنجا كه نتايج بدست آمده از اين روشها از لحاظ درستى و جامعيت با هم متفاوتند، استفاده از هر كدام از اين‏ها نياز به آزمايش و تجربه خواهد داشت. ولى درستى و جامعيت معمولاّ بصورت متعاكس مى‏باشند به اين معنى كه در جاهائى كه جواب درست داده مى‏شود تمامى موارد بدست نمى‏آيد و در جائى كه با جوابهاى فراوان‏ترى مواجه هستيم، جوابهاى نادرست كم نخواهيم داشت.
 
تا اينجا روش‏هاى كلى همچون: جستجو از طريق عبارات، كلمات پيراسته، ريشه، ترتيب و عدم ترتيب را براى دستيابى به متون مشابه ارائه داديد. در خصوص مقارنة الاحاديث كه محور بحث ماست و اقتضائات مرتبط با خود را مى‏طلبد، چه منطق پردازش ديگرى قابل ارائه است؟
ضمن پذيرش و ارائه راه‏هاى يادشده در مورد مقارنة الاحاديث، شيوه‏هاى ديگرى نيز هست كه قابل بحث و عرضه مى‏باشد. چنانچه قبلاّ هم ذكر شد استفاده از محورها و عناصر مفهومى مى‏تواند اين پردازش‏ها را سامان دهد. در زمينه حديث مى‏توان از اطلاعات موجود در نرم‏افزارهاى حديثى و رجالى استفاده كرد. مبحث رجال ارتباط زيادى با موضوع مقارنة الاحاديث دارد؛ چون گاهى از يك راوى در سند حديث با تعابير گوناگونى ياد مى‏شود؛ يك جا اسم او آمده، جاى ديگر كنيه‏اش و در سلسله سند ديگر صفت او ذكر شده و در يك سند نيز تركيبى از اين موارد به چشم مى‏خورد. بديهى است در اين حالت، اگر بخواهيم در امر جستجو صرفاً به تشابهات لفظى بسنده كنيم، پاسخ‏هاى مشابه زيادى از دسترس كاربر دور مي ماند. به همين جهت، تعبير واحدي را براي اين موارد ارائه مي كنيم. اين تعابير بسيار راهگشا هستند و به پژوهشگران در بازيابي مقارنه سندي احاديث كمك شاياني مي كنند.
. در اينجا ما از يك ابزار متنى به عنوان يك معيار استفاده نموديم و مقوله پيدا كردن اسانيد مشترك را سامان بخشيديم كه خود بسيار ثمربخش و مفيد است.
 از جمله امورى كه در اسناد روايات به صورت چشمگير موجود و از ديرباز موجب بروز مشكلاتى در استناد به متون روايى گشته، عناوينى است كه مشترك بين دو يا چند راوى است. به چنين عناوينى در اصطلاح رجال، عناوين مشترك، و به بحثى كه عهده‏دار حل اين مشكل است، «تمييز مشتركات» مى‏گويند.
 به عنوان مثال، اگر در اسناد كافى به عنوان «احمد بن محمد» برخورد كنيم و به جاى عنوان مشترك در سند توجهى ننماييم، دامنه بسيار گسترده‏اى را پيش‏رو خواهيم داشت؛ چرا كه عنوان فوق در نگاه اوّل، مردد بين پنج نفر است كه عبارت‏اند از: احمد بن محمد بن سعيد بن عقده، احمد بن محمد العاصمى، احمد بن محمد بن عيسى، احمد بن محمد بن خالد، احمد بن محمد بن ابى نصر. در قدم اوّل بايد با مشخص كردن طبقه عنوان، از دامنه ترديد كاست. البته در برخى موارد، صرفاً با شناخت طبقه راوى و جايگاه خاص او در سند، عنوان مردد از حالت اشتراك خارج مى‏شود.
 چنانچه با تعيين جايگاه راوى در سند، ترديد برطرف نشد، بايد از راه‏هاى مختلف به تعيين اطراف ترديد پرداخت. از اين‏رو، در برنامه نرم‏افزارى مقارنة الاحاديث بحث تمييز مشتركات نيز بايد مد نظر باشد و مشخص گردد كه برنامه با چه منطقى مى‏تواند اين عناوين مشترك را از هم تشخيص دهد. آيا در اينجا نيز مى‏توان از راه‏حلّ عنوان معيار به گونه‏اى سود جست يا اينكه بايد از طريق ديگرى استفاده نمود؟
 اما در بحث نظام مترادفات، محقق با عناوين متعددى روبه‏روست كه در واقع از يك نفر حكايت مى‏كنند. به شيوه‏اى كه عهده‏دار حل اين مشكل است، «توحيد مختلفات» مى‏گويند؛ مثلاً وقتى به كتب رجال مراجعه مى‏كنيم، با شش نوع تعبير از «احمد بن محمد بن خالد البرقى» مواجه مى‏شويم كه از آن جمله است: «احمد بن ابى‏عبدالله» و «احمد البرقى». بديهى است شناخت اين موضوع كه تمام اين عناوين از يك نفر حكايت دارد، براى تشخيص احاديث مشابه ضرورت دارد. در اينجا با در نظر گرفتن عنوان معيارى با نام مثلاً «احمد بن محمد بن خالد البرقى» اين امكان براى كاربر فراهم مى‏آيد كه به‏راحتى تشخيص دهد كه در سند روايت از يك شخص واحد به گونه‏هاى متفاوت تعبير شده است. چه بسا روايت هاي مشابهي كه نام راوي مذكور در سلسله سندش به شكل هاي مختلف آمده است و محقق به كمك عنوان معيار خواهد توانست به مقارنه در سند احاديث حكم نمايد و به مجموع حديث راوى مذكور دست يابد.
 روش ديگرى كه الگوريتم‏هاى مشابه‏يابى متن را كاراتر مى‏كند. استفاده از تكنيك Ranking و دسته‏بندى و ارزش‏گذارى متون، متناسب با عناصر علمى و مفهومى (مثلاّ در حديث استفاده از ابواب حديثى) مثل اينكه تعيين كنيد اين روايت در كدام يك از ابواب روايى قرار گرفته است. اگر به دنبال احاديثى در مورد طهارت هستيد، با وجود اين قابليت مى‏توانيد در جستجوى رواياتى كه در فصول طهارت منابع حديثى آمده است و ديگر نيازى به ملاحظه ابوابى چون قصاص يا ديات نخواهيد داشت.
 روش ديگر، جستجوى موضوعى است. با توجه به اينكه ما در حوزه متون به كارهايى نظير: موضوع‏بردارى، نمايه‏سازى و تهيه فهرست كليدواژه‏ها اقدام نموده‏ايم، از طريق پژوهش‏هاى لفظى و موضوعى با استفاده از اشتراك‏هاى متون در اين عناصر نيز مى‏توان به نتيجه مطلوب در زمينه مقارنةالاحاديث دست يافت.
 
جايگاه مركز تحقيقات كامپيوترى علوم اسلامى را در خصوص توليد نرم‏افزارى درباره مقارنةالاحاديث چگونه ارزيابى مى‏نماييد؟
از آنجا كه بسيارى از پيش‏نيازها ضمن كار در مركز تحقيقات كامپيوترى علوم اسلامى به انجام رسيده و در اين راستا مركز فعاليت‏هاى ارزشمندى را به ثمر نشانده، مى‏توان با بررسى علمى و فنى اين موضوع و رعايت موازين و نكاتى كه پژوهشگر را در شناخت احاديث مشابه مدد مى‏رساند، به تهيه نرم‏افزار مناسب و كارآمد اقدام كرد و مسير پژوهش را براى كاربران تسهيل نمود. اين از جمله اهدافى است كه دو معاونت فنى و تحقيقات مركز براى تحقق آن مى‏كوشد تا برنامه كاربردى و مفيدى را در معرض استفاده پژوهشگران عزيز قرار دهد.



بازگشت