موضوع بازيابى و شناخت احاديث مشابه در كتب روايى و تهيه متونى خالى از روايات شبيه به هم، از ديرباز مورد توجه عالمان و انديشمندان اسلامى بوده است و تا به حال اقدامات شايستهاى در اين مسير صورت گرفته و كارهاى پراكندهاى نيز در حال انجام است. براى روشنسازى زواياى مختلف اين بحث، نشريه رهآورد نور گفتگويى را كه با جناب آقاى «سقايى» معاونت فنى مركز تحقيقات كامپيوترى علوم اسلامى به انجام رسانده، در معرض مطالعه خوانندگان و علاقهمندان محترم قرار مىدهد و افقهاى جديدى را فراسوى متوليان اين موضوع مىگشايد. ايشان در بحث خود به الگوريتمها يا همان منطق پردازش دادهها در اين زمينه پرداختند و فرضهاى مختلفى را براى برنامهنويسى رايانهاى به منظور شناسايى احاديث مشابه ارائه دادند.
در ابتداى بحث، لطفاً بفرماييد كه مقارنة الاحاديث چيست و چه جايگاهى دارد؟ در مورد مقارنةالاحاديث دو ديدگاه وجود دارد: اوّل، تعريف حديث از نظر سندى و رجالى صرف نظر از متن آن. دوم، تعريف حديث از لحاظ محتوا و متن حديث بدون توجه به سند آن. بحث مقارنة الاحاديث در هر دو مورد مطرح است؛ به اين معنا كه گاهى پژوهشگر رجالى روى سندهاى مشابه تفحص مىكند و ممكن است متن حديثى كه از طريق سلسله سندهاى مقارن و شبيه به هم نقل شده، با يكديگر متفاوت باشند. از اينرو، يافتن روايات تكرارى از نظر سند، صرف نظر از محتوا، مبحث مقارنة الاحاديث در حيطه سند حديث را تشكيل مىدهد. گاهى نيز محقق روى متن روايت پژوهش مىكند و عنايتى به سند آن ندارد، چون ممكن است كه روايت مورد نظر پژوهنده، از طريق سندهاى متفاوتى نقل شده باشد؛ كه در متن و محتوا مشتركاند. البته اجتماع دو مورد فوق؛ يعنى تقارن احاديث در زمينه سند و متن نيز قابل تصور است و مىتوان اين امر را مورد تحقيق قرار دهيم كه مجموع متن و سند يك حديث در چه منابعى وارد شده است. بنابراين، مقارنة الاحاديث به معناى بررسى و يافتن روايات مشابه از نظر سند، متن و يا هر دو است.
به طور كلى براى يافتن متون مشابه در زبانهاى مختلف چه روشهائى وجود دارد؟ فرايند يافتن متون مشابه و روشهاى پردازش متن براى اين منظور موضوع مباحث مهمى مانند «پردازش زبان طبيعى -Datamining(دادهكاوى)» است كه امروزه در مهندسى نرمافزار مطرح مىباشد و براى اين كار پروژههاى مطالعاتى و تحقيقاتى در دنيا انجام گرفته كه برخى از آنها نيز عملى گرديده است. بطور مشخص در برنامههاى تحت وب و موتورهاى جستجوى آن بكار رفته است. براى مثال «Stemming» (استفاده از ريشههاى كلمات) براى جستجو در بانكهاى اطلاعاتى(Sql-Server,Index server )با قابليت جستجوى متن كامل(Search,full teut) براى برخى از زبانها مانند انگليسى ارائه شده و مورد استفاده است. اين فرايند در زبانهاى مختلف، داراى ويژگيهاى خاص خود مىباشد. پيچيدگى زبانى از لحاظ دستورى، لغوى، رسمالخط و املاء مىتواند موجب فراهم نيامدن مقدمات و پيشنيازهاى چنين پردازشى گردد و انجام آن را تا مرز غير مفيد و يا حتى غير ممكن باعث شود. در اين رابطه زبانهائى چون: فارسى و عربى، به دليل اين گونه پيچيدگىها و ساختارهاى مدرن دستورى و در عين حال نارسائىهائى كه در كتابت و رسم الخط آن مانند نبود مصوّتها و چسبيدگى وندها به كلمه معتل و مضاعف بودن واژگان وجود دارد، انجام روشهاى بكار رفته در زبانهاى ديگر را مورد ترديد قرار داده است و بايستى با در نظر داشت خصوصيت و مشكلات آنها روشهاى ديگرى براى اين منظور ابداع و ارائه داد. چنين روشهائى مىتواند با استفاده از عناصر مفهومى و علمى در حوزههاى علوم بهينه و كاراتر گردند براى مثال در موضوع حديث يا فقه براى اجراى اين فرايند، ضمن تحليل دقيق و مطالعه زمينهها و جوانب آنها مىتوان از ابزارهاى نرمافزارى خاص حديث يا فقه در عمليات مقارنة استفاده كرده و روشهاى يافتن متون مشابه را تقويت نمود.
مشكلات موجود در زمينه استخراج متون مشابه حديثى و ارائه آنها در قالب نرمافزار را چگونه ارزيابى مىكنيد؟ و اصولاً چه روش يا روشهايى براى برطرف كردن اين موانع پيشنهاد مىنماييد؟ يكى از مشكلات اين مسير، پيشوندها و پسوندهايى است كه در زبان عربى و يا فارسى به قبل يا بعد يك كلمه مىچسبد، زيرا در اين حالت، شكل املايى كلمات تغيير پيدا مىكند و اين موضوع در بازخوانى متون توسط رايانه مشكل ايجاد مىكند. چنين واژههايى از لحاظ تركيبى از دو يا چند كلمه تشكيل شدهاند و شامل يك اسم و يك حرف، يك فعل و يك اسم، و مواردى از اين دست مىباشند. در حالى كه در زبان انگليسى كلمات گوناگون به دليل استقلال و جدايى حروف از يكديگر، قابل تشخيص است. مشكل ديگر، وجود انبوهى از الفاظ مشترك چه در حوزه لغت و چه در حوزه كتابت (با لحاظ عدم وجود مصوتها) است كه در ارائه پاسخهاى نادرست به كاربر مؤثر است و گاهى نيز يك لفظ مشترك در دو معناى كاملاً متفاوت و يا متناقض به كار مىرود. بديهى است اين نوع موارد، مدّ نظر كاربر نبوده و نمىتوان آنها را يكى فرض كرد. اگرچه ساختار زبانى، چنين اشكالهايى را در مسير تهيه برنامه رايانهاى مقارنة الاحاديث موجب مىشود، اما پايههاى زبان عربى صرف نظر از نارسائى كتابتى آن به گونهاى است كه مىتوان از طريق راههائى اين مشكلات را از پيشرو برداشت. از جمله اين روشها تهيه فهرست «كلمات پيراسته» است. در اين روش بايد نخست كلمات يك عبارت را از پيشوندها و پسوندهاى گوناگون پيراسته نمود و آنگاه در متن به جستجوى كلمه پيراسته با تمامى تركيبهاى آن پرداخت. به عنوان مثال، كلمه تركيبى «فَضَرَبَ» از يك حرف (فاء عاطفه) و يك فعل (ضَرَبَ) تشكيل شده است. در اينجا چون بار مفهومى كلام به روى فاء كمتر از ضَرَبَ است، كلمه پيراستهشده و اين واژه مركب، ضرب خواهد بود و در فرايند جستجو كلمات مشابه اين كلمه بازيابى مىگردد. بنابراين عمليات مقارنة الاحاديث را مىتوان بر روى واژههاى پيراسته انجام داد. در اين ميان، برخى كلمات وجود دارند كه نمىتوان شكل پيراسته آن را به آسانى مشخص نمود، خاصه اينكه اگر اعراب نداشته باشند؛ مثلاً كلمه «بعد» اگر حرف نخست آن غير مكسور باشد، مىتواند خود يك واژه پيراسته به حساب آيد؛ ولى چنانچه حرف اوّل آن مكسور باشد (بِعدٍ)، كلمه پيراستهاش «عد» خواهد بود. بنابراين، در كلماتى از اين دست، به دليل وجود احتمالات مختلف تعيين واژه، پيراسته به راحتى صورت نمىگيرد. در اينجا بايد به موارد استعمال و قراين موجود در كلام توجه كرد و كلمه پيراسته را تشخيص داد.
آيا مىتوان با اعرابگذارى درست كلمات، از بروز چنين مشكلاتى در امر بازيابى احاديث مشترك جلوگيرى كرد؟ اعرابگذارى يكى از مشكلات كه نبود مصوتها است را از پيشرو بر مىدارد ولى وجود اشتراكهاى لغوى و كتابتى باز ممكن است حتى فرايند پيراسته ساختن كلمات را هم دچار چالش كند كه در اين صورت بايد متن را نيز مورد دقت قرار داد؛ مثلاً كلمه «أهْلَكَ» هم محتمل است كه فعل ماضى باب افعال باشد، هم احتمال دارد كه دو اسم مضاف باشد (أهْلَ + كَ). در اينجا اعرابگذارى به پيراستهسازى كلمات كمك نمىكند؛ بلكه بايد به متن رجوع كرد و شكل پيراسته را شناخت. البته راهحل ديگرى نيز وجود دارد و آن اين است كه بدون مراجعه به متن، احتمالات گوناگون يك كلمه را در نظر گرفت و با ارائه فهرستى از كلمات محتمل در هر يك، به انجام جستجو پرداخت؛ به عنوان نمونه، در مورد واژه «أهَلَكَ» يك بار كلمه «أهْلَكَ» را به عنوان فعل ماضى مورد جستجو قرار مىدهيم و يك بار ديگر كلمه «أهْل» را در خط ورود جستجو درج مىنماييم. كاستى اين روش آن است كه قابليت پيراستهسازى، در خصوص الفاظ مشترك و يا در مواردى كه بار مفهومى كلام روى قسمتى است كه در فهرست واژگان پيراسته قرار نمىگيرد، مشكل خواهد بود.
جهت دستيابى به احاديث مشابه، آيا فقط از طريق امكان پيراستهسازى مىتوان اقدام كرد؟ با توجه به نقصى كه اين روش دارد، چه راه حلهاى ديگرى را پيشنهاد مىكنيد؟ گاهى استفاده از فهرست كلمات پيراسته موجب بروز احتمالات و به تبع سردرگمى بيشتر كاربر خواهد شد. از اينرو، بايد به راهكارهاى ديگرى تمسك جست. قدم اوّل، اين است كه عبارت انتخابى را بدون هيچ كم و كاستى جستجو كنيم. در اين حالت، ممكن است برخى جوابهاى موجود ارائه نگردد. قدم بعدى اين است كه كاربر به وسيله ريشه عبارات به انجام پژوهش اقدام نمايد؛ زيرا ريشه كلمات بسيار كارآمدتر از كلمات پيراسته پژوهشگر را در امر تحقيق يارى مىرساند و در واقع، پاسخهاى ارائه شده بيشتر به موارد دلخواه كاربر نزديك است. و در عين حال كاملتر و جامعتر ارائه خواهد شد.
در مواردى ممكن است كه نقلهاى متفاوتى از يك متن صورت گرفته باشد؛ مثل اينكه عبارتها جابهجا شده يا ضمير به جاى اسم آمده است. در اين گونه مواقع، چه بايد كرد؟ قبل از توضيح برخى از اين الگوريتمها، بعنوان يكى از مقدمات كار بايستى اين مطلب را در نظر داشت كه در ميان كلمات واژههائى وجود دارند كه به آنهاNoise word)كلمات پر ارزش) گفته مىشود. تهيه فهرستى از اين واژهگان و جدا كردن آنها از پردازش، بسيار مؤثر و مهم است. 1-جستجوى عبارت: اين روش ابتدائىترين روش براى يافتن يك عبارت از متون و استخراج مشابهات آن مىباشد در اين گام عين عبارت (البته صرف نظر ازNoise wordها) مورد جستجو قرار مىگيرد. 2-جستجوى كلمات عبارت با حفظ ترتيب: در اين روش كلمات عبارت مورد نظر با در نظرداشت توالى كلمات و ترتيب آنها (ضمن آنكه مىتوان فاصله كلمات را نيز تنظيم كرد) مورد پردازش خواهد بود. 3-جستجوى كلمات عبارت: در اين مرحله كلمات عبارت در متون مورد جستجو قرار گرفته و به ميزان فراوانى كلمات مىتوان حكم به مشابهت متون يا عدم مشابهت داد. 4-جستجوى كلمات پيراسته عبارت مورد نظر با حفظ تركيب: در اين روش واژگان به شكل پيراسته آنها تبديل شده ولى تركيب عبارتى آنها حفظ مىگردد آنگاه عبارت پيراسته مورد جستجو قرار مىگيرد و موارد مشابه استخراج مىشود. 5-جستجوى كلمات پيراسته عبارت با حفظ ترتيب: در اين جا نيز واژگانِ پيراسته مورد پردازش خواهد بود ولى نسبت به تركيب حساسيت از بين مىرود و در حدّ ترتيب و توالى كلمات پيراسته (با امكان تنظيم ميزان فاصله بين كلمات) عمليات مشابهيابى انجام خواهد شد. 6-جستجوى كلمات پيراسته بدون در نظر گرفتن ترتيب و تركيب: در اين روش، كلمات پيراسته در متن مورد جستجو قرار گرفته و به ميزان جواب و نسبت آن مىتوان مشابهيابى كرد. 7-جستجوى واژگان ريشه با حفظ تركيب 8-جستجوى واژگان ريشه با حفظ ترتيب (با تنظيم ميزان فاصله بين ريشهها) 9-جستجوى واژگان ريشه (با در نظر گرفتن نسبت وجود ريشهها در متون) در اين سه روش اخير كلمات عبارت به ريشه برگردانده شده و عمليات فوق مانند پردازشهاى قبلى انجام خواهد شد. از آنجا كه نتايج بدست آمده از اين روشها از لحاظ درستى و جامعيت با هم متفاوتند، استفاده از هر كدام از اينها نياز به آزمايش و تجربه خواهد داشت. ولى درستى و جامعيت معمولاّ بصورت متعاكس مىباشند به اين معنى كه در جاهائى كه جواب درست داده مىشود تمامى موارد بدست نمىآيد و در جائى كه با جوابهاى فراوانترى مواجه هستيم، جوابهاى نادرست كم نخواهيم داشت.
تا اينجا روشهاى كلى همچون: جستجو از طريق عبارات، كلمات پيراسته، ريشه، ترتيب و عدم ترتيب را براى دستيابى به متون مشابه ارائه داديد. در خصوص مقارنة الاحاديث كه محور بحث ماست و اقتضائات مرتبط با خود را مىطلبد، چه منطق پردازش ديگرى قابل ارائه است؟ ضمن پذيرش و ارائه راههاى يادشده در مورد مقارنة الاحاديث، شيوههاى ديگرى نيز هست كه قابل بحث و عرضه مىباشد. چنانچه قبلاّ هم ذكر شد استفاده از محورها و عناصر مفهومى مىتواند اين پردازشها را سامان دهد. در زمينه حديث مىتوان از اطلاعات موجود در نرمافزارهاى حديثى و رجالى استفاده كرد. مبحث رجال ارتباط زيادى با موضوع مقارنة الاحاديث دارد؛ چون گاهى از يك راوى در سند حديث با تعابير گوناگونى ياد مىشود؛ يك جا اسم او آمده، جاى ديگر كنيهاش و در سلسله سند ديگر صفت او ذكر شده و در يك سند نيز تركيبى از اين موارد به چشم مىخورد. بديهى است در اين حالت، اگر بخواهيم در امر جستجو صرفاً به تشابهات لفظى بسنده كنيم، پاسخهاى مشابه زيادى از دسترس كاربر دور مي ماند. به همين جهت، تعبير واحدي را براي اين موارد ارائه مي كنيم. اين تعابير بسيار راهگشا هستند و به پژوهشگران در بازيابي مقارنه سندي احاديث كمك شاياني مي كنند. . در اينجا ما از يك ابزار متنى به عنوان يك معيار استفاده نموديم و مقوله پيدا كردن اسانيد مشترك را سامان بخشيديم كه خود بسيار ثمربخش و مفيد است. از جمله امورى كه در اسناد روايات به صورت چشمگير موجود و از ديرباز موجب بروز مشكلاتى در استناد به متون روايى گشته، عناوينى است كه مشترك بين دو يا چند راوى است. به چنين عناوينى در اصطلاح رجال، عناوين مشترك، و به بحثى كه عهدهدار حل اين مشكل است، «تمييز مشتركات» مىگويند. به عنوان مثال، اگر در اسناد كافى به عنوان «احمد بن محمد» برخورد كنيم و به جاى عنوان مشترك در سند توجهى ننماييم، دامنه بسيار گستردهاى را پيشرو خواهيم داشت؛ چرا كه عنوان فوق در نگاه اوّل، مردد بين پنج نفر است كه عبارتاند از: احمد بن محمد بن سعيد بن عقده، احمد بن محمد العاصمى، احمد بن محمد بن عيسى، احمد بن محمد بن خالد، احمد بن محمد بن ابى نصر. در قدم اوّل بايد با مشخص كردن طبقه عنوان، از دامنه ترديد كاست. البته در برخى موارد، صرفاً با شناخت طبقه راوى و جايگاه خاص او در سند، عنوان مردد از حالت اشتراك خارج مىشود. چنانچه با تعيين جايگاه راوى در سند، ترديد برطرف نشد، بايد از راههاى مختلف به تعيين اطراف ترديد پرداخت. از اينرو، در برنامه نرمافزارى مقارنة الاحاديث بحث تمييز مشتركات نيز بايد مد نظر باشد و مشخص گردد كه برنامه با چه منطقى مىتواند اين عناوين مشترك را از هم تشخيص دهد. آيا در اينجا نيز مىتوان از راهحلّ عنوان معيار به گونهاى سود جست يا اينكه بايد از طريق ديگرى استفاده نمود؟ اما در بحث نظام مترادفات، محقق با عناوين متعددى روبهروست كه در واقع از يك نفر حكايت مىكنند. به شيوهاى كه عهدهدار حل اين مشكل است، «توحيد مختلفات» مىگويند؛ مثلاً وقتى به كتب رجال مراجعه مىكنيم، با شش نوع تعبير از «احمد بن محمد بن خالد البرقى» مواجه مىشويم كه از آن جمله است: «احمد بن ابىعبدالله» و «احمد البرقى». بديهى است شناخت اين موضوع كه تمام اين عناوين از يك نفر حكايت دارد، براى تشخيص احاديث مشابه ضرورت دارد. در اينجا با در نظر گرفتن عنوان معيارى با نام مثلاً «احمد بن محمد بن خالد البرقى» اين امكان براى كاربر فراهم مىآيد كه بهراحتى تشخيص دهد كه در سند روايت از يك شخص واحد به گونههاى متفاوت تعبير شده است. چه بسا روايت هاي مشابهي كه نام راوي مذكور در سلسله سندش به شكل هاي مختلف آمده است و محقق به كمك عنوان معيار خواهد توانست به مقارنه در سند احاديث حكم نمايد و به مجموع حديث راوى مذكور دست يابد. روش ديگرى كه الگوريتمهاى مشابهيابى متن را كاراتر مىكند. استفاده از تكنيك Ranking و دستهبندى و ارزشگذارى متون، متناسب با عناصر علمى و مفهومى (مثلاّ در حديث استفاده از ابواب حديثى) مثل اينكه تعيين كنيد اين روايت در كدام يك از ابواب روايى قرار گرفته است. اگر به دنبال احاديثى در مورد طهارت هستيد، با وجود اين قابليت مىتوانيد در جستجوى رواياتى كه در فصول طهارت منابع حديثى آمده است و ديگر نيازى به ملاحظه ابوابى چون قصاص يا ديات نخواهيد داشت. روش ديگر، جستجوى موضوعى است. با توجه به اينكه ما در حوزه متون به كارهايى نظير: موضوعبردارى، نمايهسازى و تهيه فهرست كليدواژهها اقدام نمودهايم، از طريق پژوهشهاى لفظى و موضوعى با استفاده از اشتراكهاى متون در اين عناصر نيز مىتوان به نتيجه مطلوب در زمينه مقارنةالاحاديث دست يافت.
جايگاه مركز تحقيقات كامپيوترى علوم اسلامى را در خصوص توليد نرمافزارى درباره مقارنةالاحاديث چگونه ارزيابى مىنماييد؟ از آنجا كه بسيارى از پيشنيازها ضمن كار در مركز تحقيقات كامپيوترى علوم اسلامى به انجام رسيده و در اين راستا مركز فعاليتهاى ارزشمندى را به ثمر نشانده، مىتوان با بررسى علمى و فنى اين موضوع و رعايت موازين و نكاتى كه پژوهشگر را در شناخت احاديث مشابه مدد مىرساند، به تهيه نرمافزار مناسب و كارآمد اقدام كرد و مسير پژوهش را براى كاربران تسهيل نمود. اين از جمله اهدافى است كه دو معاونت فنى و تحقيقات مركز براى تحقق آن مىكوشد تا برنامه كاربردى و مفيدى را در معرض استفاده پژوهشگران عزيز قرار دهد.