مرکز تحقیقات کامپیوتری علوم اسلامی (نور)

متن کاوی نور

متن کاوی نور

مرکز تحقیقات کامپیوتری علوم اسلامی در بیش از بیست سال فعالیت خود، تاکنون توانسته است با رقومی نمودن منابع مکتوب، حجم عظیمی از دادگان متنی را فراهم آورد. در مرحله بعد، به فرآوری و غنی سازی متون پرداخت و سپس با به کارگیری فناور ی های رایانه ای از قبیل: واسط کاربری مطلوب، جستجوی سریع و دیگر قابلیت های لازم، محیط پژوهشی مناسبی را در ارائه محتوای این متون به گونه ای کارآمد ایجاد نمود و در این مسیر، به توسعه این امکانات می اندیشد.
اکنون در موقعیتی قرار گرفته ایم که حجم عظیمی از دادگان متون فارسی و عربی رقومی شده اند و بستر مناسبی را جهت پیاده سازی فناور ی های کشف دانش های نهفته در این دادگان و ایجاد ابزارهای پردازش هوشمند متون فراهم گردیده است.
فناوری های پردازش هوشمند متون، در سه مرحله: تولید، فرآوری و عرضه محتوا موجب سرعت بخشی به کار شده و شناسایی الگوها، مدلها و ارتباط میان عناصر مختلف در پایگاه داده ها را امکان پذیر می سازد تا دانش نهفته را به دانش کاربردی تبدیل نماید.

پردازش هوشمند متون، در دو مرحله شکل می گیرد؛ ابتدا در مرحله پایه ای "پردازش زبان طبیعی "، موتورهایی همچون موارد ذیل، عهده دار تحلیل زبانی متن هستند:
• تشخیص واژ ه ها، عبار ت ها و جملات از یکدیگر
• تجزیه صرفی واژگان
• ترکیب نحوی واژگان و عبارات
• حرکت گذاری واژگان
• تصحیح املایی واژگان
• تشخیص روابط منطقی بین کلمات جمله و بندهای متن

در مرحله بعد، با استفاده از ابزارهای تولیدشده فوق در قالب سامانه های پردازش زبان طبیعی، به کشف لایه های معنایی متون می پردازد. عناوین زیر، از جمله نتایج حاصل شده این مرحله می باشند:
• خلاصه سازی
• استخراج درخت وار ه های مفهومی از متون
• استخراج روابط معنادار بین مفاهیم متون
• یافتن شباهتها و تفاوتها بین متون
• رده بندی و دسته بند ی موضوعی متون

در سال های اخیر، فعالیت های پراکنده ای در پردازش هوشمند متون انجام شده است که نرم افزار درایه النور، اولین محصول این حوزه می باشد. این نرم افزار، حاوی سیستم خبره علم رجال است که به شناسایی و تعیین هویت راویان موجود در سلسله سند احادیث پرداخته و با ارزیابی اعتبار هر یک از این افراد، به بررسی میزان اعتبار کلی روایت می پردازد.

مرکز تحقیقات کامپیوتری علوم اسلامی در سال ۱۳۸۹ با تأسیس گروه متن کاوی نور، اقدام به انسجام فعالیت های پراکنده پردازش هوشمند متون نمود و در حال حاضر، به دستاوردهایی که بخشی از آن در نوشته حاضر ارائه شده، نایل آمده است. از جمله این دستاوردها می توان به موارد ذیل اشاره کرد:
• برچسب گذاری صرفی زبان عربی
• رده بندی هوشمند متون
• شناسایی هوشمند روایات مشابه
• حرکت گذاری هوشمند متون عربی
• استخراج هوشمند عبارات قرآنی در متون عربی و فارسی

پژوهشگران این گروه، علاوه بر دستاوردهای فوق، در حوزه های کاربردی دیگری نیز مشغول به فعالیت هستند و در هر یک از آ نها به موفقیت های خوبی رسیده اند. از جمله می توان به این موارد اشاره نمود:
• خلاصه سازی ماشینی
• موتور برچسب گذار نحوی نور در زبان عربی
• سامانه شناسایی مقالات مشابه (سرقت ادبی)
• شبکه ارتباطی هستی شناسی

امید است در سایه عنایات حضرت حق، تلاش های مستمر مدیران و پژوهشگران و حامیان این گروه، در آینده ای نزدیک به ثمر بنشیند و محصول آن در اختیار کاربران و محققان قرار گرفته و در نهایت امر، زمینه برای پژوهش های لفظی و معنایی هموارتر شود.

مقالات و مطالب مرتبط در فصلنامه ره آورد نور