در ابتدای این نشست، حجتالاسلام والمسلمین رحیمی ثابت مدیر گروه علمی تاریخ مرکز تحقیقات کامپیوتری علوم اسلامی نور، درباره امکانات و قابلیتهای پژوهشی پایگاه جامع تاریخ توضیح داد.
قابلیتهای متنوع و کاربردی
حجتالاسلام والمسلمین رحیمی ثابت گفت: آنچه عرض میشود قابلیتهایی است که اکنون در «پایگاه جامع تاریخ» ارائه شده و این امکانات پژوهشی در آن وجود دارد. به این معنا که ما تنها به جمعآوری یک سری رویداد تاریخی اکتفا نکردیم، بلکه با همکاری معاونت فنی مرکز، قابلیتهای متعددی را برای این دادههای گردآوریشده فراهم کردهایم. از جمله اینکه کاربر میتواند رویدادها را بر اساس نوع آنها مشاهده کند، یا آنها را در یک بازه زمانی مشخص ببیند.
مدیر گروه علمی تاریخ مرکز نور افزود: همچنین این امکان فراهم است که وقایع تاریخی با محوریت یک شخصیت یا حتی یک مکان خاص بررسی شوند. به عنوان مثال، پژوهشگر میتواند مکان تاریخیای همچون کوفه، مدینه یا حتی شهرهای ایران و دیگر شهرهای جهان اسلام را انتخاب کند و رویدادهای مربوط به آن را مشاهده نماید.
ادامه رشد و بروزرسانی پایگاه
وی گفت: البته این پایگاه به صورت مستمر در حال بروزرسانی و گسترش است و هر روز به حجم دادههای آن افزوده میشود. هماکنون ۸ نفر از نیروهای متخصص ما که هم طلبه هستند و هم تحصیلات دانشگاهی در رشته تاریخ دارند، مشغول استخراج و ثبت این رویدادها هستند. بنابراین علاوه بر وقایع صدر اسلام، اطلاعات مربوط به قرون میانی اسلام، همچنین دوره قاجار و حتی بخشی از رویدادهای مشروطه نیز وارد این پایگاه شده است.
حجتالاسلام والمسلمین رحیمی ثابت تأکید کرد: فرایند گردآوری و افزودن دادهها همچنان ادامه دارد و رویدادها به طور مرتب در حال اضافه شدن هستند. در واقع، پایگاه جامع تاریخ یک مجموعه پویا و رو به رشد است که هدف نهایی آن پوشش حداکثری تمام دورانهای تاریخ اسلام میباشد. این روند تا زمانی ادامه خواهد یافت که همه دورههای تاریخ اسلام در آن درج و در دسترس پژوهشگران قرار گیرد.
ورود هوش مصنوعی به پژوهشهای تاریخی
حجتالاسلام والمسلمین رحیمی ثابت گفت: زمانی که بحث «هوش مصنوعی» به طور جدی و پررنگ مطرح شد و کاربردهای علمی، پژوهشی و حتی عمومی آن گسترش یافت، این ایده در ذهن همکاران فنی مرکز شکل گرفت که از ظرفیتهای هوش مصنوعی در کنار انبوه دادههایی که درباره وقایع تاریخ اسلام فراهم کردهایم استفاده کنیم تا یک پنجره جدید در پژوهشهای تاریخی باز شود.
وی ادامه داد: برای توضیح بیشتر، ما برای هر واقعه تاریخی، چون به منابع مختلف رجوع میکردیم، طبیعتاً گزارشهای متعددی از آن واقعه به دست میآمد. به عنوان نمونه، در مورد شهادت امام حسین (ع) و واقعه عاشورا، حدود ۱۹۰ گزارش از منابع گوناگون استخراج کردیم. این گزارشها همگی از منابع اصلی و معتبر بودهاند. منظور از معتبر این است که افزون بر منابع اولیه تاریخ اسلام، از برخی آثار پژوهشی ارزشمند نیز استفاده کردهایم؛ برای مثال اثر گرانقدر مرحوم سید جعفر مرتضی عاملی یکی از منابع ما بوده است. بنابراین گرچه تمرکز اصلی ما بر منابع اولیه بوده، اما از منابع پژوهشی معتبر و دارای بار علمی نیز غفلت نکردهایم.
تولید مقالات کوتاه با هوش مصنوعی
مدیر گروه علمی تاریخ مرکز نور گفت: با این کار مجموعهای از وقایع تاریخی همراه با گزارشهای متعدد از منابع مختلف به دست آمد. در این مرحله تصمیم گرفتیم با کمک قابلیتهای هوش مصنوعی، از این گزارشها برای تولید مقالات کوتاه تاریخی بهره ببریم. به این صورت که هوش مصنوعی، با تکیه بر گزارشهای مستند ما (و نه منابع بیرونی یا دادههای خود)، اطلاعات گردآوریشده را تلفیق کرده و یک جمعبندی مستند و خلاصهشده از آنها ارائه دهد.
وی افزود: خروجی این فرآیند تولید مجموعهای از مقالات کوتاه درباره هر واقعه تاریخی شد. این مقالات شامل موضوعاتی مانند وفیات، انتسابها، وقایع نظامی، فتحها یا حتی روابط و تعاملاتی است که میان شخصیتهای تاریخی در طول زمان رخ داده است. ما این تولیدات را «مقالات درباره رویداد» نامگذاری کردیم.
ثبت بیش از ۱۸۰ هزار مقاله مستند در پایگاه جامع تاریخ
حجتالاسلام والمسلمین رحیمی ثابت تأکید کرد: از آنجا که در پایگاه جامع تاریخ بیش از ۱۸۰ هزار واقعه تاریخی غیرتکراری ثبت شده است، با کمک هوش مصنوعی و گزارشهایی که به آن دادهایم، برای هر یک از این رویدادها یک متن کوتاه و مستند تولید شده است. بنابراین مجموعه تولیدات هوش مصنوعی ما کاملاً مستند به منابع تاریخی معتبر است و حاصل آن تاکنون بیش از ۱۸۰ هزار مقاله یا شرح تاریخی است که هماکنون در پایگاه جامع تاریخ در دسترس کاربران قرار دارد.
فعالیت سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی»
در ادامه این نشست، علی دانش، مدیر بخش پردازش هوش مصنوعی مرکز تحقیقات کامپیوتری علوم اسلامی نور، درباره سابقه فعالیت مرکز در عرصه هوش مصنوعی، قابلیتهای سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی»، و برنامههای آینده این سامانه توضیح داد.
دانش گفت: سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی» مجموعهای از مقالات کوتاه درباره رویدادهای تاریخی است که بر اساس منابع معتبر و اصیل و با رویکرد پژوهشی تدوین شده است. این سامانه تحولی در تولید و ارائه محتواهای تاریخی به زبان فارسی از منابع دست اول ایجاد کرده است.
وی با بیان اینکه گزارشها از منابع مختلف گردآوری شدهاند؛ برخی به زبان عربی و برخی به فارسی، در کتابهای مختلف و با سبکهای متفاوت، و نیز از منابع اهل سنت و شیعه بهره گرفته شده است، گفت: جمعآوری، دستهبندی و تحقیق کوتاه بر روی این منابع کار دشواری بود، اما با کمک هوش مصنوعی امکانپذیر شد و تحولی در ارائه محتوا ایجاد کرد. این اقدام همراستا با اهداف مرکز نور است که یکی از اهداف اصلی آن، تسهیل دسترسی به منابع اصیل و متون اسلامی است و با تولید این محصول محقق شده است.
دانش با تقسیمبندی مباحث خود به سه بخش گفت: بخش اول مرور کوتاهی بر کارهای گذشته در حوزه فنی و هوش مصنوعی خواهد بود، بخش دوم به تشریح این دستاورد اخیر اختصاص دارد و بخش سوم به فعالیتهای آتی اشاره خواهد شد.»
دستاوردهای مرکز نور
مدیر بخش پردازش هوش مصنوعی مرکز نور توضیح داد: مرکز نور در سال ۱۳۶۸ با نظر رهبر انقلاب اسلامی تأسیس شد و هدف آن استفاده از فناوریهای نوین در پردازش محتوا در حوزه علوم اسلامی و انسانی بود، با تمرکز بر سرعت بخشیدن به پژوهش و تسهیل دسترسی به منابع اسلامی.
دانش گفت: این مرکز از ابتدا در این حوزه پیشرو بوده و طی دوران فعالیت خود، پلتفرمهای مختلفی توسعه داده و تمامی آنها را پشتیبانی کرده است. محصولات متنوعی در حوزه نرمافزارهای ویندوزی، سیستمهای جاوا، اندروید و آیاواس و همچنین پایگاههای وبی تولید شدهاند. در حوزه پایگاههای وبی، سایتهای معروفی مانند قرآن، حدیث، نورمگز و نور لایو فعال بودهاند و یکی از پایگاهها، پایگاه جامع تاریخ است که دستاورد اخیر در قالب آن ارائه شده است.
پیشرفت مرکز نور در حوزه هوش مصنوعی
وی گفت: در خصوص سابقه مرکز در حوزه هوش مصنوعی، طی سه تا چهار سال اخیر با ظهور رباتهای جستجوگر هوشمند و چتباتهای هوشمند تحولی بنیادین ایجاد شد و این فناوریها در سطح جامعه ملموستر گردیدند. تا چند سال قبل، هوش مصنوعی برای عموم مردم کمتر قابل مشاهده بود، اما مرکز از حدود بیست سال پیش به این حوزه ورود کرده و حتی در سال ۱۳۹۰ اولین سمینار هوش مصنوعی را برگزار کرد. طی سالها، مرکز از هوش مصنوعی در سطوح مختلف محصولات خود استفاده کرده است: در تولید محتوا، ورود و تصحیح اطلاعات، دیجیتالسازی محتوا و هوشمندسازی فرآیندها.
دانش افزود: در سطح تولید محتوا، هوشمندسازی شامل تبدیل و تصحیح اطلاعات است. در سطح دوم، یعنی فرآوری اطلاعات، برچسبگذاری متون به صورت ماشینی برای قابلیت جستجو و فهرستبندی انجام شده است. در سطح سوم، یعنی ارائه اطلاعات، در نرمافزارهای ویندوزی، موبایلی و پایگاههای وبی از هوش مصنوعی استفاده شده است؛ به طوری که طی ۱۵ سال توسعه محصولات متعدد، بیش از ۵۰ قابلیت هوش مصنوعی در سطوح مختلف به کار گرفته شده که بسیاری از آنها شاید برای کاربران ملموس نباشد.
قابلیتهای هوش مصنوعی سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی»
دانش توضیح داد: یکی از قابلیتها، استخراج خودکار اعلام و اشخاص است که در سایت آزمایشگاه هوش مصنوعی در دسترس است و بر اساس پیکرهای از اعلام و اشخاص، از محتوای تاریخی مرکز استخراج میشود. قابلیت دیگر، کمیسازی عبارات تاریخی است؛ زیرا کتابهای مختلف تاریخ، تاریخها را به اشکال متفاوت بیان میکنند (مثلاً نیمه شعبان، پانزدهم شعبان، به حروف یا به عدد). ماشین باید قادر باشد این موارد را تشخیص دهد، دستهبندی کند و در اختیار پژوهشگر قرار دهد. این قابلیت در محصولات دیگر مانند نرمافزار جامع الاحادیث چهار که به زودی رونمایی میشود نیز استفاده شده است.
مدیر بخش پردازش هوش مصنوعی مرکز نور افزود: مورد سوم، شناسایی هوشمند رویدادهای تاریخی است که در قالب یک پایاننامه کارشناسی ارشد و با همکاری دانشگاهها انجام شده و میتواند رویدادها را از متون تاریخی به صورت هوشمند استخراج کند؛ مانند تولد، جنگ، مرگ و ازدواج.
ورود به حوزه مدلهای زبانی بزرگ
دانش گفت: با توجه به رشد سریع فناوری، بویژه در حوزه هوش مصنوعی و ظهور مدلهای زبانی بزرگ، مرکز تصمیم گرفت به این حوزه ورود پیدا کند. دو رویکرد برای این کار در نظر گرفته شد: رویکرد اول استفاده از سرویسهای شرکتهای بزرگ ارائهدهنده مدلهای زبانی، مانند اوپنایآی و گوگل. و رویکرد دوم، توسعه زیرساختهای داخلی شامل سرورهای قوی و کارتهای گرافیکی مناسب برای اجرای مدلهای زبانی بزرگ.
مدیر بخش پردازش هوش مصنوعی مرکز نور افزود: این زیرساخت داخلی در مرکز نور اواخر پارسال راهاندازی شد و پس از نصب و پیکربندی، مدلهای زبانی متن باز در سرورها مستقر و سفارشیسازی شدند. هماکنون از هر دو رویکرد استفاده میکنیم. بخشی از پردازشها روی زیرساخت داخلی انجام میشود و بخشی دیگر، از سرویسهای خارجی بهرهبرداری میشود تا پاسخگویی به نیازهای گسترده هوش مصنوعی تضمین شود.
دانش گفت: برای تسهیل دسترسی به سرویسهای خارجی، پایگاهی تحت عنوان نورجیپیتی تأسیس شد که امکان دسترسی یکپارچه به مدلهای زبانی بزرگ را فراهم میکند. اکثر این سرویسها تحت تحریم هستند، اما در پایگاه مرکز این مشکل رفع شده و شارژ آنها با کارتهای داخلی امکانپذیر است.
پردازش اطلاعات تاریخی و تولید مقالات
وی گفت: با توجه به زیرساخت داخلی، پردازش پایگاه تاریخ بدون نیاز به سرور خارجی انجام شد. بیش از ۲۷۰ هزار گزارش پردازش شد و از دل آنها بیش از ۱۸۰ مقاله کوتاه درباره رویدادهای مختلف تهیه گردید. در فاز اول، این فرآیند در مقیاس کوچکتر انجام شد و پس از دریافت بازخورد پژوهشگران اصلاحات لازم اعمال شد و سپس در حجم کل گزارشهای سایت اجرا شد.
دانش ادامه داد: این گزارشها متنوع بودند؛ برخی رویدادها مانند واقعه عاشورا بیش از ۱۹۰ گزارش داشتند و برخی دیگر بسیار کمتر. یکی از چالشهای کار، محدودیت ورودی مدلهای زبانی بزرگ بود؛ به همین دلیل مدلهایی انتخاب شد که توانایی پردازش متنهای طولانی را داشته باشند.
صحت اطلاعات و چالشها
مدیر بخش پردازش هوش مصنوعی مرکز نور تأکید کرد: تمام اطلاعات تولید شده توسط مدل، ارجاع به منبع دارد. یکی از مشکلات مدلهای زبانی بزرگ، تولید اطلاعات اشتباه یا «توهم» است. برای حل این مشکل، اطلاعات به مدل داده شد و مدل طوری برنامهریزی شد که تمام خروجیها به منابع اصلی ارجاع داده شوند و کاربر با یک کلیک بتواند منبع را مشاهده کند.
وی ادامه داد: چالشهای دیگر شامل تنوع منابع و مذاهب، زبانهای مختلف و ناهمگونی در گزارشها بود. برخی گزارشهای تاریخی در خصوص برخی رویدادها اغراق یا کمتوجهی داشتند که با توجه به مذهب تشیع تعدیل شدند. همچنین برخی رویدادها حجم زیادی گزارش داشتند و برخی کمتر؛ ما محدودیت حجم برای مطالعه مناسب کاربران اعمال کردیم. مدل به گونهای تنظیم شد که ساختار منضبط، عناوین منظم، ارجاعات عددی و فهرست منابع در انتهای متن رعایت شود و سبک مقاله روان و قابل فهم برای پژوهشگران و کاربران عادی باشد.
برنامههای آینده
دانش در بخش سوم سخنان خود که معطوف به آینده است، گفت: گام بعدی، استخراج رویدادها با استفاده از مدلهای زبانی بزرگ است. پیشتر نیز کارهایی انجام شده، اما با ورود مدلهای جدید، کیفیت و سطح کار افزایش یافته است. همچنین قصد داریم اعلام، اشخاص و اماکن را از منابع استخراج و در اختیار کاربران قرار دهیم تا بتوانند به مقالات و رویدادهای مرتبط دسترسی یابند.
وی ادامه داد: یک ایده دیگر در مراحل اولیه، ایجاد چتباتی برای گفتگو درباره وقایع تاریخی است تا کاربر بتواند به شکل تعاملی به پاسخ برسد؛ مشابه چتبات پایگاه احادیث که اخیراً رونمایی شد.
دستیار جامع هوش مصنوعی مرکز نور
دانش گفت: این فعالیتها بخشی از پروژه کلان مرکز نور است که هدف آن ارائه یک دستیار جامع هوش مصنوعی در حوزه علوم اسلامی است. این دستیار هوشمند قادر است با کاربر تعامل کند و با زیرسیستمهای مختلف مرتبط شود؛ برای مثال، در حوزه حدیث با سرویس چتبات حدیث، در حوزه تاریخ با ربات گفتگو تاریخی و در حوزه تفاسیر با محصولات ویژه مرتبط تعامل دارد. اینها گامهای بعدی مرکز هستند که در دست انجام میباشند.
گفتنی است؛ بخش «رویدادها» در پایگاه جامع تاریخ به نشانی tarikh.inoor.ir در بر گیرنده بیش از یکصد و هشتاد هزار رویداد تاریخی است که جمعبندی و خلاصهسازی آنها توسط هوش مصنوعی صورت گرفته است.
لینک مطلب: | http://enghelab-news.ir/News/item/9554 |