printlogo


ثبت بیش از ۱۸۰ هزار مقاله مستند در پایگاه جامع تاریخ
کد خبر: 9554
سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی» مجموعه‌ای از مقالات کوتاه درباره رویدادهای تاریخی است که بر اساس منابع معتبر و اصیل و با رویکرد پژوهشی تدوین شده است. این سامانه تحولی در تولید و ارائه محتواهای تاریخی به زبان فارسی از منابع دست اول ایجاد کرده است.
به گزارش پایگاه خبری تحلیلی انقلاب نیوز،اولین جلسه از «سلسله نشست‌های معرفی دستاوردهای هوشمند مرکز تحقیقات کامپیوتری علوم اسلامی» با عنوان «تحلیل و توصیف هوشمند رویدادهای تاریخی» و رونمایی از این سامانه با حضور اصحاب رسانه، امروز سه‌شنبه ۴ شهریورماه، در مرکز تحقیقات کامپیوتری علوم اسلامی (نور) برگزار شد.

در ابتدای این نشست، حجت‌الاسلام والمسلمین رحیمی ثابت مدیر گروه علمی تاریخ مرکز تحقیقات کامپیوتری علوم اسلامی نور، درباره امکانات و قابلیت‌های پژوهشی پایگاه جامع تاریخ توضیح داد.

 

قابلیت‌های متنوع و کاربردی

حجت‌الاسلام والمسلمین رحیمی ثابت گفت: آنچه عرض می‌شود قابلیت‌هایی است که اکنون در «پایگاه جامع تاریخ» ارائه شده و این امکانات پژوهشی در آن وجود دارد. به این معنا که ما تنها به جمع‌آوری یک‌ سری رویداد تاریخی اکتفا نکردیم، بلکه با همکاری معاونت فنی مرکز، قابلیت‌های متعددی را برای این داده‌های گردآوری‌شده فراهم کرده‌ایم. از جمله اینکه کاربر می‌تواند رویدادها را بر اساس نوع آن‌ها مشاهده کند، یا آن‌ها را در یک بازه زمانی مشخص ببیند.

 

مدیر گروه علمی تاریخ مرکز نور افزود: همچنین این امکان فراهم است که وقایع تاریخی با محوریت یک شخصیت یا حتی یک مکان خاص بررسی شوند. به عنوان مثال، پژوهشگر می‌تواند مکان تاریخی‌ای همچون کوفه، مدینه یا حتی شهرهای ایران و دیگر شهرهای جهان اسلام را انتخاب کند و رویدادهای مربوط به آن را مشاهده نماید.

 

ادامه رشد و بروزرسانی پایگاه

وی گفت: البته این پایگاه به‌ صورت مستمر در حال بروزرسانی و گسترش است و هر روز به حجم داده‌های آن افزوده می‌شود. هم‌اکنون ۸ نفر از نیروهای متخصص ما که هم طلبه هستند و هم تحصیلات دانشگاهی در رشته تاریخ دارند، مشغول استخراج و ثبت این رویدادها هستند. بنابراین علاوه بر وقایع صدر اسلام، اطلاعات مربوط به قرون میانی اسلام، همچنین دوره قاجار و حتی بخشی از رویدادهای مشروطه نیز وارد این پایگاه شده است.

حجت‌الاسلام والمسلمین رحیمی ثابت تأکید کرد: فرایند گردآوری و افزودن داده‌ها همچنان ادامه دارد و رویدادها به‌ طور مرتب در حال اضافه شدن هستند. در واقع، پایگاه جامع تاریخ یک مجموعه پویا و رو به رشد است که هدف نهایی آن پوشش حداکثری تمام دوران‌های تاریخ اسلام می‌باشد. این روند تا زمانی ادامه خواهد یافت که همه دوره‌های تاریخ اسلام در آن درج و در دسترس پژوهشگران قرار گیرد.

 

ورود هوش مصنوعی به پژوهش‌های تاریخی

حجت‌الاسلام والمسلمین رحیمی ثابت گفت: زمانی که بحث «هوش مصنوعی» به‌ طور جدی و پررنگ مطرح شد و کاربردهای علمی، پژوهشی و حتی عمومی آن گسترش یافت، این ایده در ذهن همکاران فنی مرکز شکل گرفت که از ظرفیت‌های هوش مصنوعی در کنار انبوه داده‌هایی که درباره وقایع تاریخ اسلام فراهم کرده‌ایم استفاده کنیم تا یک پنجره جدید در پژوهش‌های تاریخی باز شود.

وی ادامه داد: برای توضیح بیشتر، ما برای هر واقعه تاریخی، چون به منابع مختلف رجوع می‌کردیم، طبیعتاً گزارش‌های متعددی از آن واقعه به دست می‌آمد. به عنوان نمونه، در مورد شهادت امام حسین (ع) و واقعه عاشورا، حدود ۱۹۰ گزارش از منابع گوناگون استخراج کردیم. این گزارش‌ها همگی از منابع اصلی و معتبر بوده‌اند. منظور از معتبر این است که افزون بر منابع اولیه تاریخ اسلام، از برخی آثار پژوهشی ارزشمند نیز استفاده کرده‌ایم؛ برای مثال اثر گرانقدر مرحوم سید جعفر مرتضی عاملی یکی از منابع ما بوده است. بنابراین گرچه تمرکز اصلی ما بر منابع اولیه بوده، اما از منابع پژوهشی معتبر و دارای بار علمی نیز غفلت نکرده‌ایم.

 

تولید مقالات کوتاه با هوش مصنوعی

مدیر گروه علمی تاریخ مرکز نور گفت: با این کار مجموعه‌ای از وقایع تاریخی همراه با گزارش‌های متعدد از منابع مختلف به دست آمد. در این مرحله تصمیم گرفتیم با کمک قابلیت‌های هوش مصنوعی، از این گزارش‌ها برای تولید مقالات کوتاه تاریخی بهره ببریم. به این صورت که هوش مصنوعی، با تکیه بر گزارش‌های مستند ما (و نه منابع بیرونی یا داده‌های خود)، اطلاعات گردآوری‌شده را تلفیق کرده و یک جمع‌بندی مستند و خلاصه‌شده از آن‌ها ارائه دهد.

وی افزود: خروجی این فرآیند تولید مجموعه‌ای از مقالات کوتاه درباره هر واقعه تاریخی شد. این مقالات شامل موضوعاتی مانند وفیات، انتساب‌ها، وقایع نظامی، فتح‌ها یا حتی روابط و تعاملاتی است که میان شخصیت‌های تاریخی در طول زمان رخ داده است. ما این تولیدات را «مقالات درباره رویداد» نام‌گذاری کردیم.

 

ثبت بیش از ۱۸۰ هزار مقاله مستند در پایگاه جامع تاریخ

حجت‌الاسلام والمسلمین رحیمی ثابت تأکید کرد: از آن‌جا که در پایگاه جامع تاریخ بیش از ۱۸۰ هزار واقعه تاریخی غیرتکراری ثبت شده است، با کمک هوش مصنوعی و گزارش‌هایی که به آن داده‌ایم، برای هر یک از این رویدادها یک متن کوتاه و مستند تولید شده است. بنابراین مجموعه تولیدات هوش مصنوعی ما کاملاً مستند به منابع تاریخی معتبر است و حاصل آن تاکنون بیش از ۱۸۰ هزار مقاله یا شرح تاریخی است که هم‌اکنون در پایگاه جامع تاریخ در دسترس کاربران قرار دارد.

 

فعالیت سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی»

در ادامه این نشست، علی دانش، مدیر بخش پردازش هوش مصنوعی مرکز تحقیقات کامپیوتری علوم اسلامی نور، درباره سابقه فعالیت مرکز در عرصه هوش مصنوعی، قابلیت‌های سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی»، و برنامه‌های آینده این سامانه توضیح داد.

دانش گفت: سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی» مجموعه‌ای از مقالات کوتاه درباره رویدادهای تاریخی است که بر اساس منابع معتبر و اصیل و با رویکرد پژوهشی تدوین شده است. این سامانه تحولی در تولید و ارائه محتواهای تاریخی به زبان فارسی از منابع دست اول ایجاد کرده است.

وی با بیان اینکه گزارش‌ها از منابع مختلف گردآوری شده‌اند؛ برخی به زبان عربی و برخی به فارسی، در کتاب‌های مختلف و با سبک‌های متفاوت، و نیز از منابع اهل سنت و شیعه بهره گرفته شده است، گفت: جمع‌آوری، دسته‌بندی و تحقیق کوتاه بر روی این منابع کار دشواری بود، اما با کمک هوش مصنوعی امکان‌پذیر شد و تحولی در ارائه محتوا ایجاد کرد. این اقدام هم‌راستا با اهداف مرکز نور است که یکی از اهداف اصلی آن، تسهیل دسترسی به منابع اصیل و متون اسلامی است و با تولید این محصول محقق شده است.

دانش با تقسیم‌بندی مباحث خود به سه بخش گفت: بخش اول مرور کوتاهی بر کارهای گذشته در حوزه فنی و هوش مصنوعی خواهد بود، بخش دوم به تشریح این دستاورد اخیر اختصاص دارد و بخش سوم به فعالیت‌های آتی اشاره خواهد شد.»

 

دستاوردهای مرکز نور

مدیر بخش پردازش هوش مصنوعی مرکز نور توضیح داد: مرکز نور در سال ۱۳۶۸ با نظر رهبر انقلاب اسلامی تأسیس شد و هدف آن استفاده از فناوری‌های نوین در پردازش محتوا در حوزه علوم اسلامی و انسانی بود، با تمرکز بر سرعت بخشیدن به پژوهش و تسهیل دسترسی به منابع اسلامی.

دانش گفت: این مرکز از ابتدا در این حوزه پیشرو بوده و طی دوران فعالیت خود، پلتفرم‌های مختلفی توسعه داده و تمامی آن‌ها را پشتیبانی کرده است. محصولات متنوعی در حوزه نرم‌افزارهای ویندوزی، سیستم‌های جاوا، اندروید و آی‌اواس و همچنین پایگاه‌های وبی تولید شده‌اند. در حوزه پایگاه‌های وبی، سایت‌های معروفی مانند قرآن، حدیث، نورمگز و نور لایو فعال بوده‌اند و یکی از پایگاه‌ها، پایگاه جامع تاریخ است که دستاورد اخیر در قالب آن ارائه شده است.

 

پیشرفت مرکز نور در حوزه هوش مصنوعی

وی گفت: در خصوص سابقه مرکز در حوزه هوش مصنوعی، طی سه تا چهار سال اخیر با ظهور ربات‌های جستجوگر هوشمند و چت‌بات‌های هوشمند تحولی بنیادین ایجاد شد و این فناوری‌ها در سطح جامعه ملموس‌تر گردیدند. تا چند سال قبل، هوش مصنوعی برای عموم مردم کمتر قابل مشاهده بود، اما مرکز از حدود بیست سال پیش به این حوزه ورود کرده و حتی در سال ۱۳۹۰ اولین سمینار هوش مصنوعی را برگزار کرد. طی سال‌ها، مرکز از هوش مصنوعی در سطوح مختلف محصولات خود استفاده کرده است: در تولید محتوا، ورود و تصحیح اطلاعات، دیجیتال‌سازی محتوا و هوشمندسازی فرآیندها.

دانش افزود: در سطح تولید محتوا، هوشمندسازی شامل تبدیل و تصحیح اطلاعات است. در سطح دوم، یعنی فرآوری اطلاعات، برچسب‌گذاری متون به صورت ماشینی برای قابلیت جستجو و فهرست‌بندی انجام شده است. در سطح سوم، یعنی ارائه اطلاعات، در نرم‌افزارهای ویندوزی، موبایلی و پایگاه‌های وبی از هوش مصنوعی استفاده شده است؛ به‌ طوری که طی ۱۵ سال توسعه محصولات متعدد، بیش از ۵۰ قابلیت هوش مصنوعی در سطوح مختلف به‌ کار گرفته شده که بسیاری از آن‌ها شاید برای کاربران ملموس نباشد.

 

قابلیت‌های هوش مصنوعی سامانه «تحلیل و توصیف هوشمند رویدادهای تاریخی»

دانش توضیح داد: یکی از قابلیت‌ها، استخراج خودکار اعلام و اشخاص است که در سایت آزمایشگاه هوش مصنوعی در دسترس است و بر اساس پیکره‌ای از اعلام و اشخاص، از محتوای تاریخی مرکز استخراج می‌شود. قابلیت دیگر، کمی‌سازی عبارات تاریخی است؛ زیرا کتاب‌های مختلف تاریخ، تاریخ‌ها را به اشکال متفاوت بیان می‌کنند (مثلاً نیمه شعبان، پانزدهم شعبان، به حروف یا به عدد). ماشین باید قادر باشد این موارد را تشخیص دهد، دسته‌بندی کند و در اختیار پژوهشگر قرار دهد. این قابلیت در محصولات دیگر مانند نرم‌افزار جامع الاحادیث چهار که به زودی رونمایی می‌شود نیز استفاده شده است.

مدیر بخش پردازش هوش مصنوعی مرکز نور افزود: مورد سوم، شناسایی هوشمند رویدادهای تاریخی است که در قالب یک پایان‌نامه کارشناسی ارشد و با همکاری دانشگاه‌ها انجام شده و می‌تواند رویدادها را از متون تاریخی به صورت هوشمند استخراج کند؛ مانند تولد، جنگ، مرگ و ازدواج.

 

ورود به حوزه مدل‌های زبانی بزرگ

دانش گفت: با توجه به رشد سریع فناوری، بویژه در حوزه هوش مصنوعی و ظهور مدل‌های زبانی بزرگ، مرکز تصمیم گرفت به این حوزه ورود پیدا کند. دو رویکرد برای این کار در نظر گرفته شد: رویکرد اول استفاده از سرویس‌های شرکت‌های بزرگ ارائه‌دهنده مدل‌های زبانی، مانند اوپن‌ای‌آی و گوگل. و رویکرد دوم، توسعه زیرساخت‌های داخلی شامل سرورهای قوی و کارت‌های گرافیکی مناسب برای اجرای مدل‌های زبانی بزرگ.

مدیر بخش پردازش هوش مصنوعی مرکز نور افزود: این زیرساخت داخلی در مرکز نور اواخر پارسال راه‌اندازی شد و پس از نصب و پیکربندی، مدل‌های زبانی متن‌ باز در سرورها مستقر و سفارشی‌سازی شدند. هم‌اکنون از هر دو رویکرد استفاده می‌کنیم. بخشی از پردازش‌ها روی زیرساخت داخلی انجام می‌شود و بخشی دیگر، از سرویس‌های خارجی بهره‌برداری می‌شود تا پاسخگویی به نیازهای گسترده هوش مصنوعی تضمین شود.

دانش گفت: برای تسهیل دسترسی به سرویس‌های خارجی، پایگاهی تحت عنوان نورجی‌پی‌تی تأسیس شد که امکان دسترسی یکپارچه به مدل‌های زبانی بزرگ را فراهم می‌کند. اکثر این سرویس‌ها تحت تحریم هستند، اما در پایگاه مرکز این مشکل رفع شده و شارژ آن‌ها با کارت‌های داخلی امکان‌پذیر است.

 

پردازش اطلاعات تاریخی و تولید مقالات

وی گفت: با توجه به زیرساخت داخلی، پردازش پایگاه تاریخ بدون نیاز به سرور خارجی انجام شد. بیش از ۲۷۰ هزار گزارش پردازش شد و از دل آن‌ها بیش از ۱۸۰ مقاله کوتاه درباره رویدادهای مختلف تهیه گردید. در فاز اول، این فرآیند در مقیاس کوچکتر انجام شد و پس از دریافت بازخورد پژوهشگران اصلاحات لازم اعمال شد و سپس در حجم کل گزارش‌های سایت اجرا شد.

دانش ادامه داد: این گزارش‌ها متنوع بودند؛ برخی رویدادها مانند واقعه عاشورا بیش از ۱۹۰ گزارش داشتند و برخی دیگر بسیار کمتر. یکی از چالش‌های کار، محدودیت ورودی مدل‌های زبانی بزرگ بود؛ به همین دلیل مدل‌هایی انتخاب شد که توانایی پردازش متن‌های طولانی را داشته باشند.

 

صحت اطلاعات و چالش‌ها

مدیر بخش پردازش هوش مصنوعی مرکز نور تأکید کرد: تمام اطلاعات تولید شده توسط مدل، ارجاع به منبع دارد. یکی از مشکلات مدل‌های زبانی بزرگ، تولید اطلاعات اشتباه یا «توهم» است. برای حل این مشکل، اطلاعات به مدل داده شد و مدل طوری برنامه‌ریزی شد که تمام خروجی‌ها به منابع اصلی ارجاع داده شوند و کاربر با یک کلیک بتواند منبع را مشاهده کند.

وی ادامه داد: چالش‌های دیگر شامل تنوع منابع و مذاهب، زبان‌های مختلف و ناهمگونی در گزارش‌ها بود. برخی گزارش‌های تاریخی در خصوص برخی رویدادها اغراق یا کم‌توجهی داشتند که با توجه به مذهب تشیع تعدیل شدند. همچنین برخی رویدادها حجم زیادی گزارش داشتند و برخی کمتر؛ ما محدودیت حجم برای مطالعه مناسب کاربران اعمال کردیم. مدل به گونه‌ای تنظیم شد که ساختار منضبط، عناوین منظم، ارجاعات عددی و فهرست منابع در انتهای متن رعایت شود و سبک مقاله روان و قابل فهم برای پژوهشگران و کاربران عادی باشد.

 

برنامه‌های آینده

دانش در بخش سوم سخنان خود که معطوف به آینده است، گفت: گام بعدی، استخراج رویدادها با استفاده از مدل‌های زبانی بزرگ است. پیش‌تر نیز کارهایی انجام شده، اما با ورود مدل‌های جدید، کیفیت و سطح کار افزایش یافته است. همچنین قصد داریم اعلام، اشخاص و اماکن را از منابع استخراج و در اختیار کاربران قرار دهیم تا بتوانند به مقالات و رویدادهای مرتبط دسترسی یابند.

وی ادامه داد: یک ایده دیگر در مراحل اولیه، ایجاد چت‌باتی برای گفتگو درباره وقایع تاریخی است تا کاربر بتواند به شکل تعاملی به پاسخ برسد؛ مشابه چت‌بات پایگاه احادیث که اخیراً رونمایی شد.

 

دستیار جامع هوش مصنوعی مرکز نور

دانش گفت: این فعالیت‌ها بخشی از پروژه کلان مرکز نور است که هدف آن ارائه یک دستیار جامع هوش مصنوعی در حوزه علوم اسلامی است. این دستیار هوشمند قادر است با کاربر تعامل کند و با زیرسیستم‌های مختلف مرتبط شود؛ برای مثال، در حوزه حدیث با سرویس چت‌بات حدیث، در حوزه تاریخ با ربات گفتگو تاریخی و در حوزه تفاسیر با محصولات ویژه مرتبط تعامل دارد. این‌ها گام‌های بعدی مرکز هستند که در دست انجام می‌باشند.

 

گفتنی است؛ بخش «رویدادها» در پایگاه جامع تاریخ به نشانی tarikh.inoor.ir در بر گیرنده بیش از یکصد و هشتاد هزار رویداد تاریخی است که جمع‌بندی و خلاصه‌سازی آن‌ها توسط هوش مصنوعی صورت گرفته است.




انتهای پیام/
لینک مطلب: http://enghelab-news.ir/News/item/9554