لیلا ربیعی در گفتگو با خبرنگار مهر، جزئیات و نحوه انجام پروژه داده کاوی و ذائقه سنجی کاربران شبکههای اجتماعی در پژوهشگاه ارتباطات و فناوری اطلاعات را تشریح کرد و اظهار داشت: ما با جمعآوری آنلاین کلاندادههای شبکههای اجتماعی (بیگ دیتا) و دامنههای وب و ذخیرهسازی در بستر کلان داده، همگام با رصد و پایش آنها، تحلیل هوشمند این دادهها را از منظر سنجش ذائقه کاربران به صورت توصیفی، پیشبینی، احساسات و با پردازش زبان طبیعی (فارسی عامیانه) انجام داده و در قالب داشبوردها و بولتنهای تحلیلی ارائه میدهیم.
وی گفت: در حال حاضر، تحلیل در علوم داده و شبکه با استفاده از فناوریهای یادگیری ماشین و هوش مصنوعی در ردههای نخست تحقیقات در دنیا قرار داشته و مورد اقبال فراوانی است. حتی بسیاری از کسب و کارها نیز بر این اساس در حال رشد و شکلگیری است. از طرف دیگر، با توجه به رشد روزافزون کاربران شبکههای اجتماعی و ضریب نفوذ بالای این شبکهها، بررسی و تحلیل فضای مجازی شامل شناخت دادهمحور فعالیتها، روندهای علاقهمندی کاربران و همچنین آسیبهای شبکههای اجتماعی پرکاربرد، امری مفید و اجتنابناپذیر بوده و میتواند فرصتهای فرهنگی و اقتصادی قابل توجهی را نیز فراهم کند.
ربیعی تاکید کرد: با توجه به این موارد، پروژه «ذائقه سنجی کاربران و تحلیل ترافیک فضای مجازی» در راستای مأموریتهای پژوهشگاه ICT و با هدف انجام تحقیقات کاربردی در این حوزه، تعریف شده است که ابزاری قدرتمند جهت استخراج الگوهای رفتاری کاربران و پیشبینی گرایشها و روند علاقهمندی آنها در آینده است.
وی خاطرنشان کرد: در پیاده سازی طرح داده کاوی و ذائقه سنجی کاربران ایرانی، استفاده کاربردی و بهجا از فناوریهای هوش مصنوعی، یادگیری ماشین به روشهای سنتی و عمیق، استفاده از علم آمار، مهندسی دادهها، کاوش دادهها و در نهایت مصورسازی نتایج تحلیلها، به شیوه پژوهش و توسعه، همگام با عملیاتی بودن و ارائه خدمت، مدنظر قرار گرفته است.
ربیعی با اشاره به تعریف معیارهای مرتبط برای سنجش کمی و کیفی در بخشهای مختلف این طرح گفت: به طور اجمالی در بخش جمعآوری داده، تعداد موجودیتها، انواع منابع داده قابل پشتیبانی و ظرفیت ذخیرهسازی و در بخش تحلیل، ظرفیت پردازشی، متوسط زمان تولید تحلیلهای ساختیافته، زمان لازم برای تولید تحلیلهای سفارشی مدنظر قرار گرفته است.
وی ادامه داد: ما در بخش مصور سازی نیز قابلیت دسترسی به دادههای تحلیلی و شیوه ارائه نتایج تحلیلها و در بخش ارائه خدمت نیز دریافت بازخورد از مشتریان تحلیلها را به عنوان معیار درنظر گرفتهایم.
مجری پروژه ذائقه سنجی کاربران شبکههای اجتماعی خاطرنشان کرد: باتوجه به ماهیت دادهها، فعالیتهای پیشپردازش داده در راستای زنجیره تحلیلدادهها، تحلیلهای توصیفی-آماری و پیشبینی در حال انجام است که بدین منظور، همگام با مراحل مهندسی داده، پیشپردازش داده، پردازش زبان طبیعی و تحلیل احساسات انجام میشود. لذا بخشی از شاخصهای سنجش مرتبط با این فعالیتها، پارامترهای سنجش دقت، صحت و ارزیابی الگوریتمها بوده و بخشی دیگر براساس نتایج بررسی صاحبنظران و بازخورد ذینفعان است.
ربیعی تاکید کرد: با توجه به اینکه مدیریت اجرای این پروژه مبتنی بر روشهای چابک است، لذا در هر مرحله از چرخه، وظایف تعریف شده پس از اخذ بازخورد از صاحبنظران و ذینفعان، نتایج تحلیلها و تحقیقات صورت گرفته، نهایی شده و به صورت خدمت، در اختیار ذینفعان قرار میگیرد. لذا میتوان گفت که سامانه ذائقه سنجی کاربران شبکههای اجتماعی نمایانگر یک محصول عملیاتی است که توسعه هر بخش آن، به طور کامل بر پایه فعالیتهای علمی پژوهشی بوده و از همان گامهای آغازین، کاربردی شده است.
وی در خصوص همکاری با دانشگاههای کشور جهت تعریف پروژهای مشترک مربوط به تحلیل داده و داده کاوی در مقاطع تحصیلات تکمیلی، اعلام آمادگی کرد و گفت: در حال حاضر در بخشهای مختلف با بستر آماده شده در حوزه تحلیل و پیشبینی در سامانه ذائقه سنجی کاربران فضای مجازی، قابلیت همکاری با دانشجویان در مقاطع کارشناسی ارشد و دکتری در حوزههای علوم اجتماعی، علوم داده و شبکه، هوش مصنوعی، علوم کامپیوتر، مهندسی کامپیوتر و پردازش زبان طبیعی وجود دارد. این بستر به منظور تعریف و انجام پایاننامههای مرتبط ایجاد شده است.
ربیعی اضافه کرد: هماکنون نیز با هماهنگی اساتید راهنما، تعدادی از دانشجویان دانشگاهها در راستای انجام پایان نامه و انجام فعالیتهای علمی کاربردی پروژه، در حال بهرهگیری از این خدمت هستند. همچنین آمادگی همکاری با دانشگاهها و اساتید جهت تعریف پروژهای مشترک در مقاطع تحصیلات تکمیلی در حوزه فعالیتهای این پروژه وجود دارد.