به گزارش خبرگزاری مهر به نقل از دانشگاه علم و صنعت، سیستم دسته بندی و جستجوی خودکار فایل های صوتی و ویدئویی قادر است در میان انبوهی از ویدئوها، ویدئوی مورد نظر را جستجو کند، ضمن آنکه امکان رصد اتوماتیک ویدئو نیز در آن در نظر گرفته شده است.
محمدمهدی ارزانی دانشجوی دکتری دانشگاه علم و صنعت و از محققان این طرح، زمینه تحقیقات این تیم تحقیقاتی را پردازش صوت و تصویر عنوان کرد و گفت: محصولی که ما در این مطالعات عرضه کردیم، دستگاه تحلیل معنایی بینایی است.
وی افزود: این سیستم هر معنای ویدئویی که به آن داده میشود را تحلیل میکند ضمن آنکه هر آنچه را که در ویدئو رخ دهد، آن را آنالیز خواهد کرد.
این محقق تعیین دستهبندی کلی ویدئو را از دیگر قابلیتهای این سیستم عنوان کرد و اظهار داشت: این سیستم با تحلیل ویدئو قادر است دستهبندی فیلم را در ردههای ورزشی، حیات وحش و سایر دستهها تعیین کند و حتی اتفاقات جدیدی را که در ویدئو رخ داده باشد نیز اعلام میکند.
ارزانی ادامه داد: یکی از کاربردهای سیستم «تحلیل معنایی ویدئو» برای حوزههایی مانند صدا و سیما و یا سایتهایی است که دارای آرشیوهای صوتی و تصویری بزرگی هستند.
وی عنوان کرد: این حوزهها دارای محتوای زیاد صوتی و تصویری هستند و در صورتی که ویدئوها برچسب مناسبی نخورده باشند، پیدا کردن محتوای مد نظر از میان حجم عظیم ویدئوها و فایلهای صوتی غیر ممکن است.
این محقق با بیان اینکه موتورهای جستجو تنها بر مبنای جستجوی متن کار میکنند، خاطر نشان کرد: بر این اساس ما سیستم تحلیل معنایی را طراحی و پیادهسازی کردیم و این سیستم محتوای متنی کار جستجو را انجام میدهد.
ارزانی گفت: این سیستم پس از دریافت ویدئو، همه مفاهیم را در آن میبیند و در قالب متن ارائه میکند و از این طریق جستجوی ویدئو از طریق متن میسر میشود.
وی پایش محتوا را از دیگر کاربردهای این سیستم عنوان کرد و افزود: در حال حاضر شبکههای مجازی و اجتماعی رو به ازدیاد است و موارد ممنوعهای مانند خشونت، مواد مخدر و سایر محتوای غیر اخلاقی دیگر در حال رد و بدل شدن است، از این رو امکان رصد دستی این محتوا وجود ندارد.
این محقق با تاکید بر اینکه این سیستم میتواند به صورت اتوماتیک کار رصد را انجام دهد، گفت: این سیستم با استفاده از یک سرور قوی میتواند کاری که توسط چند نفر انجام گیرد را به تنهایی انجام دهد.
ارزانی تاکید کرد: این سیستم شامل یک نرمافزار است که بر روی سختافزار کارت گرافیکی نصب میشود و قادر است حجم زیادی از صوت و تصویر را پردازش کند.
وی با تاکید بر اینکه در حال حاضر ۸ هزار مفهوم در این سیستم بارگذاری شده است، اضافه کرد: امکان افزودن دادههای جدید در این سیستم وجود دارد، به نحوی که برای کاربران امکانی فراهم شده تا بتوانند مفاهیم جدید را تعریف کنند.
این محقق با بیان اینکه فناوری این سیستم در اختیار ۴ شرکت بزرگ است، عنوان کرد: شرکتهای IBM، گوگل و ماکروسافت این سیستم را پیاده سازی کردند و ایران نیز همزمان با این فعالیتها در دنیا وارد این حوزه شده است.
ارزانی با بیان اینکه از این طرح دو شرکت در ایران و بلژیک تاسیس شده است، گفت: این پروژه با همکاری محمدحسن بهاری و علی دیبا از دانشگاه لون (KU Leuven) بلژیک اجرایی شده است.