توضیحاتی در مورد کتاب Video Content Analysis Using Multimodal Information: For Movie Content Extraction, Indexing and Representation
نام کتاب : Video Content Analysis Using Multimodal Information: For Movie Content Extraction, Indexing and Representation
ویرایش : 1
عنوان ترجمه شده به فارسی : تجزیه و تحلیل محتوای ویدیویی با استفاده از اطلاعات چندوجهی: برای استخراج، نمایه سازی و نمایش محتوای فیلم
سری :
نویسندگان : Ying Li, C.-C. Jay Kuo (auth.)
ناشر : Springer US
سال نشر : 2003
تعداد صفحات : 207
ISBN (شابک) : 9781441953650 , 9781475737127
زبان کتاب : English
فرمت کتاب : pdf
حجم کتاب : 9 مگابایت
بعد از تکمیل فرایند پرداخت لینک دانلود کتاب ارائه خواهد شد. درصورت ثبت نام و ورود به حساب کاربری خود قادر خواهید بود لیست کتاب های خریداری شده را مشاهده فرمایید.
توضیحاتی در مورد کتاب :
تجزیه و تحلیل محتوای ویدیویی با استفاده از اطلاعات چندوجهی برای محتوای فیلماستخراج، نمایه سازی و نمایش بر روی تجزیه و تحلیل چند رسانه ای، نمایه سازی، نمایش و برنامه های کاربردی مبتنی بر محتوا با تمرکز بر فیلم های بلند است. تکنیک های پیشرفته در حوزه تحلیل محتوای ویدیویی و همچنین بسیاری از ایده ها و الگوریتم های جدید برای تجزیه و تحلیل محتوای فیلم بر اساس استفاده از اطلاعات چندوجهی ارائه شده است.
نویسندگان از نشانههای رسانهای متعددی مانند اطلاعات صوتی، تصویری و چهره استفاده میکنند تا شکاف بین ویژگیهای سمعی و بصری سطح پایین و معنایی ویدیویی سطح بالا را پر کنند. بر اساس پردازش پیچیده محتوای صوتی و تصویری مانند تقسیمبندی ویدیویی و طبقهبندی صوتی، ویدیوی اصلی در قالب مجموعهای از صحنهها یا رویدادهای ویدیویی معنایی بازنمایی میشود، که در آن یک رویداد بیشتر به عنوان یک گفتگوی 2 سخنران طبقهبندی میشود. گفتگوی چند بلندگو یا یک رویداد ترکیبی. علاوه بر این، بلندگوهای مورد نظر به طور همزمان از جریان ویدئو بر اساس یک طرح شناسایی سخنران نظارت شده یا تطبیقی شناسایی می شوند. سپس تمام این اطلاعات با هم ادغام میشوند تا ToC (جدول محتوا) و همچنین جدول فهرست ایجاد شود. در نهایت، یک سیستم انتزاع ویدیویی، که میتواند خلاصهای مبتنی بر صحنه یا یک اسکیم مبتنی بر رویداد ایجاد کند، با بهرهبرداری از دانش معناشناسی ویدیو و قوانین تولید ویدیو ارائه میشود.
این مونوگراف برای دانشمندان پژوهشی و دانشجویان مقطع کارشناسی ارشد که در زمینه تجزیه و تحلیل چند رسانه ای مبتنی بر محتوا، نمایه سازی، نمایش و کاربردها و همچنین زمینه های مرتبط با آن کار می کنند، بسیار جالب خواهد بود.
فهرست مطالب :
Front Matter....Pages i-xxiii
Introduction....Pages 1-9
Background and Previous Work....Pages 11-33
Video Content Pre-Processing....Pages 35-67
Content-Based Movie Scene and Event Extraction....Pages 69-96
Speaker Identification for Movies....Pages 97-131
Scene-Based Movie Summarization....Pages 133-152
Event-Based Movie Skimming....Pages 153-167
Conclusion and Future Work....Pages 169-177
Back Matter....Pages 179-194
توضیحاتی در مورد کتاب به زبان اصلی :
Video Content Analysis Using Multimodal Information For Movie ContentExtraction, Indexing and Representation is on content-based multimedia analysis, indexing, representation and applications with a focus on feature films. Presented are the state-of-art techniques in video content analysis domain, as well as many novel ideas and algorithms for movie content analysis based on the use of multimodal information.
The authors employ multiple media cues such as audio, visual and face information to bridge the gap between low-level audiovisual features and high-level video semantics. Based on sophisticated audio and visual content processing such as video segmentation and audio classification, the original video is re-represented in the form of a set of semantic video scenes or events, where an event is further classified as a 2-speaker dialog, a multiple-speaker dialog, or a hybrid event. Moreover, desired speakers are simultaneously identified from the video stream based on either a supervised or an adaptive speaker identification scheme. All this information is then integrated together to build the video's ToC (table of content) as well as the index table. Finally, a video abstraction system, which can generate either a scene-based summary or an event-based skim, is presented by exploiting the knowledge of both video semantics and video production rules.
This monograph will be of great interest to research scientists and graduate level students working in the area of content-based multimedia analysis, indexing, representation and applications as well s its related fields.