توضیحاتی در مورد کتاب :
Издательство John Wiley, 1989, -360 pp.
تحلیل صحنه سه بعدی به نقطه عطفی رسیده است. اگرچه محققان از اواخر دهه 1960 به بررسی تشخیص اشیا و درک صحنه پرداختهاند، اما میتوان هیجان جدیدی را در این زمینه احساس کرد. من این را به چهار فعالیت همگرا نسبت میدهم: (1) محبوبیت و موفقیتهای روزافزون سیستمهای حسگر استریو و محدوده فعال، (2) مجموعه ابزارها و شایستگیهای نوظهور مربوط به شکل سطح سه بعدی و تقسیمبندی و توصیف معنادار آن، (3) تلاش مار برای قرار دادن دید سه بعدی در یک زمینه علمی و یکپارچه تر و (4) نمایش بروکس از آنچه که درک صحنه سه بعدی هوشمندتر ممکن است مستلزم آن باشد. این همگرایی اینها است که منجر به مشکلی شده است که در این کتاب مورد توجه قرار گرفته است: با فرض اینکه دادههای سطحی به راحتی در دسترس داریم و میتوانیم آنها را به تکههای مفید تقسیم کنیم، پس با آن چه کنیم؟ کار ارائه شده در اینجا یک دیدگاه یکپارچه از مشکلات را نشان می دهد و نشان می دهد که تشخیص واقعاً قابل انجام است.
پیام اصلی این کتاب این است که اطلاعات سطحی می تواند تا حد زیادی فرآیند درک تصویر را ساده کند. این به این دلیل است که سطوح ویژگی هایی هستند که مستقیماً ادراک را به اشیاء درک شده مرتبط می کنند (برای حس کردن معمولی شبیه دوربین) و به این دلیل که آنها اطلاعات صریح مورد نیاز برای درک و مقابله با برخی مشکلات بصری (مانند ویژگی های مبهم) را ایجاد می کنند. از این رو، این کتاب به همان اندازه در مورد یک سبک تحلیل صحنه سه بعدی مبتنی بر مدل است که در مورد یک نمونه خاص از آن سبک است. این سبک وصلههای سطحی تقسیمبندی شده از توصیف صحنه سه بعدی، مدلهای شی مبتنی بر وصله سطحی، سلسله مراتبی از نمایشها، مدلها و شناساییها، فرآیند فراخوانی مدل مبتنی بر شبکه توزیعشده، و تطبیق مدل مبتنی بر دانش را ترکیب میکند. بخشی از کاری که من سعی کردم انجام دهم این بود که نشان دهم این عناصر واقعاً به خوبی با هم تطابق دارند - آنها گسترش صلاحیت سیستمهای بینایی فعلی را بدون پیچیدگیهای خارقالعاده آسان میکنند، و آیا همه ما نمیدانیم که فرآیندهای رایانهای پیچیده چقدر شکننده هستند. ?
این کتاب یک موجودیت ارگانیک است - تحقیقات شرح داده شده در سال 1982 آغاز شد و نتایج قبلی در یک پایان نامه دکتری در سال 1985 گزارش شد. از آن زمان، تحقیقات تحت برنامه انگلستان Alvey ادامه یافت و جایگزین نتایج ضعیف شد و گسترش یافت. به حوزه های جدید، و بیشتر نتایج جدید در اینجا گنجانده شده است. برخی از فرآیندها هنوز نسبتاً ساده هستند و به توسعه بیشتر نیاز دارند، به ویژه در هنگام کار با داده های تقسیم شده خودکار. بنابراین، این کتاب واقعاً فقط یک گزارش پیشرفت است و محتوای آن به تکامل خود ادامه خواهد داد. به نوعی، امیدوارم بتوانم کتاب را در پنج تا ده سال دیگر بازنویسی کنم و گزارش کنم که همه مشکلات توسط جامعه بینایی کامپیوتر حل شده است و نشان می دهد که اکنون می توان تشخیص اشیاء سه بعدی عمومی را انجام داد. چه کسی می داند؟
مقدمه ای بر تشخیص با استفاده از سطوح
تشخیص اشیا از اطلاعات سطح
داده های سطحی به عنوان ورودی برای تشخیص
تکمیل کردن فرضیههای سطحی
خوشههای سطحی
توضیح ساختارهای سهبعدی
نمایش شیها
فرضکردن مدل
ساخت فرضیه
تأیید فرضیه
بحث و نتیجهگیری
بخشی از پایه مدل
توضیحاتی در مورد کتاب به زبان اصلی :
Издательство John Wiley, 1989, -360 pp.
Three dimensional scene analysis has reached a turning point. Though re- searchers have been investigating object recognition and scene understanding since the late 1960’s, a new excitement can be felt in the field. I attribute this to four converging activities: (1) the increasing popularity and successes of stereo and active range sensing systems, (2) the set of emerging tools and competences concerned with three dimensional surface shape and its meaningful segmentation and description, (3) Marr’s attempt to place three dimensional vision into a more integrated and scientific context and (4) Brooks’ demonstration of what a more intelligent three dimensional scene understander might entail. It is the convergence of these that has led to the problem considered in this book: Assuming that we have easily accessible surface data and can segment it into useful patches, what can we then do with it?. The work presented here takes an integrated view of the problems and demonstrates that recognition can actually be done.
The central message of this book is that surface information can greatly simplify the image understanding process. This is because surfaces are the features that directly link perception to the objects perceived (for normal camera-like sensing) and because they make explicit information needed to understand and cope with some visual problems (e.g. obscured features). Hence, this book is as much about a style of model-based three dimensional scene analysis as about a particular example of that style. That style combines surface patches segmented from the three dimensional scene description, surface patch based object models, a hierarchy of representations, models and recognitions, a distributed network-based model invocation pro- cess, and a knowledge-based model matcher. Part of what I have tried to do was show that these elements really do fit together well – they make it easy to extend the competence of current vision systems without extraordinary complications, and don’t we all know how fragile complicated computer-based processes are?
This book is an organic entity – the research described started in 1982 and earlier results were reported in a PhD thesis in 1985. Since then, re- search has continued under the United Kingdom Alvey program, replacing weak results and extending into new areas, and most of the new results are included here. Some of the processes are still fairly simple and need further development, particularly when working with automatically segmented data. Thus, this book is really just a progress report and its content will continue to evolve. In a way, I hope that I will be able to rewrite the book in five to ten years, reporting that all problems have been solved by the computer vision community and showing that generic three dimensional object recognition can now be done. Who knows?
An Introduction to Recognition Using Surfaces
Object Recognition from Surface Information
Surface Data as Input for Recognition
Making Complete Surface Hypotheses
Surface Clusters
Description of Three Dimensional Structures
Object Representation
Model Invocation
Hypothesis Construction
Hypothesis Verification
Discussion and Conclusions
A Portion of the Model Base