ترجمه فارسی عنوان مقاله
نظارت بر رفتار انسان با فیلم ضبط شده در محیط اداری
عنوان انگلیسی
Monitoring human behavior from video taken in an office environment
کد مقاله | سال انتشار | تعداد صفحات مقاله انگلیسی |
---|---|---|
28060 | 2001 | 14 صفحه PDF |
منبع
Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)
Journal : Image and Vision Computing, Volume 19, Issue 12, 1 October 2001, Pages 833–846
فهرست مطالب ترجمه فارسی
چکیده
کلیدواژهها
1.مقدمه
2. آثار مرتبط
3. دانش قبلی
4. سیستم
4.1. تشخیص پوست
4.2 ردیابی
4.3. تشخیص تغییر صحنه
جدول 1. لیست اعمال و شرایط تشخیص
4.4. تشخیص عمل
شکل 1. مدلهای وضعیت، برای اتاق نمونه، که شامل تلفن، کابینت، و ترمینال کامپوتر است.
شکل 2. مدلهای وضعیت، برای اتاق نمونه که شامل تلفن، کابینت، و ترمینال کامپوتر است.
شکل 3. پنج نمونه از تنظیمات صحنه.
4.5 تعیین فریمهای کلیدی
شکل 4. فرد کابینتی را باز میکند، در حالی که فرد دیگری مینشیند (350 فریم، 8 فریم کلیدی).
5. نتایج
شکل 5. فرد تلفن را برمیدارد، با آن صحبت میکند و سپس تلفن را بر میدارد (199 فریم، 4 فریم کلیدی).
شکل 6. فرد جعبه را برمیدارد و آن را جای دیگری میگذارد (199 فریم، 4 فریم کلیدی).
شکل 7. فرد مینشیند تا از ترمینال استفاده کند، سپس برمیخیزد و میرود (399 فریم، 5 فریم کلیدی).
شکل 8. فرد وارد اتاق میشود، فلاسک را برمیدارد و از اتاق خارج میشود (170 فریم، 3 فریم کلیدی).
شکل 9. فرد وارد اتاق میشود، فلاسکی را برمیدارد، اما الگوریتم ردیابی فلاسک را رها میکند، بنابراین خطای خروجی رخ میدهد، در نهایت فرد از اتاق خارج میشود (170 فریم، 4 فریم کلیدی)
6. محدودیتها
شکل 10. فرد وارد اتاق میشود، تلفنی را برمیدارد، اما الگوریتم ردیابی فلاسک را رها میکند، بنابراین خطای خروجی رخ میدهد، در نهایت فرد از اتاق خارج میشود (325 فریم، 4 فریم کلیدی).
7. نتیجهگیری و آثار آینده
کلیدواژهها
1.مقدمه
2. آثار مرتبط
3. دانش قبلی
4. سیستم
4.1. تشخیص پوست
4.2 ردیابی
4.3. تشخیص تغییر صحنه
جدول 1. لیست اعمال و شرایط تشخیص
4.4. تشخیص عمل
شکل 1. مدلهای وضعیت، برای اتاق نمونه، که شامل تلفن، کابینت، و ترمینال کامپوتر است.
شکل 2. مدلهای وضعیت، برای اتاق نمونه که شامل تلفن، کابینت، و ترمینال کامپوتر است.
شکل 3. پنج نمونه از تنظیمات صحنه.
4.5 تعیین فریمهای کلیدی
شکل 4. فرد کابینتی را باز میکند، در حالی که فرد دیگری مینشیند (350 فریم، 8 فریم کلیدی).
5. نتایج
شکل 5. فرد تلفن را برمیدارد، با آن صحبت میکند و سپس تلفن را بر میدارد (199 فریم، 4 فریم کلیدی).
شکل 6. فرد جعبه را برمیدارد و آن را جای دیگری میگذارد (199 فریم، 4 فریم کلیدی).
شکل 7. فرد مینشیند تا از ترمینال استفاده کند، سپس برمیخیزد و میرود (399 فریم، 5 فریم کلیدی).
شکل 8. فرد وارد اتاق میشود، فلاسک را برمیدارد و از اتاق خارج میشود (170 فریم، 3 فریم کلیدی).
شکل 9. فرد وارد اتاق میشود، فلاسکی را برمیدارد، اما الگوریتم ردیابی فلاسک را رها میکند، بنابراین خطای خروجی رخ میدهد، در نهایت فرد از اتاق خارج میشود (170 فریم، 4 فریم کلیدی)
6. محدودیتها
شکل 10. فرد وارد اتاق میشود، تلفنی را برمیدارد، اما الگوریتم ردیابی فلاسک را رها میکند، بنابراین خطای خروجی رخ میدهد، در نهایت فرد از اتاق خارج میشود (325 فریم، 4 فریم کلیدی).
7. نتیجهگیری و آثار آینده
ترجمه کلمات کلیدی
ویدئو - تشخیص اکشن - فریم های کلیدی - متن
کلمات کلیدی انگلیسی
Video,Action recognition,Key frames,Context
ترجمه چکیده
در این مقاله، سیستمی را توصیف میکنیم که به طور خودکار اعمال انسان را از ویدئوی ضبط شده از یک اتاق تشخیص میدهد. این اقدامات شامل ورود به اتاق، استفاده از ترمینال کامپیوتر، باز کردن کابینت، برداشتن تلفن، و غیره هستند. سیستم ما این اقدامات را با استفاده از دانش قبلی در مورد طرح اتاق تشخیص میدهد. در سیستم ما، تشخیص عمل توسط ماشین وضعیت مدلسازی میشود، که متشکل از «حالات» و «انتقالهای» بین حالات است. انتقالها از حالات مختلف را میتوان بر اساس موقعیت فرد، تشخیص تغییر صحنه، و یا شی در حال ردیابی انجام داد. سیستم علاوه بر ایجاد توصیف متنی اعمال شناسایی شده، قادر به ایجاد فریمهای کلیدی از توالی ویدئو است، که در اصل ویدئوی فشردهی مبتنی بر ویدئو است. سیستم در چند توالی ویدئو تست شده و خوب عمل کرده است. نمونه مجموعهی نتایج در این مقاله ارائه شده است. ایدههای ارائه شده در این سیستم در امنیت خودکار قابل اجرا هستند.
ترجمه مقدمه
تشخیص عمل انسان به موضوع مهمی در بصری کامپیوتر تبدیل شده است. یکی از بدیهیترین کاربردهای این فناوری در بحث امنیت است. در این مقاله، سیستمی برای تشخیص عمل انسان ارائه میکنیم که هدف آن کاربردهای امنیتی خودکار است. سیستم تشخیص عمل انسان به دو دلیل مهم در برنامههای امنیتی مفید است. اولین دلیل تشخیص ورود فرد غیرمجاز و نظارت بر اعمال اوست. دلیل دوم نظارت بر رفتار افرادی است که به حوزهای تعلق دارند. با تشخیص اعمال فرد و با استفاده از زمینه، رفتار فرد میتواند تعیین شود. برخی از رفتارها برای افراد خاص نامناسب هستند. برای مثال، فردی که بدون حضور فردی در اتاق از کامپیوتر او استفاده میکند یا اشیایی که اجازه ندارد را برمیدارد. توانایی ارتباط برقرار کردن بین اسامی با افراد حاضر در صحنه به دستیابی به هر دو هدف کمک میکند.سیستم توصیف شده در این مقاله عمل انسان را در محیطی تشخیص میدهد که دانش قبلی در دسترس است. سه سطح پایین تکنیکهای بصری کامپیوتر در سیستم ما استفاده میشوند. تکنیکها شامل تشخیص پوست، ردیابی و تشخیص تغییر صحنه هستند. هر سه روشاز تصاویر رنگی استفاده میکنند. سیستم ما قادر به شناخت اعمال افراد متعدد به طور همزمان در اتاق است.
این سیستم میتواند چند عمل را تشخیص دهد: ورود به صحنه، برداشتن تلفن، گذاشتن تلفن، استفاده از ترمینال کامپیوتر، ایستادن، نشستن، باز کردن چیزی، بستن چیزی، برداشتن شی (که قبلاً جالب تشخیص داده شده است)، پایین گذاشتن شیئی (که قبلا برداشته شده است)، خروج از صحنه و خروج از صحنه با شی. چند نمونه از این اعمال ماهیت نسبتاً عمومی دارند. اشیایی که فرد میتواند بردارد شامل کیف، تجهیزات کامپیوتر، و غیره هستند. اشیایی که میتوانند باز و بسته شوند شامل کابینت، محفظهی بالای سر، درها، و غیره هستند.
سیستم ما علاوه بر ایجاد توصیف متنی از اعمال تشخیص داده شده، توالی ویدئو را به مجموعههای کوچکتری از فریمهای کلیدی تبدیل میکند، که به صورت مختصر اعمال مهمی را که در اتاق رخ دادهاند توصیف میکنند. کاهش توالی ویدئو به مجموعهای از فریمهای کلیدی تحلیل بیشتر صحنه را توسط کامپیوترها یا انسانها تسهیل میکند (مانند تعیین نام شخصی که اعمال خاصی را انجام داده است). مزیت دیگر فریمهای کلیدی کاهش فضای لازم برای ذخیرهسازی و زمان لازم برای انتقال آنها است.
بقیهی مقاله در شش بخش سازماندهی شده است. بخش 2 مربوط به آثار مرتبط به این حوزه است. در بخش 3، در موردنقش دانش قبلی بحث در رویکرد خود بحث میکنیم. بخش 4 سیستم ما را توصیف میکند. در این بخش، ما سه سطح پایین تکنیکهای بصری کامپیوتر را توصیف میکنیم، روش سطح بالایی را که برای تشخیصاعمال استفاده میکنیم ارائه میکنیم و در مورد استراتژی تعیین فریمهای کلیدی ویدئو بحث میکنیم. تکنیکهای سطح پایین، تشخیص پوست، ردیابی و تشخیص تغییر صحنه هستند. همهی تکنیکهای سطح پایین از تصاویر رنگی استفاده میکنند و اطلاعات مفیدی برای تشخیص اعمال ارائه میکنند که بر اساس مدل دستگاه حالات محدود است. در این بخش، در مورد استراتژیهای تعیین فریمهای کلیدی توالیهای ویدئو هم بحث میکنیم. بخش 5 مربوط به نتایج تجربی هستند. ایدههای خود را در چند توالی ویدئو آزمایش کردهایم و خلاصهای از تحلیل خود ارائه میکنیم. در بخش 6، در مورد محدودیتهای سیستم خود صحبت میکنیم. سرانجام، در بخش 7، نتایج را ارائه میکنیم و پیشنهاداتی برای آثار آینده در این حوزه میدهیم.