عنوان مقاله فارسی: شبکه عصبی عمیق برای پیشبینی ساختاری و تشخیص خط در صحنه ترافیک
عنوان مقاله لاتین: Deep Neural Network for Structural Prediction and Lane Detection in Traffic Scene
نویسندگان: Jun Li; Xue Mei; Danil Prokhorov; Dacheng Tao
تعداد صفحات: 13
سال انتشار: 2017
زبان: لاتین
Abstract:
Hierarchical neural networks have been shown to be effective in learning representative image features and recognizing object classes. However, most existing networks combine the low/middle level cues for classification without accounting for any spatial structures. For applications such as understanding a scene, how the visual cues are spatially distributed in an image becomes essential for successful analysis. This paper extends the framework of deep neural networks by accounting for the structural cues in the visual signals. In particular, two kinds of neural networks have been proposed. First, we develop a multitask deep convolutional network, which simultaneously detects the presence of the target and the geometric attributes (location and orientation) of the target with respect to the region of interest. Second, a recurrent neuron layer is adopted for structured visual detection. The recurrent neurons can deal with the spatial distribution of visible cues belonging to an object whose shape or structure is difficult to explicitly define. Both the networks are demonstrated by the practical task of detecting lane boundaries in traffic scenes. The multitask convolutional neural network provides auxiliary geometric information to help the subsequent modeling of the given lane structures. The recurrent neural network automatically detects lane boundaries, including those areas containing no marks, without any explicit prior knowledge or secondary modeling.
نشانداده شدهاست که شبکههای عصبی سلسله مراتبی در یادگیری ویژگیهای تصویر نماینده و تشخیص کلاسهای شی موثر هستند. با این حال، اکثر شبکههای موجود نشانههای سطح پایین / متوسط را برای طبقهبندی بدون در نظر گرفتن هر گونه ساختار فضایی ترکیب میکنند. برای کاربردهایی مانند درک یک صحنه، چگونگی توزیع فضایی نشانههای بصری در یک تصویر برای تجزیه و تحلیل موفق ضروری میشود. این مقاله چارچوب شبکههای عصبی عمیق را با محاسبه نشانههای ساختاری در سیگنالهای بصری گسترش میدهد. به طور خاص، دو نوع شبکه عصبی پیشنهاد شدهاست. ابتدا، ما یک شبکه کانولوشن عمیق چندوظیفه ای را توسعه میدهیم که به طور همزمان حضور هدف و ویژگیهای هندسی (موقعیت و جهت)هدف را با توجه به منطقه مورد نظر شناسایی میکند. دوم، یک لایه نورونی عود کننده برای تشخیص بصری ساختار یافته اتخاذ میشود. نورونهای بازگشتی میتوانند با توزیع فضایی نشانههای قابلمشاهده متعلق به یک شی که شکل یا ساختار آن به سختی تعریف میشود، سر و کار داشته باشند. هر دو شبکه توسط وظیفه عملی تشخیص مرزهای خط در صحنههای ترافیک نشان داده میشوند. شبکه عصبی کانولوشن چندوظیفه، اطلاعات هندسی کمکی را برای کمک به مدلسازی بعدی ساختارهای خط دادهشده فراهم میکند. شبکه عصبی بازگشتی به طور خودکار مرزهای خط را شناسایی میکند، از جمله آن نواحی که هیچ علامتی ندارند، بدون هیچ دانش قبلی صریح یا مدلسازی ثانویه.
deep neural network for structural prediction and lane detection in traffic scene_1619878178_48085_4145_1481.zip4.06 MB |