Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/86558
Title: Movement, Pedestrian and Face Detection Based on Optical Flow for Surveillance Robot
Other Titles: Detecção de Movimento, Pedestres e Faces Baseada no Fluxo Óptico para Robô de Vigilância
Authors: Mendes, Paulo Armando da Silva 
Orientador: Coimbra, António Paulo Mendes Breda Dias
Mendes, Mateus Daniel Almeida
Keywords: Visão por Computador; Detecção de Movimento; Fluxo Óptico; Detecção de Movimento; Detecção Facial; Computer Vision; Movement Detection; Optical Flow; Pedestrian Detection; Face Detection
Issue Date: 24-Sep-2018
Serial title, monograph or event: Movement, Pedestrian and Face Detection Based on Optical Flow for Surveillance Robot
Place of publication or event: DEEC
Abstract: Este trabalho foi motivado pelo desenvolvimento de um robô autónomo vigilante que usa visãopor computador. O enquadramento desta dissertação de mestrado é explorar algoritmos de detecção de objectos em movimento, detecção de pedestres e a detecção facial dos pedestres. A presente tese contém duas partes principais, a detecção de movimento apenas e a detecção de movimento, pedestres e faces.Esta dissertação propõe a combinação de algoritmos para a detecção de movimento, humanos e faces através de visão por computador. A detecção de movimento utiliza três imagens consecutivas a cores. Cada imagem é convertida para escala de cinzentos e depois filtrada através de um filtro Gaussiano. Da imagem em escala de cinzentos filtrada é calculado o fluxo óptico, aplicando o método de Gunnar Farneback. O fluxo óptico calculado para cada dois frames consecutivos é combinado, resultando no fluxo óptico na direcção horizontal e vertical. O próximo passo é a normalização do fluxo óptico horizontal e vertical. O fluxo óptico normalizado é depois equalizado. Neste ponto, o fluxo óptico equalizado é uma imagem em escala de cinzentos que representa movimento. A imagem da representação de movimento em escala de cinzentos é binarizada através do método de threshold adaptativo de Otsu. Assim, diferenciando zonas de movimento de zonas onde não ocorre movimento. Para distinguir os objectos em movimento, é aplicado um método de contornos para calcular cada contorno de movimento da imagem binarizada. A detecção de pedestres é baseada no bem conhecido método de histograma de gradientes orientados (HOG, do inglês: Histograms of Oriented Gradients) com máquina de vectores de suporte (SVM, do inglês: Support Vector Machine) para classificação. A detecção facial é baseada na detecção de objectos de Viola e Jones e implica a imagem integral, Haar-like features e a cascata de classificadores AdaBoost. De forma a optimizar a performance é sempre seleccionada uma sub-região mais pequena do que a imagem original, para detectar pedestres e as suas faces. A sub-região é seleccionada através da detecção de movimento através de fluxo óptico. O contributo de inovação do trabalho desenvolvido é um algoritmo capaz de detectar objectos em movimento com precisão e com capacidade de diferenciar objectos em movimento distintos no mesmo conjunto de imagens pelo qual é estimado o movimento, utilizando o fluxo óptico.Com o algoritmo desenvolvido (detecção de movimento, pedestres e faces), é possível seleccionar directamente a sub-região da imagem para aplicar a detecção de pedestres e faces. A capacidade da selecção da sub-região resulta numa grande optimização para a detecção (pedestres e faces). Reduzindo a área de detecção, os falsos positivos são eliminados e a velocidade de detecção é aumentada, devido à redução de área para calcular/examinar.
This work was motivated to develop an autonomous surveillance robot using computer vision.The context of this master thesis is to explore algorithms of moving objects detection, the detection of pedestrians and the pedestrians face detection. The present work has two main parts, movement detection alone and combined detection of movement, pedestrians and faces.This dissertation proposes the combination of algorithms to detect movement, humans and human faces using computer vision. The movement detection uses three consecutive RGB image frames. Each image is converted to gray scale and after it is filtered using a Gaussian filter. From the filtered gray scale images is calculated the dense optical flow, applying Gunnar Farneback's method. The calculated optical flow from each two consecutive frames is combined, resulting the horizontal and vertical direction optical flow. The next step is to normalize horizontal and vertical optical flow. The normalized optical flow is then equalized. At this point, the equalized optical flow is a gray scale image that represents movement. That gray scale movement image representation is binarized using Otsu's adaptive threshold method, thus, differentiating movement zones from non-movement zones. To distinguish between moving objects, it is applied a contour method to calculate each movement contour from the binarized image. The human detection is based in the well known "Histograms of Oriented Gradients" (HOG) method with Support Vector Machine (SVM) classification. The face detection follows Viola and Jones objectdetection method and implies the integral image, Haar-like features and AdaBoost cascade classifier. To optimize the performance, it is always selected smaller sub-regions of the original image to detect pedestrians and faces. The sub-region is selected by means of the movement detected using optical flow.The developed work innovative contribution is an algorithm capable of detecting moving objects accurately and capable of differentiating distinct moving objects, in the same set of images where is estimated movement, using optical flow.With the developed algorithm (movement, pedestrian and face detection), it is possible to directly select a sub-region of the image to make the pedestrian and face detection. The subregion selection capability brings great optimizations to the detection (pedestrian and face). By decreasing the detection area, false positives are eliminated and the detection time is decreased, due to the reduction of the image area examined/computed.
Description: Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia
URI: https://hdl.handle.net/10316/86558
Rights: openAccess
Appears in Collections:UC - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat
Dissertation_PM_2013171215.pdf13.27 MBAdobe PDFView/Open
Show full item record

Page view(s) 50

417
checked on Mar 26, 2024

Download(s) 50

492
checked on Mar 26, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons