Estimação da pose de objectos em imagens RGB-D utilizando aprendizagem automática

Marques, Alexandre Azevedo

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/86531

DC Field	Value	Language
dc.contributor.advisor	Araújo, Helder de Jesus	-
dc.contributor.author	Marques, Alexandre Azevedo	-
dc.date.accessioned	2019-04-17T22:26:09Z	-
dc.date.available	2019-04-17T22:26:09Z	-
dc.date.issued	2018-09-27	-
dc.date.submitted	2019-04-17	-
dc.identifier.uri	https://hdl.handle.net/10316/86531	-
dc.description	Dissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia	-
dc.description.abstract	Este trabalho foi desenvoolvido no contexto de uma dissertação de mestrado do ramo de Automação e tem como objectivo explorar métodos baseados em "machine learning", capazes de estimar poses para objectos e implementar um método com a capacidade de gerar estimativas acerca de objectos variados, presentes num ambiente de trabalho monitorizado por um camera RGB-D (Kinect). O método de [Kehl et al., 2016] explora redes neuronais simples e convolucionais, com arquitecturas de "Auto-Encoder", para codificar amostras de imagens RGB-D em vectores de características e, de seguida, descodificá-los de volta nas amostras iniciais. Tirando partido destas redes "Auto-Encoders" em conjunto com imagens RGB-D de modelos sintéticos de objectos, onde é conhecido o seu "ground-truth", é gerado um registo de amostras codificadas, sob forma de vectores de características, associadas a transformações de corpo rígido. Uma imagem RGB-D do ambiente onde se encontram os objectos é segmentada em múltiplas amostras que são de seguida codificadas, utilizando as mesmas redes e comparadas ao registo criado, de forma a gerar votos acerca dos objectos presentes na imagem. Nesta dissertação tanto foi implementado o método de [Kehl et al., 2016] descrito como uma variante do mesmo, onde a etapa de comparação com o registo foi substituído por uma rede neuronal (Preditor), capaz de gerar votos de possíveis poses de objectos na imagem. Esta rede neuronal foi treinada tirando partido da informação existente nos registos criados.	por
dc.description.abstract	This work was developed in the context of a master's thesis in the field of Automation and aims to explore methods based on machine learning, able to estimate poses for objects and implement a method with the ability to generate estimations about several objects, present in a work environment monitored by an RGB-D (Kinect) camera. [Kehl et al., 2016] method exploits simple and convolutional neural networks with "Auto-Encoder" architectures to encode RGB-D image samples into vectors of characteristics and then decode them back into the original samples. Taking advantage of these "Auto-Encoders" neural networks in association with RGB-D images of synthetic object models, where their ground-truth is known, a codebook is generated with coded samples in the form of vectors of characteristics associated with rigid body transformations An RGB-D image of the environment where the objects are located is segmented into multiple samples that are then encoded into vectors, using the same neural networks, and compared with the samples in the codebook in order to generate votes about the objects present in the image. In this dissertation the [Kehl et al., 2016] method described and a variant were implemented, where the stage of comparison with the codebook was replaced by a neural network (Predictor), capable of generating votes for possible object poses present in the image. This neural network was trained by taking advantage of existing information in the created codebooks.	eng
dc.language.iso	por	-
dc.rights	openAccess	-
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	-
dc.subject	aprendizagem automática	por
dc.subject	Rede Neuronal	por
dc.subject	Objectos	por
dc.subject	Pose	por
dc.subject	Estimativa	por
dc.subject	machine learning	eng
dc.subject	Neural Network	eng
dc.subject	Object	eng
dc.subject	Pose	eng
dc.subject	Estimation	eng
dc.title	Estimação da pose de objectos em imagens RGB-D utilizando aprendizagem automática	por
dc.title.alternative	A machine learning approach for Object Pose estimation in RGB-D images.	eng
dc.type	masterThesis	-
degois.publication.location	DEEC	-
degois.publication.title	Estimação da pose de objectos em imagens RGB-D utilizando aprendizagem automática	por
dc.peerreviewed	yes	-
dc.identifier.tid	202218783	-
thesis.degree.discipline	Engenharia Electrotécnica e de Computadores	-
thesis.degree.grantor	Universidade de Coimbra	-
thesis.degree.level	1	-
thesis.degree.name	Mestrado Integrado em Engenharia Electrotécnica e de Computadores	-
uc.degree.grantorUnit	Faculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores	-
uc.degree.grantorID	0500	-
uc.contributor.author	Marques, Alexandre Azevedo::0000-0001-8134-841X	-
uc.degree.classification	17	-
uc.degree.presidentejuri	Batista, Jorge Manuel Moreira de Campos Pereira	-
uc.degree.elementojuri	Araújo, Hélder de Jesus	-
uc.degree.elementojuri	Peixoto, Paulo José Monteiro	-
uc.contributor.advisor	Araújo, Hélder de Jesus	-
uc.controloAutoridade	Sim	-
item.grantfulltext	open	-
item.fulltext	Com Texto completo	-
item.openairetype	masterThesis	-
item.languageiso639-1	pt	-
item.openairecristype	http://purl.org/coar/resource_type/c_18cf	-
item.cerifentitytype	Publications	-
crisitem.advisor.researchunit	ISR - Institute of Systems and Robotics	-
crisitem.advisor.parentresearchunit	University of Coimbra	-
crisitem.advisor.orcid	0000-0002-9544-424X	-
Appears in Collections:	UC - Dissertações de Mestrado

Files in This Item:

File	Description	Size	Format
Alexandre Marques Tese.pdf		12.19 MB	Adobe PDF	View/Open

Show simple item record

Page view(s) 50

411

checked on Apr 23, 2024

Download(s) 50

389

checked on Apr 23, 2024

Google Scholar^TM

Check

This item is licensed under a Creative Commons License

Files in This Item:

Page view(s) 50

Download(s) 50

Google ScholarTM

Google Scholar^TM