Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/86531
DC FieldValueLanguage
dc.contributor.advisorAraújo, Helder de Jesus-
dc.contributor.authorMarques, Alexandre Azevedo-
dc.date.accessioned2019-04-17T22:26:09Z-
dc.date.available2019-04-17T22:26:09Z-
dc.date.issued2018-09-27-
dc.date.submitted2019-04-17-
dc.identifier.urihttps://hdl.handle.net/10316/86531-
dc.descriptionDissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractEste trabalho foi desenvoolvido no contexto de uma dissertação de mestrado do ramo de Automação e tem como objectivo explorar métodos baseados em "machine learning", capazes de estimar poses para objectos e implementar um método com a capacidade de gerar estimativas acerca de objectos variados, presentes num ambiente de trabalho monitorizado por um camera RGB-D (Kinect). O método de [Kehl et al., 2016] explora redes neuronais simples e convolucionais, com arquitecturas de "Auto-Encoder", para codificar amostras de imagens RGB-D em vectores de características e, de seguida, descodificá-los de volta nas amostras iniciais. Tirando partido destas redes "Auto-Encoders" em conjunto com imagens RGB-D de modelos sintéticos de objectos, onde é conhecido o seu "ground-truth", é gerado um registo de amostras codificadas, sob forma de vectores de características, associadas a transformações de corpo rígido. Uma imagem RGB-D do ambiente onde se encontram os objectos é segmentada em múltiplas amostras que são de seguida codificadas, utilizando as mesmas redes e comparadas ao registo criado, de forma a gerar votos acerca dos objectos presentes na imagem. Nesta dissertação tanto foi implementado o método de [Kehl et al., 2016] descrito como uma variante do mesmo, onde a etapa de comparação com o registo foi substituído por uma rede neuronal (Preditor), capaz de gerar votos de possíveis poses de objectos na imagem. Esta rede neuronal foi treinada tirando partido da informação existente nos registos criados.por
dc.description.abstractThis work was developed in the context of a master's thesis in the field of Automation and aims to explore methods based on machine learning, able to estimate poses for objects and implement a method with the ability to generate estimations about several objects, present in a work environment monitored by an RGB-D (Kinect) camera. [Kehl et al., 2016] method exploits simple and convolutional neural networks with "Auto-Encoder" architectures to encode RGB-D image samples into vectors of characteristics and then decode them back into the original samples. Taking advantage of these "Auto-Encoders" neural networks in association with RGB-D images of synthetic object models, where their ground-truth is known, a codebook is generated with coded samples in the form of vectors of characteristics associated with rigid body transformations An RGB-D image of the environment where the objects are located is segmented into multiple samples that are then encoded into vectors, using the same neural networks, and compared with the samples in the codebook in order to generate votes about the objects present in the image. In this dissertation the [Kehl et al., 2016] method described and a variant were implemented, where the stage of comparison with the codebook was replaced by a neural network (Predictor), capable of generating votes for possible object poses present in the image. This neural network was trained by taking advantage of existing information in the created codebooks.eng
dc.language.isopor-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectaprendizagem automáticapor
dc.subjectRede Neuronalpor
dc.subjectObjectospor
dc.subjectPosepor
dc.subjectEstimativapor
dc.subjectmachine learningeng
dc.subjectNeural Networkeng
dc.subjectObjecteng
dc.subjectPoseeng
dc.subjectEstimationeng
dc.titleEstimação da pose de objectos em imagens RGB-D utilizando aprendizagem automáticapor
dc.title.alternativeA machine learning approach for Object Pose estimation in RGB-D images.eng
dc.typemasterThesis-
degois.publication.locationDEEC-
degois.publication.titleEstimação da pose de objectos em imagens RGB-D utilizando aprendizagem automáticapor
dc.peerreviewedyes-
dc.identifier.tid202218783-
thesis.degree.disciplineEngenharia Electrotécnica e de Computadores-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado Integrado em Engenharia Electrotécnica e de Computadores-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores-
uc.degree.grantorID0500-
uc.contributor.authorMarques, Alexandre Azevedo::0000-0001-8134-841X-
uc.degree.classification17-
uc.degree.presidentejuriBatista, Jorge Manuel Moreira de Campos Pereira-
uc.degree.elementojuriAraújo, Hélder de Jesus-
uc.degree.elementojuriPeixoto, Paulo José Monteiro-
uc.contributor.advisorAraújo, Hélder de Jesus-
uc.controloAutoridadeSim-
item.grantfulltextopen-
item.fulltextCom Texto completo-
item.openairetypemasterThesis-
item.languageiso639-1pt-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
crisitem.advisor.researchunitISR - Institute of Systems and Robotics-
crisitem.advisor.parentresearchunitUniversity of Coimbra-
crisitem.advisor.orcid0000-0002-9544-424X-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
Alexandre Marques Tese.pdf12.19 MBAdobe PDFView/Open
Show simple item record

Page view(s) 50

411
checked on Apr 23, 2024

Download(s) 50

389
checked on Apr 23, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons