Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/96141
DC FieldValueLanguage
dc.contributor.advisorAraújo, Hélder de Jesus-
dc.contributor.authorLourenço, Francisco Rodrigues-
dc.date.accessioned2021-10-25T22:06:24Z-
dc.date.available2021-10-25T22:06:24Z-
dc.date.issued2021-07-26-
dc.date.submitted2021-10-25-
dc.identifier.urihttps://hdl.handle.net/10316/96141-
dc.descriptionDissertação de Mestrado Integrado em Engenharia Electrotécnica e de Computadores apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractA estimativa da pose de objetos em imagens RGB-D, tem ganho bastante atenção na passada década com o aparecimento de sensores RGB-D ao nível do consumidor. O seu baixo custo acoplado com relevantes especificações técnicas, levaram à sua aplicação em áreas cientificas tais como condução autónoma, realidade aumentada e robótica.Em geral, a informação de profundidade trouxe complexidade adicional a grande parte das aplicações práticas onde se usavam apenas imagens RGB. Para além disso, quando se tenta estimar a pose de um objeto, há outros desafios tais como cenas com vários objetos, oclusão por parte dos mesmos, objetos simétricos, objetos sem textura e até falta de visibilidade devido a pouca iluminação. Tendo isto em conta, os investigadores começaram a adoptar técnicas de aprendizagem automática para resolver o problema da estimação da pose de objetos. O problema com esta abordagem é que, por norma, costuma ser computacionalmente intensiva e complexa de implementar. Para além disso, apenas recentemente a investigação se tem direcionado para vídeos RGB-D, com o primeiro dataset de referência contendo apenas vídeos a ser publicado em 2017. Portanto, apenas poucos e bastante recentes métodos foram desenvolvidos para funcionar com vídeos, tornando assim o funcionamento em tempo real numa questão ainda por resolver.Posto isto, esta tese tem como objectivo explorar todas as ferramentas necessárias para construir um estimador da pose, oferecer uma revisão compreensiva para cada uma destas ferramentas, comparar e avalia-las, estudar como estas podem ser implementadas, avaliar se a estimação da pose poderá ser ou não feita em tempo real e também como esta se generaliza para o mundo real. Em adição a isto, será proposto o uso de estatística direcional para o avaliação da repetibilidade de sensores RGB-D, um melhoramento na estrutura de um bastante conhecido estimador da pose, uma arquitetura que utiliza um algoritmo de aproximação geométrica bastante recente como auxílio ao estimador da pose, e ainda uma métrica que permite avaliar a repetibilidade tanto das poses estimadas como das poses fundamentais de um dataset.por
dc.description.abstractObject pose estimation using RGB-D images has gained increasing attention in the past decade with the emergence of consumer-level RGB-D sensors in the market. Their low-cost coupled with relevant technical specifications led to their application in areas such as autonomous driving, augmented reality, and robotics.Depth information has, in general, brought additional complexity to most applications that previously used only RGB images. Moreover, when trying to estimate an object pose, one may face challenges such as cluttered scenes, occlusion, symmetric objects, texture-less objects, and low visibility due to insufficient illumination. Accordingly, researchers started to adopt machine learning approaches to tackle the 6DoF of the object pose estimation problem. Such approaches are often quite complex to implement and computationally demanding. Furthermore, the research was only directed to RGB-D videos quite recently, with the first benchmark dataset containing videos being published only in 2017. Therefore, only very recent methods were designed to process videos, and some questions regarding real-time applicability arise.That being said, this thesis aims to explore all the tools required to build a 6DoF pose estimator, provide a comprehensive review on each tool, compare and evaluate them, assess how a practitioner can implement such tools, evaluate whether or not it is possible to estimate 6DoF poses in real-time, and also evaluate how these tools generalize to a real-world scenario. As a plus, it will be proposed the usage of directional statistics to evaluate an RGB-D sensor precision, a tweak to a famous 6DoF object pose estimation model, a pipeline that uses a novel 3D point cloud registration algorithm to aid the pose estimator, and a metric that can measure the precision/repeatability of both estimated poses of a model and the ground-truth poses of a dataset.eng
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectEstimação da pose de objetospor
dc.subjectAproximação Geométricapor
dc.subjectVisão por Computadorpor
dc.subjectAprendizagem Automáticapor
dc.subjectSensores RGB-Dpor
dc.subject6DoF Object Pose Estimationeng
dc.subject3D Point Cloud Registrationeng
dc.subjectComputer Visioneng
dc.subjectMachine Learningeng
dc.subjectRGB-D Sensorseng
dc.title6DoF Object Pose Estimation from RGB-D Images Using Machine Learning Approacheseng
dc.title.alternativeEstimação da Pose de Objetos a partir de Imagens RGB-D Usando Aprendizagem Automáticapor
dc.typemasterThesis-
degois.publication.locationCoimbra-
degois.publication.title6DoF Object Pose Estimation from RGB-D Images Using Machine Learning Approacheseng
dc.peerreviewedyes-
dc.identifier.tid202777600-
thesis.degree.disciplineEngenharia Electrotécnica e de Computadores-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado Integrado em Engenharia Electrotécnica e de Computadores-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Eng. Electrotécnica e de Computadores-
uc.degree.grantorID0500-
uc.contributor.authorLourenço, Francisco Rodrigues::0000-0001-7081-5641-
uc.degree.classification19-
uc.degree.presidentejuriBatista, Jorge Manuel Moreira de Campos Pereira-
uc.degree.elementojuriAraújo, Hélder de Jesus-
uc.degree.elementojuriBarreto, João Pedro de Almeida-
uc.contributor.advisorAraújo, Hélder de Jesus-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.openairetypemasterThesis-
item.cerifentitytypePublications-
item.grantfulltextopen-
item.fulltextCom Texto completo-
item.languageiso639-1en-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
TESE_MESTRADO_Francisco_Lourenco.pdf9.54 MBAdobe PDFView/Open
Show simple item record

Page view(s)

98
checked on Apr 24, 2024

Download(s)

629
checked on Apr 24, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons