Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/83562
DC FieldValueLanguage
dc.contributor.advisorAraújo, Filipe João Boavida Mendonça Machado de-
dc.contributor.advisorPaiva, Rui Pedro Pinto de Carvalho e-
dc.contributor.authorLopes, Bruno Leonel André-
dc.date.accessioned2019-01-04T22:26:53Z-
dc.date.available2019-01-04T22:26:53Z-
dc.date.issued2018-09-10-
dc.date.submitted2019-01-22-
dc.identifier.urihttps://hdl.handle.net/10316/83562-
dc.descriptionDissertação de Mestrado em Engenharia Informática apresentada à Faculdade de Ciências e Tecnologia-
dc.description.abstractCom o surgimento de Big Data, a escassez de data scientists para analisar todos os dados produzidos em diferentes domínios tornou-se evidente. Para treinar novos data scientists e para fazer experiências mais rápidamente, aplicações web que providenciem boas práticas de data science e que não requeiram experiência em programação, podem ser uma grande ajuda.Contudo, algumas aplicações web não aplicam bem as boas práticas de data mining, especialmente na avaliação e seleção de modelos. Assim sendo, nesta dissertação iremos descrever um sistema, atualmente em desenvolvimento, que permitirá a criação de worflows com especial ênfase nas boas práticas de data mining. Os desafios tecnológicos principais abordados nesta tese, foram a adoção do Netflix Conductor para a orquestração de microservices; desenvolvimento da biblioteca Condu, que facilita a comunicação com o Conductor escrita em Python; e a construção de uma interface gráfica para o utilizador. Testes de usabilidade foram feitos com dois grupos de utilizadores para avaliar o nosso conceito de criação de processos de data mining. Nestes testes foram alcançados altos níveis de satisfação por parte dos utilizadores .por
dc.description.abstractWith the emergence of Big Data, the scarcity of data scientists to analyse all the data being produced in different domains became evident. To train new data scientists and make experiments with data faster, web applications providing good data science practices without requiring programming skills can be a great help. However, some available web applications lack in providing good data mining practices, specially for the assessment and selection of models. Thus, in this dissertation we describe a system, currently under development, that will allow the construction of data mining workflows enforcing good data mining practices. The main technical challenges addressed in this thesis were the adoption of Netflix Conductor to orchestrate the microservices; the development of Condu, a Python utility library to interface with Conductor; and the construction of the graphical user interface.Usability tests, were conducted with two groups of users to evaluate the envisioned concept for the creation of data mining processes. In these tests we observed a general high level of user satisfaction .eng
dc.description.sponsorshipOutro - This thesis was carried out by the candidate Bruno Lopes, under the project PTDC/EEI-ESS/1189/2014 — Data Science for Non-Programmers, supported by COMPETE 2020, Portugal 2020-POCI, UE-FEDER and FCT.-
dc.language.isoeng-
dc.rightsopenAccess-
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/-
dc.subjectData Sciencepor
dc.subjectData Miningpor
dc.subjectMicroservicespor
dc.subjectOrchestrationpor
dc.subjectWorkflowspor
dc.subjectData Scienceeng
dc.subjectData Miningeng
dc.subjectMicroserviceseng
dc.subjectOrchestrationeng
dc.subjectWorkflowseng
dc.titleData Science for Non-Programmers: Orchestration of Microservices and Graphical User Interfaceeng
dc.title.alternativeData Science para não-programadores: Orquestração de Microserviços e Interface Gráficapor
dc.typemasterThesis-
degois.publication.locationDEI-FCTUC-
degois.publication.titleData Science for Non-Programmers: Orchestration of Microservices and Graphical User Interfaceeng
dc.peerreviewedyes-
dc.identifier.tid202129551-
thesis.degree.disciplineInformática-
thesis.degree.grantorUniversidade de Coimbra-
thesis.degree.level1-
thesis.degree.nameMestrado em Engenharia Informática-
uc.degree.grantorUnitFaculdade de Ciências e Tecnologia - Departamento de Engenharia Informática-
uc.degree.grantorID0500-
uc.contributor.authorLopes, Bruno Leonel André::0000-0001-7638-8601-
uc.degree.classification17-
uc.degree.presidentejuriRela, Mário Alberto da Costa Zenha-
uc.degree.elementojuriRocha, Álvaro Manuel Reis da-
uc.degree.elementojuriPaiva, Rui Pedro Pinto de Carvalho e-
uc.contributor.advisorAraújo, Filipe João Boavida Mendonça Machado de-
uc.contributor.advisorPaiva, Rui Pedro Pinto de Carvalho e::0000-0003-3215-3960-
uc.controloAutoridadeSim-
item.grantfulltextopen-
item.fulltextCom Texto completo-
item.openairetypemasterThesis-
item.languageiso639-1en-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
item.cerifentitytypePublications-
crisitem.advisor.researchunitCISUC - Centre for Informatics and Systems of the University of Coimbra-
crisitem.advisor.researchunitCISUC - Centre for Informatics and Systems of the University of Coimbra-
crisitem.advisor.parentresearchunitFaculty of Sciences and Technology-
crisitem.advisor.parentresearchunitFaculty of Sciences and Technology-
crisitem.advisor.orcid0000-0002-1663-1937-
crisitem.advisor.orcid0000-0003-3215-3960-
Appears in Collections:UC - Dissertações de Mestrado
Files in This Item:
File Description SizeFormat
DS4NP_REPORT_BRUNO_LOPES.pdf3.38 MBAdobe PDFView/Open
Show simple item record

Page view(s) 50

581
checked on Apr 23, 2024

Download(s) 50

814
checked on Apr 23, 2024

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons