Multi-Domain and Unsupervised Machine Learning for eCommerce Fraud Detection

Sapata, Tiago

Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/99226

Title:	Multi-Domain and Unsupervised Machine Learning for eCommerce Fraud Detection
Authors:	Sapata, Tiago
Orientador:	Ribeiro, Bernardete Martins Alegria, António Almeida, Miguel
Issue Date:	1-Jul-2016
Place of publication or event:	Coimbra
Abstract:	A globalização e o progresso tecnológico impulsionaram o aumento exponencial do acesso à internet nos últimos anos. O comércio eletrónico (eCommerce) seguiu a tendência, constantemente acompanhado por pagamentos fraudulentos, levando a perdas consideráveis nas receitas destes comerciantes. A Feedzai é uma empresa especializada em Machine Learning e Big Data que oferece soluções de prevenção de fraude em pagamentos. Uma destas soluções é um serviço baseado na Cloud especificamente para comércio eletrónico. Neste trabalho, utilizando dados históricos de comerciantes já existentes (chamado o domínio Source), são implementados dois algoritmos de Domain Adaptation, com o objectivo de melhorar a performance na deteção de fraude em pequenos ou novos comerciantes que não possuem pagamentos suficientes para treinar devidamente um modelo de ML. Adicionalmente, e com o mesmo objectivo, é explorado um algoritmo de deteção de outliers não supervisionado, não sendo necessário assim o recurso a dados históricos (do domínio Source) ou a dados anotados no domínio Target. Após teste com múltiplos e distintos datasets, conclui-se que ambos os algoritmos de Domain Adaptation não melhoram a performance na deteção de fraude. Por outro lado, considerando que apenas utiliza dados não anotados no domínio Target, o algoritmo não supervisionado apresenta uma performance considerável e apresenta-se como uma solução promissora para novos comerciantes no caso de uso de eCommerce apresentado. Globalization and technological progress led to exponential growth of internet access in the last decade. eCommerce followed the trend, constantly accompanied by payment fraud, costing merchants a substantial percentage of their revenue. Feedzai is a company specializing in Machine Learning (ML) and Big Data, providing solutions for fraud prevention in payments. One of Feedzai’s solutions is a Cloud-based SaaS for eCommerce merchants. In this work, using historical data from existing merchants (called Source domain), we implement two Domain Adaptation algorithms with the goal of improving fraud detection for small or new merchants (called Target domain), who typically have insufficient payment data to properly train a ML model. Furthermore, we explore an Unsupervised Learning outlier detection algorithm, which does not rely on historical or labeled data, with the same goal. Upon testing on multiple distinct datasets, obtained results demonstrate both Domain Adaptation algorithms fail to improve performance and actually decrease it. On the other hand, considering it only uses unlabeled data from the Target domain, the Unsupervised Learning method provides quite good performance and proves to be a promising solution for new merchants in the presented eCommerce use case.
Description:	Relatório Final de Estágio do Mestrado em Engenharia Informática apresentado à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI:	https://hdl.handle.net/10316/99226
Rights:	embargoedAccess
Appears in Collections:	FCTUC Eng.Informática - Teses de Mestrado

Files in This Item:

File	Description	Size	Format
Tese_TSapata.pdf		744.05 kB	Adobe PDF	View/Open

Show full item record

Page view(s)

132

checked on Oct 16, 2024

Download(s)

41

checked on Oct 16, 2024

Google Scholar^TM

Check

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM