Multi-Domain and Unsupervised Machine Learning for eCommerce Fraud Detection

Sapata, Tiago

Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/99226

Título:	Multi-Domain and Unsupervised Machine Learning for eCommerce Fraud Detection
Autor:	Sapata, Tiago
Orientador:	Ribeiro, Bernardete Martins Alegria, António Almeida, Miguel
Data:	1-Jul-2016
Local de edição ou do evento:	Coimbra
Resumo:	A globalização e o progresso tecnológico impulsionaram o aumento exponencial do acesso à internet nos últimos anos. O comércio eletrónico (eCommerce) seguiu a tendência, constantemente acompanhado por pagamentos fraudulentos, levando a perdas consideráveis nas receitas destes comerciantes. A Feedzai é uma empresa especializada em Machine Learning e Big Data que oferece soluções de prevenção de fraude em pagamentos. Uma destas soluções é um serviço baseado na Cloud especificamente para comércio eletrónico. Neste trabalho, utilizando dados históricos de comerciantes já existentes (chamado o domínio Source), são implementados dois algoritmos de Domain Adaptation, com o objectivo de melhorar a performance na deteção de fraude em pequenos ou novos comerciantes que não possuem pagamentos suficientes para treinar devidamente um modelo de ML. Adicionalmente, e com o mesmo objectivo, é explorado um algoritmo de deteção de outliers não supervisionado, não sendo necessário assim o recurso a dados históricos (do domínio Source) ou a dados anotados no domínio Target. Após teste com múltiplos e distintos datasets, conclui-se que ambos os algoritmos de Domain Adaptation não melhoram a performance na deteção de fraude. Por outro lado, considerando que apenas utiliza dados não anotados no domínio Target, o algoritmo não supervisionado apresenta uma performance considerável e apresenta-se como uma solução promissora para novos comerciantes no caso de uso de eCommerce apresentado. Globalization and technological progress led to exponential growth of internet access in the last decade. eCommerce followed the trend, constantly accompanied by payment fraud, costing merchants a substantial percentage of their revenue. Feedzai is a company specializing in Machine Learning (ML) and Big Data, providing solutions for fraud prevention in payments. One of Feedzai’s solutions is a Cloud-based SaaS for eCommerce merchants. In this work, using historical data from existing merchants (called Source domain), we implement two Domain Adaptation algorithms with the goal of improving fraud detection for small or new merchants (called Target domain), who typically have insufficient payment data to properly train a ML model. Furthermore, we explore an Unsupervised Learning outlier detection algorithm, which does not rely on historical or labeled data, with the same goal. Upon testing on multiple distinct datasets, obtained results demonstrate both Domain Adaptation algorithms fail to improve performance and actually decrease it. On the other hand, considering it only uses unlabeled data from the Target domain, the Unsupervised Learning method provides quite good performance and proves to be a promising solution for new merchants in the presented eCommerce use case.
Descrição:	Relatório Final de Estágio do Mestrado em Engenharia Informática apresentado à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI:	https://hdl.handle.net/10316/99226
Direitos:	embargoedAccess
Aparece nas coleções:	FCTUC Eng.Informática - Teses de Mestrado

Ficheiros deste registo:

Ficheiro	Descrição	Tamanho	Formato
Tese_TSapata.pdf		744.05 kB	Adobe PDF	Ver/Abrir

Mostrar registo em formato completo

Visualizações de página

111

Visto em 17/jul/2024

Downloads

32

Visto em 17/jul/2024

Google Scholar^TM

Verificar

Ficheiros deste registo:

Visualizações de página

Downloads

Google ScholarTM

Google Scholar^TM