Cartões de Crédito: nova técnica usando machine-learning promete reduzir quantidade de fraudes

Os pesquisadores do MIT empregaram uma nova técnica de machine learning (aprendizado de máquina) para reduzir substancialmente os falsos positivos nas tecnologias de detecção de fraude.

O modelo extrai padrões comportamentais granulares dos dados da transação para sinalizar com mais precisão a atividade suspeita.

Você já usou seu cartão de crédito em uma nova loja ou local e por isso ele foi  recusado? Alguma venda já foi bloqueada porque você usou uma quantia maior do que o habitual?

Os cartões de crédito dos consumidores são recusados ​​surpreendentemente com frequência em transações legítimas. Uma das causas é que as tecnologias de detecção de fraude usadas pelo banco do cliente sinalizaram incorretamente a venda como suspeita. Agora, os pesquisadores do MIT (Instituto de Tecnologia de Massachusetts) empregaram uma nova técnica de machine learning  para reduzir drasticamente esses falsos positivos, economizando dinheiro dos bancos e reduzindo a frustração do cliente.

O uso do machine learning para detectar fraudes financeiras nos remonta ao início dos anos de 1990 e que avançou ao longo dos anos. Pesquisadores treinam modelos para extrair padrões comportamentais de transações passadas, chamadas “características”, que sinalizam fraudes. Quando você passa o cartão, o cartão exibe o modelo e, se os recursos corresponderem ao comportamento fraudulento, a venda será bloqueada.

Nos bastidores, no entanto, os cientistas de dados trabalham constantemente com esses recursos, que se concentram principalmente em regras gerais de quantidade e localização. Se um determinado cliente gastar mais do que, digamos, US $ 2.000 em uma compra ou fizer várias compras no mesmo dia, ele poderá ser identificado. Mas como os hábitos de consumo variam, mesmo em contas individuais, esses modelos são imprecisos: um relatório de 2015 da Javelin Strategy and Research estima que apenas uma em cada cinco previsões de fraude está correta e que os erros podem custar US $ 118 bilhões em receita perdida como clientes recusados, ou impedidos de usar o cartão de crédito.

Engenharia automatizada de recursos

Os pesquisadores do MIT desenvolveram uma abordagem de “engenharia automatizada de recursos” que extrai mais de 200 recursos detalhados para cada transação individual por exemplo, se um usuário estava presente durante as compras e o valor médio gasto em determinados dias em determinados fornecedores. Ao fazer isso, ele pode identificar melhor quando os hábitos de gastos de um determinado proprietário de cartão se desviam da norma.

Pesquisador do MIT, Kalyan Veeramachaneni
Foto: David Sella

Testado em um conjunto de dados de 1,8 milhão de transações de um grande banco, o modelo reduziu os resultados positivos falsos em 54% em relação aos modelos tradicionais, que os pesquisadores estimam ter economizado 190.000 euros para o banco em perda de receita.

“O grande desafio nessa indústria são falsos positivos”, diz Kalyan Veeramachaneni, principal pesquisador do Laboratório de Sistemas de Informação e Decisão do MIT (LIDS) e co-autor de um artigo descrevendo o modelo, apresentado na recente Conferência Européia. para Machine Learning. “Podemos dizer que há uma conexão direta entre engenharia de recursos e [redução] de falsos positivos. … Essa é a coisa mais impactante para melhorar a precisão desses modelos de aprendizado de máquina.

Os co-autores do artigo são: o autor principal, Roy Wedge , ex-pesquisador do Data to AI Lab da LIDS; James Max Kanter, SM ; e Santiago Moral Rubio e Sergio Iglesias Perez do Banco Bilbao Vizcaya Argentaria.

Extraindo recursos “profundos”

Três anos atrás, Veeramachaneni e Kanter desenvolveram o Deep Feature Synthesis (DFS), uma abordagem automatizada que extrai recursos altamente detalhados de qualquer dado, e decidiu aplicá-lo a transações financeiras.

As empresas às vezes criam competições (hackathons) em que fornecem um conjunto de dados limitado junto com um problema de previsão, como fraude. Os cientistas de dados desenvolvem modelos de previsão e um prêmio em dinheiro vai para o modelo mais preciso. Os pesquisadores participaram de uma competição e alcançaram as melhores pontuações com o DFS.

No entanto, eles perceberam que a abordagem poderia atingir seu pleno potencial se treinada em várias fontes de dados brutos. “Se você analisar quais dados as empresas lançam, é uma pequena fatia do que eles realmente têm”, diz Veeramachaneni. “Nossa pergunta era: ‘Como podemos adotar essa abordagem para negócios reais?

Apoiado pelo programa Descoberta de Modelos baseado em dados da Agência de Projetos de Pesquisa Avançada de Defesa, Kanter e sua equipe no Feature Labs um spinout que comercializa a tecnologia desenvolveram uma biblioteca de código aberto para extração automatizada de recursos, chamada Featuretools, usada nesta pesquisa. .

Os pesquisadores obtiveram um conjunto de dados de três anos fornecido por um banco internacional, que incluiu informações granulares sobre o valor da transação, horários, locais, tipos de fornecedores e terminais utilizados. Continha cerca de 900 milhões de transações de cerca de 7 milhões de cartões individuais. Dessas transações, cerca de 122.000 foram confirmadas como fraude. Os pesquisadores treinaram e testaram seu modelo em subconjuntos desses dados.

No treinamento, o modelo procura padrões de transações e entre cartões que correspondem a casos de fraude. Em seguida, ele combina automaticamente todas as diferentes variáveis ​​que encontra em recursos “profundos” que fornecem uma visão altamente detalhada de cada transação. A partir do conjunto de dados, o modelo DFS extraiu 237 recursos para cada transação. Aqueles representam variáveis ​​altamente personalizadas para os portadores de cartões, diz Veeramachaneni. “Na sexta-feira, é comum um cliente gastar US $ 5 ou US $ 15 no Starbucks”, diz ele. “Essa variável parecerá: ‘Quanto dinheiro foi gasto em um café em uma manhã de sexta-feira?

Em seguida, cria uma árvore de decisão “se / então” para essa conta de recursos que não apontam para fraudes. Quando uma nova transação é executada através da árvore de decisão, o modelo decide em tempo real se a transação é fraudulenta ou não.

Contrapondo-se a um modelo tradicional usado por um banco, o modelo DFS gerou cerca de 133.000 falsos positivos versus 289.000 falsos positivos, cerca de 54% menos incidentes. Isso, juntamente com um número menor de falsos negativos detectados fraudes reais que não foram detectadas poderia salvar o banco em cerca de 190 mil euros, estimam os pesquisadores.

Empilhamento de funções primitivas

A espinha-dorsal do modelo consiste em “primitivos”, empilhados de forma criativa, funções simples que recebem duas entradas e fornecem uma saída. Por exemplo, calcular uma média de dois números é uma primitiva. Isso pode ser combinado com um primitivo que analisa o registro de data e hora de duas transações para obter um tempo médio entre as transações. O empilhamento de outra primitiva que calcula a distância entre dois endereços dessas transações fornece um tempo médio entre duas compras em dois locais específicos. Outro primitivo poderia determinar se a compra foi feita em um dia da semana ou fim de semana, e assim por diante.

“Uma vez que temos essas primitivas, não há como parar para empilhá-las… e você começa a ver essas variáveis ​​interessantes que você não imaginou antes. Se você se aprofundar no algoritmo, os primitivos são o tempero secreto , diz Veeramachaneni.

Uma característica importante que o modelo gera, observa Veeramachaneni, é calcular a distância entre esses dois locais e se eles ocorreram pessoalmente ou remotamente. Se alguém que compra algo no, digamos, Stata Center pessoalmente e, meia hora depois, compra algo pessoalmente a 320 km de distância, então é uma alta probabilidade de fraude. Mas se uma compra ocorreu através do telefone celular, a probabilidade de fraude cai.

“Há tantos recursos que você pode extrair que caracterizam os comportamentos que você vê nos dados anteriores relacionados a casos de uso fraudulentos ou não fraudulentos”, diz Veeramachaneni.

Com infomações do MIT . Com colaboração de Kalyan Veeramachaneni

Sobre o autor