基于深度学习Autoencoder的信用卡欺诈异常检测，效果非常牛逼

常驻编辑科普中国 2022-05-28 信用卡异常神经网络编码器误差样本变量算法深度模型效果数据

qkR拜客生活常识网

模型搭建+模型训练qkR拜客生活常识网

# 设置Autoencoder的参数
input_dim    = X.shape[1]
encoding_dim = 128
num_epoch    = 30
batch_size   = 256

input_layer = Input(shape=(input_dim, ))


encoder = Dense(encoding_dim, 
                activation="tanh", 
                activity_regularizer=regularizers.l1(10e-5)
                )(input_layer)
encoder =BatchNormalization()(encoder)
encoder=LeakyReLU(alpha=0.2)(encoder)


encoder = Dense(int(encoding_dim/2), 
                activation="relu"
                )(encoder)
encoder =BatchNormalization()(encoder)
encoder=LeakyReLU(alpha=0.1)(encoder)


encoder = Dense(int(encoding_dim/4), 
                activation="relu"
                )(encoder)
encoder =BatchNormalization()(encoder)






### decoder
decoder = LeakyReLU(alpha=0.1)(encoder)
decoder = Dense(int(encoding_dim/4),
                activation='tanh'
                )(decoder)
decoder = BatchNormalization()(decoder)
decoder = LeakyReLU(alpha=0.1)(decoder)




decoder = Dense(int(encoding_dim/2),
                activation='tanh'
                )(decoder)
decoder = BatchNormalization()(decoder)
decoder = LeakyReLU(alpha=0.1)(decoder)


decoder = Dense(input_dim, 
                #activation='relu'
                )(decoder)


autoencoder = Model(inputs = input_layer, 
                    outputs = decoder
                    )
autoencoder.compile(optimizer='adam', 
                    loss='mean_squared_error', 
                    metrics=['mae','mse']
                    )


# 模型保存为 XiaoWuGe_model.h5，并开始训练模型
checkpointer = ModelCheckpoint(filepath="XiaoWuGe_model.h5",
                               verbose=0,
                               save_best_only=True
                               )
history = autoencoder.fit(X, 
                          X,
                          epochs=num_epoch,
                          batch_size=batch_size,
                          shuffle=True,
                          #validation_data=(X_test, X_test),
                          verbose=1, 
                          callbacks=[checkpointer]
                          ).history
Epoch 1/30
284807/284807 [==============================] - 39s 136us/step - loss: 0.6593 - mae: 0.3893 - mse: 0.4098
Epoch 2/30
Epoch 29/30
284807/284807 [==============================] - 41s 144us/step - loss: 0.1048 - mae: 0.1188 - mse: 0.0558
Epoch 30/30
284807/284807 [==============================] - 39s 135us/step - loss: 0.0891 - mae: 0.1134 - mse: 0.0495






模型结果可视化


# 画出损失函数曲线
plt.figure(figsize=(14, 5))
plt.subplot(121)
plt.plot(history['loss'], c='dodgerblue', lw=3)
plt.title('model loss')
plt.ylabel('mse')
plt.xlabel('epoch')
plt.legend(['train'], loc='upper right')




# 画出损失函数曲线
plt.figure(figsize=(14, 5))
plt.subplot(121)
plt.plot(history['mae'], c='dodgerblue', lw=3)
plt.title('model mae')
plt.ylabel('mae')
plt.xlabel('epoch')
plt.legend(['train'], loc='upper right')


# 画出损失函数曲线
plt.figure(figsize=(14, 5))
plt.subplot(121)
plt.plot(history['mse'], c='dodgerblue', lw=3)
plt.title('model mse')
plt.ylabel('mse')
plt.xlabel('epoch')
plt.legend(['train'], loc='upper right')

qkR拜客生活常识网

模型结果预测qkR拜客生活常识网

#利用训练好的autoencoder重建测试集
pred_X  = autoencoder.predict(X)
# 计算还原误差MSE和MAE
mse_X = np.mean(np.power(X-pred_X,2), axis=1)
mae_X = np.mean(np.abs(X-pred_X),     axis=1)




data['mse_X'] = mse_X
data['mae_X'] = mae_X
# TopN准确率评估
n = 1000
df =  data.sort_values(by='mae_X',ascending=False)
df = df.head(n)
rate = df[df['Class']==1].shape[0]/n
print('Top{}的准确率为:{}'.format(n,rate))


Top1000的准确率为:0.336

可以看到，我们的准确率为0.336，比之前的孤立森林又有了很大的提高，但是我经过了比较多的试验，这是比较理想的结果。后期我会找个更加稳定的结构分享给大家，下面我可以可以看看，正样本和负样本的一个分布差异。qkR拜客生活常识网

# 提取负样本，并且按照7:3切成训练集和测试集
mask = (data['Class'] == 0)
X_train, X_test = train_test_split(X, test_size=0.3,
                                   random_state=520)


# 提取所有正样本，作为测试集的一部分
X_fraud = X[~mask]




# 利用训练好的autoencoder重建测试集
pred_test  = autoencoder.predict(X_test)
pred_fraud = autoencoder.predict(X_fraud)




# 计算还原误差MSE和MAE
mse_test = np.mean(np.power(X_test - pred_test, 2), axis=1)
mse_fraud = np.mean(np.power(X_fraud - pred_fraud, 2), axis=1)
mae_test = np.mean(np.abs(X_test - pred_test), axis=1)
mae_fraud = np.mean(np.abs(X_fraud - pred_fraud), axis=1)
mse_df = pd.DataFrame()
mse_df['Class'] = [0] * len(mse_test) + [1] * len(mse_fraud)
mse_df['MSE'] = np.hstack([mse_test, mse_fraud])
mse_df['MAE'] = np.hstack([mae_test, mae_fraud])
mse_df = mse_df.sample(frac=1).reset_index(drop=True)




# 分别画出测试集中正样本和负样本的还原误差MAE和MSE
markers = ['o', '^']
markers = ['o', '^']
colors = ['dodgerblue', 'red']
labels = ['Non-fraud', 'Fraud']


plt.figure(figsize=(14, 5))
plt.subplot(121)
for flag in [1, 0]:
    temp = mse_df[mse_df['Class'] == flag]
    plt.scatter(temp.index, 
                temp['MAE'],  
                alpha=0.7, 
                marker=markers[flag], 
                c=colors[flag], 
                label=labels[flag])
plt.title('Reconstruction MAE')
plt.ylabel('Reconstruction MAE')
plt.xlabel('Index')


plt.subplot(122)
for flag in [1, 0]:
    temp = mse_df[mse_df['Class'] == flag]
    plt.scatter(temp.index, 
                temp['MSE'],  
                alpha=0.7, 
                marker=markers[flag], 
                c=colors[flag], 
                label=labels[flag])
plt.legend(loc=[1, 0], fontsize=12)
plt.title('Reconstruction MSE')
plt.ylabel('Reconstruction MSE')
plt.xlabel('Index')
plt.show()



      
 
        首页上一页1234下一页尾页 
  
相关阅读:

2021信用卡逾期找谁协商管用帮忙协商
多张信用卡欠20万可以慢慢还吗
信用卡逾期协商代理是真的吗
停息挂账2021新规定
信用卡逾期停用了还清后还可以用吗
信用卡被停用是不是就是黑名单了
信用卡频繁分期对买房有影响吗
招商银行上门面签是不是通过了
个人怎么办理信用卡(哪个银行信用卡好办)
办了信用卡该怎么还(不会被拒的信用卡)
 

               
上一篇 : typescript4.7 

下一篇 : 618手机竞速排行榜出炉：小米成功霸榜前四，快看看有你手机吗？


        
        猜你喜欢


    
    
    
 
   
	 
        热门信息
        
            疫情
         中国
         生肖
         游戏
         孩子
         时间
         身体
         怀孕
         美食
         旅游
         孕妇
         上海
         时尚
         北京
         月经
         人生
         篮球
         美国
         多久
         都会
            
      

   

    
  
         
        
      
        热门文章
        
                          1TikTok网络无法连接，无法使用7大常见原因
                         2二线明星出场费价格表2020，内地明星出场费价排行榜
                         3中国极具世界影响力的25个重大科技成就（精选）
                         4《优酷视频》黑屏怎么办（为什么优酷视频打开后是黑屏） ()
                         5刘强东套现要跑了4月7日，刘强东辞去京东集团CEO，由徐雷接替
               
      
      
   
    
  
         
        
      
        最近发表
        
                  竞技入道，技术为王《冠军超音速》打破国界跨国比拼
                  毛衣上架商场为时尚早《守望先锋》76成最强带货王
                  破坏球来去自如游荡全地图《守望先锋》诠释史上最强骚扰
                  美妈解冻，成功归队《OW2》上演万人PVE大战，众英雄联手败高达
                  百万玩家勇闯水星鬼屋《命运2》高科技装备撒旦现身也挡不住