机器学习:基于AdaBoosts算法对信用卡精准营销建立模型
作者:i阿极
作者简介:Python领域新星作者、多项比赛获奖者:
预先设定AdaBoost算法在误分类数为0时终止迭代,即全部分类正确时(即误差率为0)停止迭代,并定义误差率为错误划分类别的样本权重之和,例如对于9个样本,每个样本的权重为1/9,若此时有2个样本划分错误,那么此时的误差率就是1/9 + 1/9=2/9。
AdaBoost分类算法的流程图如下所示:
2、实验环境
Python 3.9
Anaconda
Jupyter Notebook
3、实验内容
AdaBoots信用卡精准营销模型
4、案例实战
4.1案例背景
当前经济增速下行,风控压力加大,各家商业银行纷纷投入更多资源拓展信用卡业务,信用卡产业飞速发展。因为市场竞争激烈,信用卡产品同质化严重,商业银行需要采用更快捷有效的方式扩大客户规模,实现精准营销,从而降低成本提高效益,增强自身竞争力。该精准营销模型也可以应用其他领域的精准营销,例如信托公司信托产品的精准营销等。
4.2模型搭建
1、读取数据
import pandas as pddf = pd.read_excel('信用卡精准营销模型.xlsx')df.head()
2、提取特征变量和目标变量
X = df.drop(columns='响应') y = df['响应']
3、划分训练集与测试集
from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=123)
4、模型训练及搭建
from sklearn.ensemble import AdaBoostClassifierclf = AdaBoostClassifier(random_state=123)clf.fit(X_train, y_train)
4.3模型预测及评估
1、预测测试集数据
y_pred = clf.predict(X_test)print(y_pred)
2、预测值与实际值对比
a = pd.DataFrame() # 创建一个空DataFrame a['预测值'] = list(y_pred)a['实际值'] = list(y_test)a.head()
3、查看准确度
from sklearn.metrics import accuracy_scorescore = accuracy_score(y_pred, y_test)print(score)
4、查看预测分类概率
y_pred_proba = clf.predict_proba(X_test)y_pred_proba[0:5]
5、绘制ROC曲线
from sklearn.metrics import roc_curvefpr, tpr, thres = roc_curve(y_test.values, y_pred_proba[:,1])import matplotlib.pyplot as pltplt.plot(fpr, tpr)plt.show()
6、查看AUC值
from sklearn.metrics import roc_auc_scorescore = roc_auc_score(y_test, y_pred_proba[:,1])print(score)
7、查看特征重要性
clf.feature_importances_
# 通过DataFrame的方式展示特征重要性features = X.columns # 获取特征名称importances = clf.feature_importances_ # 获取特征重要性# 通过二维表格形式显示importances_df = pd.DataFrame()importances_df['特征名称'] = featuresimportances_df['特征重要性'] = importancesimportances_df.sort_values('特征重要性', ascending=False)
文章下方有交流学习区!一起学习进步!
创作不易,如果觉得文章不错,可以点赞收藏评论
你的支持和鼓励是我创作的动力❗❗❗