首页 > 资料专栏 > IT > IT技术 > 数据存储 > 天翼_中国电信大数据普惠金融应用实例_39页

天翼_中国电信大数据普惠金融应用实例_39页

lipuhui***
V 实名认证
内容提供者
热门搜索
资料大小:3841KB(压缩后)
文档格式:WinRAR
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2020/2/13(发布于山东)
阅读:6
类型:金牌资料
积分:--
推荐:升级会员

   点此下载 ==>> 点击下载文档


文本描述
数据来源:电信天翼大数据
报告说明
I.数据来源
天翼大数据,主要涵盖了中国电信运营服务中所产生的各类基本数据及通信娱乐、交互行为、位置轨迹等全域数据
II.概念定义
普惠金融:指以可负担的成本为有金融服务需求的社会各阶层和群体提供适当、有效的金融服务,小微企业、农民、城
镇低收入人群等弱势群体是其重点服务对象
大数据:指为了适应海量、高增长率和多样化的信息资产,采用各类软硬件技术优化处理模式,使数据能够具备更强的
决策力、洞察发现力和流程优化能力
金融科技:指将大数据、云计算、区块链、人工智能等多项高新技术整合创新,从而使其可以全面应用于支付、清算、
融资租赁、保险、互联网金融等方面,提升金融产业的效率
权益方案:指根据人群的特性兴趣,设定一系列不同的权益吸引受众
特征映射:对字段进行相关的特征处理,映射成为建模所需要特征变量
训练集:指在利用机器学习建模过程中,用来估计模型的样本集
测试集:指在利用机器学习建模过程中,用于测试训练好的模型的分辨能力的样本集
原始变量:直接将初始字段用于建模的变量
数据来源:电信天翼大数据
报告说明
衍生变量:通过对原生变量进行加工而产生的变量
III.数据定义
网络行为覆盖率:指具有相关行业网络行为的人群占总体人群的比例
ROC曲线:受试者工作特征曲线(receiver operating characteristic curve),是反映敏感性和特异性连续变量
的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出
一系列敏感性和特异性,再以敏感性为纵坐标、(1-特异性)为横坐标绘制成曲线,曲线下面积越大,诊断准确性
越高
AUC:Area Under Curve,ROC曲线下面面积与整个图形的占比,用来评定分类模型区分度的值。通常,AUC的
值介于0.5到1.0之间,较大的AUC代表了较好的模型效果
正样本:还款时间小于等于N天(约定还款期限)的用户,N值会根据业务和建模需求进行调整
负样本:还款时间大于N天(约定还款期限)的用户,N值会根据业务和建模需求进行调整
短信响应率:短信响应是指用户接收到短信后,按照短信内容提示点击链接或者回复相关内容;短信响应率=响应
短信的人数/发送短信的人数
数据来源:电信天翼大数据
报告说明
进件率:进件是指用户提交业务申请并填写相关资料,进件率=有相关操作的人数/短信响应的人数
批核率:批核是指银行审核用户的资质后,准予对用户进行发卡,批核率=批核人数/进件人数
一卡批核率:一卡批核是指首次申请该行信用卡的批核人数,一卡批核率=一卡批核人数/批核人数
综合营销效果:综合营销效果=短信响应率*进件率*批核率*一卡批核率=一卡批核人数/发送短信人数
促活率:促活率=响应行方活动的人数/筛选出需要营销的人数
有值:指匹配到相关数据的客户样本
无值:没有匹配到相关数据的客户样本
准确率:准确率=预测正确(将正样本预测为正和将负样本预测为负)的数量/所有样本数
召回率:召回率=将正样本预测为正的数量/(将正样本预测为正的数量+将正样本预测为负的数量)
KS:KS值表示模型将正样本及负样本区分开来的能力,值越大,模型的预测准确性越好。一般,KS0.2即可认为
模型有比较好的预测准确性
区间违约率:表示该评分区间内,坏样本的数量占该评分区间内所有样本数量的比例。。