首页 > 资料专栏 > 经营 > 管理专题 > 风险管理 > 数据挖掘在供应链金融风险控制中应用

数据挖掘在供应链金融风险控制中应用

lidongli
V 实名认证
内容提供者
资料大小:270KB(压缩后)
文档格式:WinRAR
资料语言:中文版/英文版/日文版
解压密码:m448
更新时间:2019/2/26(发布于广西)
阅读:9
类型:积分资料
积分:8分 (VIP无积分限制)
推荐:升级会员

   点此下载 ==>> 点击下载文档


文本描述
第32卷第3期
2∞8年6月
南昌大学学报(理科版)Vol. 32 No.3
Jun.2008 Joumal of Nanchang University( Natural Science)
文章编号:1∞6 -0464(2008)03 -0278-04
数据挖掘在供应链金融风险控制中的应用
谢江林,何宜庆\陈涛
(南昌大学系统工程研究所,江西南昌33∞31)
摘要供应链金融是近年来金融机构针对供应链上下游企业提供的一种全新的金融业务,这项业务在银行方
面也存在一定的风险。针对自经销商造成的还款风险,利用数据挖掘技术获得一组低还款能力经销商的特征属
性。金融机构能据此识别不同还款能力的经销商,并针对不同经销商制定不同的金融政策以控制和规避金融风

关键词:供应链金融;数据挖掘;风险控制;信息增益分析;特征属性
中圈分类号:白70文献标i只码:A
1 供应链金融风险分析
供应链金融是近年来金融机构针对供应链
上下游企业提供的一种全新的金融业务。该业务主
要围绕供应链上某1家核心企业,将供应商、制造
商、分销商、零售商、直到最终用户连成一个整体,全
方位地为链条上的N个企业提供融资服务,通过
相关企业的职能分工与合作,实现整个供应链的不
l断增值,因此,它也被称为1+ N模式[1-2J。这种
融资模式站在产品供应链的全局高度,为整个供应
链提供综合的金融服务,既解决了企业特别是中小
企业长期以来存在的融资困扰,又延伸了金融机构
的纵深服务,具有广阔的发展前景[3叫

这项业务对金融机构也存在一定的风险。从业
务服务对象即N个企业来看,风险主要是来自这
1家核心企业上游的供应商还款风险和下游的经
销商还款风险。本文选择经销商还款风险作为供应
链金融的主要风险,是因为从申请融资的对象看,主
要是生产商和大型的批发商。从实际的授信的对象
看,不是生产商而是与其相关的一系列经销商。换
言之,银行与生产商之间的合作是一种战略联盟,而
真正需要融资的是各个经销商[5]。在具体操作过
程中,商业银行先针对生产商推荐的各个经销商进
行逐个的资信调查,以客观、合理地分配授信额度

然后经销商利用银行融资进行批量订货,以便得到
商业折扣,销售回笼资金再存人商业银行,用于偿还
银行的融资本息。如果经销商无法完成销售导致无
法偿还借款,银行将按照法定程序处分抵押物,处分
的款项用于偿还银行的融资本息。如果前者大于后
者,银行将退还多余资金给经销商;如果款项少于本
息,银行将继续追索经销商。由此可见,供应链金融
风险主要是来自经销商的还款风险。因此,识别不
同还款能力经销商,对控制供应链金融风险具有重
要意义

数据挖掘是一种新的商业信息处理技术,其主
要特点是对商业数据库中的大量业务数据进行抽
取、转换、分析和其他模型化处理,从中提取辅助商
业决策的关键性信息[6]O随着信息化的普及和第
三方物流的发展,许多大型物流公司积累了大量经
销商的相关数据信息,分析、利用如此海量的数据,
正是数据挖掘技术的用武之地。在这一方面,国内
学者已经做了许多工作,陈安等[7J陈述了把数据挖
掘技术应用到供应链管理中去的意义;陆锦洪、陈畴
铺[8J把数据挖掘方法用于供应链合作伙伴的选择
上,在选取评价指标和计算权重系数后用聚类分析
和神经网络方法来做资料处理;供应链金融由于是
一项较新的金融业务,相关的理论研究相对较少,本
文利用描述性数据挖掘给出低还款能力(以下称为
高还款风险)经销商的特征属性,为金融机构进行
风险控制提供参考依据

1 具有高还款风险经销商的特征属性
识别
数据挖掘一般可以分为两类:预测性挖掘和描
鉴稿日期:2∞7-10-26
金项目:江西省教育厅科技资助项目(赣教技字[2∞7]118)
作者简介:谢江林(1966-),女,博士生,副教授.*通讯作者:何宜庆(1963-),男,教授,博士生导师.E-mail: hyq991@
163.con
.279. 谢江林等:数据挖掘在供应链金融风险控制中的应用第3期
2.3 属性相关分析
表中收集的属性包括销售地点、销售方式、经销
表2经销商基本倍息表
经销商企银行资销售业注册资还款
业规模信等级绩/万元本/万元风险
中型A 2∞ 70 低











1∞
70


ω
80
nununununU OY
A斗
句3
A斗
句,
&




'z·
句、d
鸣,
,&
1∞50
150
6010BCB
A
DBCAB
A
A
大型
小型
中型
大型
中型
小型
大型
大型
中型
小型
小型
销售销售
地点方式
福建区域
网络/江西
电话
江西区域
上海售前
湖北售前
网络/福建
电话
网络/江西
电话
售前
售前
区域
区域
售前










商企业规模等,然而并非所有儒性都和还款风险
相关,即不一定都是造成%学风险较高的原因,
采用信息增益方法能找出弱相关或不相关属性,为
特征属性选择提供可靠依据

2.3.1 信息增益度量为便于讨论,我们先
给出信息增益度量的数学表示[9J

假设S是训练、样本集,其中每个样本的类标号
是已知的。事实土,每个样本是一个元组,一个属性
用于确定训练样本的类。例如还款风险可以用于定
义每个样本的类标号或者是低或者是高。假定
有m乍类,设S包含Si个Ci类样本,i= 1,2,…n

一个任意样本属于类Ci的可能d性是S/S,其中s是集
合S中对象的总数。对于一个给定样本分类所需的
期望信息是:
札52,,sm)=-豆子l咱
具有值iα[,吧,…,av~的属性A可以用来将S
划分为子集jS[ ,S2'…,Sv f ,其中乓包含S中A值为
吨的那些样本。设鸟包含类Ci的Sij根据A的这种划
分的期望信息称作A的情。它是加权平均:
E(A) = 土S[j+句:+S呵札S2,',Sm)
述性挖掘。预测性挖掘在当前数据库上进行推断,
以进行预测。描述性挖掘则刻划数据库中数据的一
般特性,并将挖掘结果以简洁概要的方式进行描述,
提供数据的有趣的一般性质。概念描述是描述性数
据挖掘中最常用的类型,它产生数据的类特征描述

在描述性数据挖掘中,为确定哪些属性应当包含在
类特征分析中,通常采用维相关分析方法[9J。采用
描述性数据挖掘方法挖掘具有高还款风险经销商的
特征属性,主要包括以下几个步骤:
(1)收集日标类数据;
(2)通过属性删除和概化进行预相关分析;
(3)使用选定的相关分析度量,删除弱相关或
不相关属性;
(4)合并元组;
(5)结果映射

2.1 收集目标数据
由于要考查的是具有高度还款风险经销商的特
征属性,因此,目标类数据由经销商的集合组成。以
软件销售公司为例,所收集的软件经销商分处于五
个不同省市,收集、整理所得数据库的主要属性见下
表1:
经销商基本信息数据库字段表
销售方式
销售季节
银行资信等级
销售业绩
还款风险
取值
省份/城市名
50万以下、50万以上,1∞万以
下、100万以上
大型、中型、小型
区域销售、售前销售、网络/电话
销售
春、夏、秋、冬
A、B、C
按合同价格计算,单位万元
高、低
经销商企业规模
字段名
销售地点
表l
注册资本
、‘,
,,
··且,,E飞

(2)
则A上该划分获得的信息增益Gain(A),记为:
Gain(A) =/(s[,s2'…,Sm) -E(A) (3)
2.2 预相关分析
在这一阶段可以进行简单的数据清洗工作。2由
于考虑的是一组具有高度还款风险经销商的特征属
性,经销商的名称与特征属性元关,在表l中没有给
出。对于销售季节,并非研究某年的销售'民况,四季
都不可或缺,研究该属性的意义也不大,可以删除该
属性。如果某个属性有大量的不同值,通过考查任
务相关数据中每个属性的不同值的个数,进行概化
操作。经过预相关分析,对于样本集S表2给出了
部分经销商的销售信息:
.280. 南昌大学学报(理科版)2008年
对所求的Gain(A)设定一最小增益阔值,若
Gain(A)小于该设定的阔值,可将属性A视为弱相
关或不相关属性进行属性删除

2.3.2 属性信息增益计算设类CI表示还款风
险=低类C2表示还款风险高根据表2给
出的经销商信息,S分别包含4个CI类样本和8个
C2类的样本,由式(1)可得:
l(sl,s2) = 1(4,8) =土*log2旦+主*log2旦l'~.l/ -, .,~/ 12四4. 12 --0
= 0.918
再由式(2)可计算各不同属性的情:
E(销售地点)=主*队的+主*/(0,3)+
主*/(1,1)+主*川)+主*肌3)= 0.333
E(经销商企业规模=生*1(1 ,3) + 12
土*/(3,1)+土*1(0,4) = O. 12 -,-,-, . 12
E(注册资本)=主*川)+言*队3)=
0.908
E(销售方式)= 0.9045
由式(3)可求得各属性的信息增益:
Gain(销售地点)=0.918 -0.333 =0.585
Gain(经销商企业规模)= O. 918 -O. 541 =
0.377
Gain(注册资本)=0.918 -0.908 =0.01
Gain(销售方式)=0.918一0.905= 0.013
2.3.3 弱相关或不相关属性删除根据信息增益
度量方法,对经销商数据集求出的各属性信息增益
分别为0.585、0.377、0.043、0.013。其中具有高信
息增益的属性是给定数据集中的最优特征属性,如
销售地点。相反低信息增益的属性意味着选择
该属性后,将使得分类信息的情值最大,伴随信息的
不确定性也越大,因而具有弱相关性或不相关性

如销售方式其信息增益度最小,属弱相关性或不
相关属性

设定一个最小信息增益阔值,以此作为依据,对
不相关或弱相关的属性进行删除。如本例中将用于
识别弱相关属性的最小信息增益阔值设为0.05,对
于销售方式和注册资本两个字段,由于其信息
增益分别为0.013和0.01均小于0.05,故可以将这
两个字段删除

2.4 合并元组
经过对收集数据进行属性删除之后,合并相同
元组、归纳出一组具有高还款风险经销商的特征便
容易实现了O具体操作如下:除数值宇段销售业
绩外的其他所有宇段,将字段取值相等的记录合
并,并将销售业绩字段的值进行累加,然后进行
结果输出O输出的结果能清楚地反映出一组具有还
款风险经销商的特征,从中可以看出特征属性与风
险事件的关联

2.5 结果映射
对于挖掘的结果可以采用交叉表给出,也可以
采用图的形式表示,如条形图、饼图等,还可以采用
数据立方体视图表示。为了简化输出结果或者对某
些属性进行重点分析,可以单独抽取属性进行分析

如可以选择经销商数据中的经销地点单个属性
与风险事件进行重点分析,从属性取值结果可以看
出还款风险主要来自于经销地点为江西、湖
北的经销商,还款风险最低的是经销地点为福
建的经销商,从区域分布来看,即中部地区企业还
款风险明显高于东部地区企业。主要因为资金具有
逐利性和避险性,从1990年到2005年,银行贷款在
全国所占比重呈现下降趋势的省(区,直辖市)有七
个,大都在中部地区,也说明中部地区是我国金融高
风险区[m]O从经销商所在企业规模来看,大型企业
和小型企业的还款风险较中型企业的还款风险较要
高,可能在软件销售行业,中型企业较大型企业虽然
抗风险能力差,但运作更容易,而较小型企业抗风险
能力又更强

3 供应链金融风险控制
针对经销商所带来的供应链金融风险,金融机
构采取的控制措施主要有:选择具有行业优势的经
销商;对经销商的市场表现进行监控;对还款风险不
同的经销商采取不同的贷款利率政策。本文利用属
性相关分析进行相关属性选择,挖掘出一组具有高
还款风险的经销商的特征属性。金融机构可据此识
别具有高还款风险经销商,并制定不同的贷款利率
进行金融风险控制。如中国银行所采取的低风险低
利率,高风险高利率的贷款利率政策,同时参考企业
信用等级制定不同利率:对信用等级为AAA、AA、A
级的中小企业,贷款利率一般不低于法定利率;对信
用等级为BBB、BB、B级的中小企业,贷款利率一般
不低于法定利率上浮10%;对信用等级为ccc级及
以下的中小企业,贷款利率一般不低于法定利率上
浮20%,最高可至法定利率上浮30%。这样可保证
第3期谢江林等:数据挖掘在供应链金融风险控制中的应用 281 .
金融机构在开展金融业务创新的同时,有效控制金
融风险,防患于未然

风险控制是金融机构的必修课,随着供应链金
融业务的不断开展,其风险控制研究将倍受关注

利用描述性数据挖掘识别具有高还款风险经销商的
特征,能克服人为经验因素带来的不确定性,对进一
步提高我国金融机构的风险管理水平具有重要的现
实意义

参考文献:
[ 1 ] 杨绍辉.从商业银行业务模式看供应链金融融资服务
[1].物流技术,2005(10) :21 -22.
[2] 陈祥锋,石代伦,朱道立.金融供应链与融通仓服务
[1].物流技术与应用,2∞6(3):93 -95.
[3] 郭涛.中小企业融资的新渠道[1].经济师,2∞5
(2):18-20.
[4] 李碧珍融通仓:中小企业融资的新思路[1]商业经
济,2005( 3) : 10 1 -105.
[5] 程剑鸣,孙晓岭.中小企业融资[M].北京:清华大学
出版社,2∞6,3:107一110.
[6] 张云涛,龚玲.数据挖掘原理与技术[M].北京:电子
工业出版社,2004,4:1 -3.
[7]陈安,刘鲁,陈宁,等供需链管理中的数据挖
掘[C].Proceedings of the 3rd World Congress on Intelli-
gent Control and Automation. 1une 28 -1uly 2, 2000,
Hefei, P. R. China.
[8] 陈畴铺,陆锦洪基于数据挖掘方法的供应链合作伙
伴选择[1].数量经济技术经济研究,2002( 12) : 79 -
84.
[9] (加)1iawei Han Micheline Kamber.数据挖掘概念与技
术[M].范明,孟小峰,等译.北京:机械工业出版
丰士,2006,3:128 -137.
[10 ] 黄凡.浅谈金融在中部崛起中的地位与作用[1].
中国农业银行武汉培训学院学报,2∞7(2):29 -30.
The Application of Data Mining in the Control of Supply Chain Finance Risk
XIE Jiang-lin,HE Yi-qing,CHENG Tao
(Institute of Systems Engineering Research, Nanchang University, Nanchang 330031 ,China)
Abstract : Supply chain finance is a new financial business for the ente甲risesof supply chain, and there are some
risks in the financial institutions. To the risk brought by dealers, a group of characteristics of the dealers whose pos-
sibility of payment for bank is low can be obtained by taking use of data mining technology. The financial institutions
can identify different dealers, and establish different financial policies to different dealers so that they can control
and avoid the financial risk.
Key words: supply chain finance; data mining; risk control; information gain analysis; characteristic identification
。。。以上简介无排版格式,详细内容请下载查看