大数据在银行业的应用
2017年9月27日 09:37 作者:lunwwcom【摘要】现如今,大数据概念及产业业已在人们生活和工作工作中不断产生越来越多的影响,银行业作为信息密集型的服务产业,它所产生的交易数据、客户活动信息等都是重要的大数据来源.如何有效将大数据和银行业进行结合,并通过大数据技术驱动银行业务实现更好发
展,是当前银行业急需解决的问题.本文阐述了大数据的起源、定义、特征,并在此基础上,对银行业大数据应用进行了进一步探讨和分析。
【关键词】大数据;银行业;应用
一、大数据的起源及特点
“大数据”概念最早由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。大数据有4V 特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。
二、大数据在银行业的应用
(一)业务驱动
大数据在银行业的应用主要是由其业务驱动的。应用大数据的业务驱动主要由精准营销、风险控制、改善经营和服务创新四个方面组成。
1.精准营销:互联网时代的银行在互联网金融的冲击下,迫切的需要掌握更多用户信息,继而构建用户360 度立体画像,即可对细分的客户进行精准营销、实时营销等个性化智慧营销。
2.风险控制: 应用大数据技术,可以统一管理银行内部多源异构数据与外部征信数据,可以更好的完善风控体系。内部可保障数据的完整性与安全性,外部可控制用户风险。
3.改善经营:通过大数据分析方法改善经营决策,为管理层提供可靠的数据支撑,使经营决策更加高效、敏捷,精确性更高。
4.服务创新:通过对大数据的应用,改善与客户之间的交互、增加用户粘性,为个人与政府提供增值服务,不断增强银行业务核心竞争力。
除以上四点之外,银行等金融机构应用大数据也有政府政策的原因。在十二五规划中,大数据已不再是只是专有名词,大数据已然上升为国家战略。随着国家对数据的重视、对国产化的支持以及对开源架构的呼声越来越高,使得银行等金融机构对大数据技术的选择成了必然趋势。
(二)数据类型
银行多源异构的数据类型是首先需要被考虑的。只有将多源异构的数据处理好,为应用建设打好基础,银行建设的大数据项目才有意义。银行的数据类型可分为结构化数据、半结构化数据与非结构化数据三大类型。
1.结构化数据:结构化的数据来源自银行运营数据仓储(ODS)和数据仓库(EDW)。EDW 为企业提供分析决策服务,ODS 主要实现企业数据整合、共享和准实时运营监控等功能。
2.半结构化数据:半结构化数据的整合在数据整合中是最为复杂的。银行可对接来源于银联数据和其他的金融机构所提供的不同类型数据库或Excel 等的数据。“打通”多源异构的数据是项目中遇到的最困难的部分,数据整合完毕可快速进行建模分析。
3. 非结构化数据: 银行对于非结构化的处理的方法还是比较原始的。非结构化数据涵盖的范围比较广泛,有新闻,视频,图片以及社交网络等数据,此类数据的数据量相当巨大,但以后对银行的增值会难以估量。
三、数据流向架构图
1.大数据基础平台:国外厂商的产品CDH、HDP 等,国内厂商的产品TDH、ADH 等, 以上产品均可为企业用户提供大数据基础的存储与计算服务。
2.数据处理加工平台:主要对大数据基础平台提供数据,进行建模分析。一可迁移银行已有的主题模型,比如销售主题、财务主题、风控主题等一系列主题迁移至大数据平台上。二可对接服务机构创新性模型,比如半结构化数据、非结构化数据等的模型进行迁移。
3.数据服务共享平台:目前银行应用的较少。总行应用共享平台,可为支行与分行提供服务,比如支行与分行的客户经理在上班之前可用手机接收总行的推送信息, 推送信息包括预测客户经理的顾客贷款、购买理财产品等的概率,提升服务质量,提高服务精度,增加成单量。
目前接触的银行中,做到第二层级数据处理加工的比较多。银行会做好用户画像,做一些简单的客户分析。至于第三层级数据服务共享平台,做的银行较少,而且总行应用共享平台,怎样提供服务给支行,支行怎样提供给分行,还需要理好思路进行探讨。总体来讲,数据流向的大致思路是通过数据源的接入获取更加全面的数据,通过构建或迁移相关模型,为共享平台提供服务。 流程如下:: 数据源接入———模型构建———服务共享
四、大数据应用
大数据应用中,可依照非实时到实时为时间轴,分为离线分析、实时分析、流处理与数据服务接口服务。
1.离线分析: 银行系统中,总行在离线分析应用的较好。离线分析在银行中的应用比较落后陈旧,且多数利用海量历史数据进行离线分析,分析现有客户,刻画用户画像,对客户细分。并且大部分分行还在跑批的阶段。银行如果过度依赖离线分析,会错过客户购买时机,在抢占市场时失去先机。
2.实时分析:相对于离线服务,实时服务的总体投入量更多。实时分析阶段主要提升计算能力,分析结果提升至分钟级,及时提供服务支持,客户经理可以及时的跟踪。
3.流处理:在流处理阶段,银行与客户的交流会更直接。比如当客户消费时,消费记录便会记录在银行的消息队列,通过大数据平台run出用户符合某项活动的活动规则,1s内反馈结果, 活动与人会自定义匹配,在用户操作刷卡动作时,实时减免相关用户等级的费用,而且此活动会比提供优惠券更能吸引客户。
4.数据服务接口:可以增强银行模式转型竞争力。银行的体制决定银行本身具有大体量数据等资源,通过数据整合、模型分析等流程加工数据,以数据服务商的角色为政府等部门提供数据、在线服务等,还可与之交换数据。