中國大陸金融科技發展近況系列專題之三:大數據風控
中國大陸近14億人口中,一定會有一部份人目前都還沒申辦過信用卡,更遑論建立完整的徵信資料;另根據益博睿發布的「欺詐經濟學」資料顯示,中國大陸網路詐欺損失佔GDP比重達0.63%,僅次於美國之0.64%,排名全世界網路風險第二位,顯見中國大陸金融及互聯網產業對大數據風控需求之殷切。
一、中國大陸大數據風控市場概況
大數據風控是目前中國大陸大數據分析技術之最主要應用場景。
根據中國電子信息產業發展研究院發表之「2017中國大數據產業發展水平評估報告」資料顯示,中國大陸各行業大數據發展總指數為288.65、平均指數28.87;其中金融業大數據發展指數45.37、排名第一占比約16%。而大數據風控又是目前金融業大數據分析發展主流,36氪「2017FinTech行業研究報告」分析指出,大數據風控是目前中國大陸大數據分析技術之最主要應用場景。2015年第二季大數據企業出現第一次的籌資高潮,其中四分之三為大數據風控公司,經過今年第一季的籌資低潮後,第二季融資金額再現新高。36氪研究院把大數據產業鏈分成數據供應方、數據加工方及數據使用方等三大部分;中國銀行、中國平安、淘寶及京東等大型金融機構、電商、社交平台及公共服務機構等是主要數據提供者;芝麻信用、騰訊信用、同盾科技、快牛金科、51信用卡及原力大數據等則是主要「數據加工方」代表;金融機構、互聯網企業、P2P及其他有客戶信用資訊需求者自然都是大數據分析的最主要數據使用方。
二、中國大陸大數據風控應用實例
大數據風控產業之最主要應用包括:反詐欺風險及信用風險兩種,而精準行銷則被認為是大數據分析未來最具發展潛力的新應用之一。基此,我們將就中國大陸目前在反詐欺風險、信用分險及精準行銷等三個應用領域中比較知名的案例逐一介紹如後:
(一)快牛金科(反詐欺風險分析範例)
快牛金科成立於2014年,係一家向傳統銀行、保險公司和互聯網金融企業提供獲客、風控和貸後管理的全鏈條金融科技撮合平台;一端向金融機構提供技術支援,另一端向個人客戶、尤其是90後年輕人群體進行信用評估。傳統金融風控依賴的泰半是央行徴信數據及銀行機構貸款等強特徵數據,而這些強特徵數據正是90年後所謂「白戶群體」年輕人所最欠缺的。快牛金科開發的「元方智能雲」係目前國內獨家擁有BATJ(百度、阿里巴巴、騰訊及京東)全數據源的風控系統;具有強大的反詐欺識別能力,剛好補強了這一部分的空白。「元方智能雲」利用人工智慧和機器學習技術成功對接國內百餘家數據機構,針對消費者之信貸記録、司法記録、生活繳費記錄及社交行為數據、網路操作行為、學歷學籍等200多個維度、500多個人群標籤訊息進行分析,再利用機器學習技術建模,預測詐欺機率。
(二)同盾科技(反詐欺風險分析範例)
同盾科技成立於2013年,以反詐欺服務見長。截至目前為止,同盾科技建立了各式各樣的設備畫像、IP畫像及手機號畫像等;監控的手機號碼高達3000萬個、代理IP位址數2億個、失信名單及司法訊息千萬則,總覆蓋終端30億個以上;目前服務的客戶數超過6000家,近半屬金融機構。2015年中國大陸有308萬法院被執行人被納入所謂老賴失信名單,挾龐大覆蓋面優勢,同盾科技於2016年十月發布了「老賴畫像」;老賴以男性居多、34~53歲族群人數最多佔一半以上、平均年齡39歲;另又以44~53歲族群之借貸風險最高;老賴夜貓子居多、偏愛跨平台借貸、更愛P2P平台借貸,普通借貸者一個設備關聯一個手機號碼,而有10%的老賴在一台設備上關聯了40個以上的手機號碼。
同盾科技參展第五屆互聯網之光博覽會。
(三)51信用卡(信用風險分析範例)
51信用卡前身為51信用卡管家,2012年以「信用卡賬單管理工具」角色切入市場;除於去年9及10月前後30天內風光獲得C及C+輪合計近4億美元融資外,更於今年7月擧行的2017第六屆中國財經峰會中獲頒「2017行業影響力品牌」。51信用卡經由用戶註冊後之授權,分析所有客戶帳單郵件訊息、完成了客戶信息管理及債務智能化管理。截至去年底為止,51信用卡累積用戶數8,000萬、月新增用戶數200萬、月活躍戶數高達3,500萬;公司沈澱這些用戶數據後,從海量資料中挖掘借貸機會,並根據客戶之信用卡帳單、電商交易行為及社交方式等數據,進行信用評估、身份確認及反詐欺確認等大數據分析。51信用卡透過大數據進行信用分析後,讓信貸商品之系統線上申請、自動審核及自動放款等流程得以具體實現,並從每筆貸款中抽取2%佣金。
(四)原力大數據(精準行銷分析範例)
獲得「2017中國國際大數據大會精準行銷最佳解決方案奬」的原力大數據,主致力於大數據研究及應用,力求幫客戶透視業務全景、實現精準量化決策及提升客戶市場營銷能力。基此,原力大數據推出了「大數據熱點庫」,利用爬蟲技術(可以自動化抓取網頁內容的技術))爬取各個公開媒體及網絡,以分析出各個重要熱點或行業資訊。該公司強調應把數據明確細分到最微細之分類始能精準找出營銷決策所需之資訊。以遊戲App客戶流失原因分析為例,原因分類會從資費原因及產品原因再進一步細分到競爭對手A新産品上市或舊有B產品功能改善等;流失原因分析的愈細,愈能分析出不同客戶流失原因、提供客戶流失預警服務。單以手機連鎖產業為例,原力大數據熱點庫就建立、細分了32種場景及模型;原力大數據經由大量實踐案例證明,只要把場景細分的愈細愈合理,大數據應用就會變得愈有效,根據原力所作之案例效果評估,受惠於場景的進一步細分,客戶流失挽留率平均提升了158%。
(五)其他範例
除前述應用範例外,螞蟻金服旗下的第三方徵信機構芝麻信用於2015年1月正式上線公測;芝麻信用基於用戶信用歷史、行為偏好、履約能力、身分特徵(學經歷、車、房產)及人脈關係等五個維度,計算出客戶的個人信用分數;從350~950分之間分出較差到極好等五個信用等級。騰訊信用的徵信管理平台使用的則是履約、安全、財富、消費及社交等五個維度,分數區間位於300~850之間,且會於每月初進行更新。百融金服則是透過保險用戶之大數據分析,建立符合保險企業特性所需之用戶畫像(包括興趣及偏好特徵等);藉之提供中國人保、中國人壽、太平洋保險及新華保險等合作夥伴進行精準行銷時所需之數據支持,讓彼等公司第一線業務人員得以更深入了解用戶需求。百融金服能順利開展精準行銷大數據分析服務,主因其源自於2009年成立之百分點科技,該公司擁有5.5億個受眾畫像和1億個商品畫像。
三、結語
就傳統徵信而言,中國大陸徴信覆蓋率明顯不如美國,但拜互聯網金融蓬勃發展之賜,中國大陸在大數據風控之發展上已有急起直追之勢,顯見互聯網金融之蓬勃發展絶對是大數據風控成功發展的重要碁石。各個數據源、尤其政府機構資料之開放程度當然攸關資料的完整性與資料源的整合度,但是資料的標準化也會是大數據分析的重要成功關鍵,否則除了會有「Garbage in ,garbage out」的效率風險外,更應注意的反而是因為錯誤資料之誤導而作出錯誤決策。泰半的決策理論報告均指出,除了資料的完整性與準確性會影響決策品質外,資料的即時更新與數據分析報告的能否即時完成更攸關決策之成敗。因此,在一窩峰追求、崇拜大數據分析之偉大能力時,除了高端資訊技術能力之培養外,可能還是得先蹲好幾個資料處理「基礎功」的基本馬步。