午夜精品网站-午夜精品亚洲-午夜精品一区-午夜精品一区二区三区免费视频-欧美一区二区aa大片-欧美一区二区不卡视频

證券日報APP

掃一掃
下載客戶端

您所在的位置: 網站首頁 > 基金頻道 > 基金動態 > 正文

基金業數字化轉型專題 | 建信基金:深度學習輔助設置客戶標簽

2022-11-21 12:58  來源:中國基金業協會

    【編者按】為深入貫徹落實黨的二十大精神,引導基金行業機構踐行《證券期貨業科技發展“十四五”規劃》,共促基金行業數字化轉型,按照中國證監會總體工作部署,于2022年11月開展“證券期貨業數字化轉型主題宣傳月”活動。通過開展“證券期貨業數字化轉型主題宣傳月”活動,搭建交流平臺,展現數字化轉型成果案例,激發金融科技創新活力,營造金融科技長效發展新生態。該篇為“證券期貨業數字化轉型主題宣傳月”系列宣傳之十八。

    深度學習輔助設置客戶標簽

    ——建信基金

    一、背景

    為了更好地服務客戶,維護金融業的安全與穩定,基金行業監管愈趨嚴格,數據報送工作也越來越重要。建信基金作為金融行業內首批成立的銀行系基金公司,除完成證監會要求的FISP報送、CISP資管報送、基金申贖及基金投資人結構日報表,基金業協會要求的資管業務運行月報、場外債券投資交易明細表、公募資金來源表等基金行業監管相關的報送工作外,還需要完成人民銀行要求的金融機構資管產品數據報送、銀行業金融機構黃金市場業務監測表、人民銀行系統重要性銀行統計制度報表報送、銀保監會要求的綜合化經營自查附屬機構內部交易報送等銀行業監管相關報送。其中證監會FISP報送、人民銀行金融機構資管產品數據報送、人民銀行系統重要性銀行統計制度報表報送、基金業協會公募資金來源表、附屬機構內部交易報送工作,需要業務人員每日手動填充新注冊的對公客戶的7項屬性標簽(以下簡稱“打標簽”)。

    為完成打標簽工作,業務人員投入了越來越多的精力。一方面,業務人員需要結合業務經驗才能正確填寫標簽,另一方面,有些屬性包含的標簽類型數量較大,如“FISP分類”有40個以上標簽可選項,需要業務人員查找與比對之后才能選出正確的一項。隨著公司業務的不斷發展,新注冊的對公客戶數量越來越多,業務人員手動填寫標簽的工作壓力不斷增大。

    2021年《證券期貨業科技發展“十四五”規劃》(以下簡稱《“十四五”規劃》)正式發布[1],強調了“推進行業數字化轉型發展”與“數據讓監管更加智慧”兩大主題。建信基金從數字化經營角度對監管報送業務中的打標簽工作進行了分析,嘗試通過人工智能算法對標簽進行預填充,減少業務人員在填寫標簽上花費的時間和精力,提升員工工作效率和工作體驗。

    對新注冊客戶打標簽,本質是把客戶分配到該標簽對應類別中。通過建立機器學習模型,可以對客戶的類別進行預測,并完成自動填寫,供業務人員審核或修正。建信基金算法團隊在對兩種深度學習算法——文本卷積神經網絡[2][3]和基于注意力機制的雙向長短期記憶網絡[4]進行探索后,對報送工作中需人工填寫的7個屬性進行了預測,均獲得了極高的準確率,已在建信基金統一報送平臺上線使用。

    二、兩種深度學習模型

    下面簡介兩種深度學習模型的基本原理。

    (一)TextCNN模型

    在短文本分類領域常用文本卷積神經網絡(后面簡稱TextCNN)來完成分類任務。參考句子分類的卷積神經網絡TextCNN網絡結構[2],本文模型如圖1所示。

    該網絡結構主要包括嵌入層、卷積層、池化、全連接層四部分。

    TextCNN先使用預訓練的詞向量作為嵌入層,然后在卷積層使用一維卷積提取特征,再通過池化函數捕獲最重要的特征,在全連接層建立特征到類別的全連接,將輸出結果進行歸一化轉換后,可得到每個類別標簽的概率。

    (二)Bi-LSTM+Attention模型

    長短期記憶網絡LSTM,是一種循環神經網絡模型。雙向長短期記憶網絡Bi-LSTM能更好地捕獲句子中上下文的信息。而基于注意力機制的雙向長短期記憶網絡(以下稱為Bi-LSTM+Attention)在關系分類[4]的實驗中獲得比較顯著的效果。本文選用的Bi-LSTM+Attention模型如圖2所示。

    三、業務分析與模型構建

    對公客戶在基金公司注冊成功后,就成為基金公司的新客戶(以下簡稱“客戶”)。根據監管要求,每一個新客戶的加入,在報送時需對其補充“客戶類型”、“FISP分類”、“人行類型”、“內部交易類型”、“資金來源”“公募來源投向”、“人行重要性分類”共7個屬性標簽,而其中每一屬性的填充,均需要從監管要求的標準標簽集中選出一個標簽。

    比如,注冊名稱為“×銀理財穩享固收精選2個月定開3號理財產品”的客戶,設置“客戶類型”屬性為“產品客戶”,“FISP分類”屬性為“銀行子公司公募理財”,“人行類型”屬性為“銀行非保本理財”,“人行重要性分類”屬性為“特定目的載體”,“內部交易類型”屬性為“非內部交易客戶”,“資金來源”屬性為“其他機構”,“公募來源投向”屬性為“除上述類型外的其他機構投資者”。而名稱為“北京××有限公司”的客戶,則設置“客戶類型”屬性為“機構客戶”,“FISP分類”屬性為“境內非金融機構”標簽,“人行類型”屬性為“非金融企業”,“人行重要性分類”屬性為“非金融企業”,這些屬性標簽與前者明顯不同。

    為實現智能化設置標簽的目標,需要用模型預測出每個屬性選擇哪個標簽是最適合的。通過對客戶數據考察發現,客戶名稱是體現客戶特點的核心因素,對于每個屬性選擇標簽起重要作用。對客戶名稱建模,并從一個標準標簽集中篩選出最合適的一個標簽,填充到該客戶某一屬性上,是自然語言處理領域文本分類技術的一個典型應用場景。

    所以,本文對客戶7個屬性分別建立了7個獨立的分類子模型,預測各自對應的標簽結果。每個模型訓練與預測過程如圖3所示。

    在算法處理過程中,首先使用開源分詞工具結巴分詞,把客戶名稱切成有意義的詞條序列,并去除助詞、標點等無意義詞條。

    下一步通過詞嵌入模型word2vec[5]進行語義抽取,每個詞條的語義用同一維度的向量表示出來,客戶名稱就從詞條序列轉換成計算機可運算的語義數字矩陣。

    最后用深度學習模型進行訓練和預測。以TextCNN網絡為例,前一步得到語義數字矩陣作為TextCNN網絡的嵌入層輸入數據,經過網絡模型計算后,最終在全連接層后,預測出每個候選標簽的概率,并選擇概率最高的標簽為某一屬性最終的填充結果。

    本文參考句子分類實驗的模型結構和參數[3],選擇卷積過濾器窗口大小為2、3、4、5,用以提取詞之間多元語義信息。此外,卷積模式設計也重點考慮了文本首尾的邊界特征的有效提取。比如名稱為“××博時組合"的客戶,因為“組合”是名稱的結尾,則應標記為“產品客戶”,而名稱為“北京××有限公司”的客戶,是以“有限公司”為結尾的,則更可能歸屬于“機構客戶”。

    對Bi-LSTM+Attention模型也是類似的,客戶名稱的詞條序列轉化為語義向量序列X1,X2,…,XT作為輸入層,經過模型運算后,預測出概率最高的標簽作為最終結果。

    四、實驗結果

    實驗選用了2019年6月份到2022年6月份業務部門手工標記的客戶標簽數據,隨機劃分得到訓練集約4萬條和測試集約1萬條數據。

    在客戶7個屬性的預測任務上,兩種模型的實驗準確率如表1所示。

    TextCNN模型和LSTM+ATTENTION模型都獲得了高準確率的實驗效果,而機器實測運行效率上,前者是后者的十倍以上,所以生產應用上更傾向TextCNN模型。

    五、給公司帶來的效益

    (一)降低工作難度和工作量

    在TextCNN模型上線之前,按照數據報送業務的操作流程,業務人員需要對新客戶的7個屬性依次進行手工選擇,為每個屬性選擇正確的標簽作為屬性值。業務人員為每個屬性選擇標簽時,主要依賴其個人經驗作為判斷依據,從一個候選的標簽列表中尋找出正確的標簽作為屬性值,做出判斷的難度較大,很多情況下需要依賴互聯網等工具反復搜索和匯總信息后才能最終確認,操作過程枯燥乏味,且當信息不全時還有產生誤選的風險。另外,由于純手工操作的效率低,當出現新用戶量暴增的情況時,打標簽操作會對業務人員的工作負荷和數據報送業務的按時完成帶來不小的壓力。

    為了解決這些問題,公司的數據報送業務流程進行了升級,加入了TextCNN模型輔助設置客戶標簽的功能。TextCNN模型對新用戶的7個屬性都能預先給出高準確率的預測結果,自動設置屬性標簽,而業務人員的操作方式也從原來的手工選擇標簽,轉變為標簽的審核與修正,簡化了操作步驟,并顯著降低了業務人員的工作難度和工作量。

    TextCNN模型上線后,選擇一個月的實際數據統計,如表2所示,各個屬性均保持了穩定的高準確率,平均準確率約97.85%,僅有不超過3%的標簽需要進行人工修正,業務人員的工作量得到了顯著降低。

    (二)提升工作效率

    由于深度學習模型已給出高準確率的預測結果,業務人員僅需關注在結果的審核和少量錯誤數據的修正上,節省了97%以上的操作時間,提升了工作效率,為數據報送業務每日按時順利完成提供了強大的技術支持,并避免了新用戶量大幅上漲可能引起人工操作時間暴漲的情況,降低了運營風險。

    比如,根據TextCNN模型上線后實際操作日志統計,假設新用戶每個屬性點選標簽平均需要4秒鐘,則原本1小時以上的標簽手工填寫工作,可縮減為幾分鐘內完成。即使偶爾出現新客戶暴漲的情況,業務人員的操作時間依然能夠控制在很小的時間范圍內,輕松完成,如表3所示。

    (三)提升報送數據的質量

    采用深度學習TextCNN模型輔助設置客戶標簽的新業務模式,相比原來純手工模式,還有助于提升各個屬性的準確率,從而進一步提升報送數據的質量。

    這是因為,一方面TextCNN模型的預測結果已有很高的準確率,再由業務人員結合自身經驗進行人工審核和修正后,進一步提升了數據質量;另一方面,當業務人員對新客戶的信息掌握不足、存在偏差等特殊情況下,在某些屬性上容易出現人工判斷錯誤的風險時,TextCNN模型的預測結果有可能提供出正確的候選,從而幫助業務人員突破依賴個人經驗進行操作的限制,避免誤選屬性標簽。

    比如,僅憑個人經驗,“招商財富”容易被誤認為是“招商銀行”的子公司,但實際上“招商財富”是“招商基金”的子公司。類似這樣的情況,深度學習TextCNN模型的預測結果可以給出正確的候選標簽供業務人員參考和審核,從而一定程度上減少了誤選的風險。

    綜上所述,高準確率的深度學習模型在數據報送業務上的應用,不僅降低了業務人員的操作難度,更顯著降低了人工的工作量和操作時間,提升了工作效率和工作體驗,還有助于進一步提升報送數據的質量,降低了運營風險,為行業數字化轉型進行了有益的探索實踐。

    參考文獻[1]羅逸姝.新華社客戶端官方帳號.《證券期貨業科技發展“十四五”規劃》發布[N].百度百家號.2021-10-22[2]YoonKim.2014.ConvolutionalNeuralNetworksforSentenceClassification.InProceedingsofthe2014ConferenceonEmpiricalMethodsinNaturalLanguageProcessing(EMNLP),pages1746–1751,Doha,Qatar.AssociationforComputationalLinguistics.[3]YeZhangandByronWallace.2017.ASensitivityAnalysisof(andPractitioners’Guideto)ConvolutionalNeuralNetworksforSentenceClassification.InProceedingsoftheEighthInternationalJointConferenceonNaturalLanguageProcessing(Volume1:LongPapers),pages253–263.[4]PengZhou,WeiShi,JunTian,ZhenyuQi,BingchenLi,HongweiHao,andBoXu.2016.Attention-BasedBidirectionalLongShort-TermMemoryNetworksforRelationClassification.InProceedingsofthe54thAnnualMeetingoftheAssociationforComputationalLinguistics(Volume2:ShortPapers),pages207–212,Berlin,Germany.AssociationforComputationalLinguistics.[5]T.Mikolov,K.Chen,G.Corrado,andJ.Dean.EfficientEstimationofWordRepresentationsinVectorSpace.ICLRWorkshop,2013a。

-證券日報網

版權所有證券日報網

互聯網新聞信息服務許可證 10120180014增值電信業務經營許可證B2-20181903

京公網安備 11010202007567號京ICP備17054264號

證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。

證券日報社電話:010-83251700網站電話:010-83251800

網站傳真:010-83251801電子郵件:[email protected]

證券日報APP

掃一掃,即可下載

官方微信

掃一掃,加關注

官方微博

掃一掃,加關注

主站蜘蛛池模板: 国产一久久香蕉国产线看观看 | 久久99精品久久久久久国产越南 | 国产在线毛片 | 国产精品伦视频观看免费 | 美女免费精品视频在线观看 | 免费可以看黄的视频 s色 | 久久yy| 国产成人精品s8p视频 | 国产精品欧美亚洲韩国日本久久 | 久久精品国产亚洲aa | 国产日产欧产精品精品图片 | 免费看污网站 | 国产国语一级毛片在线视频 | 国产成人精品午夜 | 波多野结衣在线观看网址 | 国产在线播 | 国产精品久久久久久久久久98 | 国产精久久一区二区三区 | 成人午夜性视频欧美成人 | 高清不卡一区 | 国产精品视频铁牛tv | 狠狠色狠狠色合久久伊人 | 国产成人亚洲精品大帝 | 美女视频黄色网址 | 国产成人综合久久精品尤物 | 很黄很色很爽的三级视频 | 国产精品福利在线观看入口 | 黄色人妖| 免费观看在线永久免费xx视频 | 精品精品欲天堂导航 | 国产91在 | 九九爱精品 | 国产伦精品一区二区三区女 | 国产农村一级毛片精品 | 国产亚洲一区呦系列 | 久久一本一区二区三区 | 狠狠色噜噜狠狠狠狠五月婷 | 国产视频一二区 | 玖玖精品在线视频 | 国产一区二区三区美女秒播 | 精品黑人一区二区三区 |