摘要:曾幾何時,讓·鮑德里亞說“人工智能的可悲之處在于它不夠巧妙,因而不夠智能。”如今,用這句話描述人工智能已越來越不恰當。
曾幾何時,讓·鮑德里亞說“人工智能的可悲之處在于它不夠巧妙,因而不夠智能。”如今,用這句話描述人工智能已越來越不恰當。
蘋果、特斯拉、滴滴、百度等國內(nèi)外巨頭在無人駕駛上的頻頻加碼,讓無人駕駛技術進入了發(fā)展的快車道。但自動駕駛,只是人工智能的一個細分領域。
“人工智能是我們?nèi)祟愓趶氖碌淖顬樯羁痰难芯糠较蛑唬踔烈然鹋c電還更加深刻。” 桑德爾·皮猜曾指出。
近期,一項名為“遷移學習”的技術被谷歌、阿里云、薩摩耶數(shù)科等知名企業(yè)頻頻提及,這項技術雖然不如智能駕駛那么“接地氣”,但在商業(yè)應用上的價值卻毫不遜色。
圖片來源于網(wǎng)絡
無處不在的遷移學習
究竟什么是遷移學習?“你永遠不能理解一種語言——除非你至少理解兩種語言。”英國作家杰弗里·威廉斯的這句話有助于我們理解什么是遷移學習。
不必討論它冗長的概念,只需要思考一些生活中的細節(jié)。在幼兒園學習拼音的時候,老師教我們“a、o、e、i、u、ü”,教我們聲母、韻母如何搭配組合;而在我們學習英語的時候,常常自然而然地將一些拼音中的規(guī)律帶到音標中,這就是遷移學習一個常見的應用。
學習一類外語時,人們常常將在學習母語過程中的經(jīng)驗、技巧、習慣、方式不自覺的遷移運用于新語種的學習當中。如果是可借鑒的經(jīng)驗與方法,我們會獲取并且加深這種學習方式,如果是不適用的方法,我們則會放棄,換一種學習方式。
遷移學習的原理與人類學習語言的過程十分相似,在從源領域(比如漢語中拼音)學習的過程中,根據(jù)目標領域(比如英語中的音標)的數(shù)據(jù)特性,來決定是否需要將知識從源領域遷移到目標領域。
數(shù)據(jù)是人工智能的底層基礎,也是人工智能時代最核心的競爭力之一,必然“洛陽紙貴”。
如果源數(shù)據(jù)是“1”,那遷移學習的價值在于,它可以在源數(shù)據(jù)在源領域?qū)崿F(xiàn)自身“1”的價值的同時,在諸多目標領域?qū)崿F(xiàn)0.5、0.6乃至0.9的價值;使用遷移學習的新模型在開發(fā)過程中,也不用經(jīng)歷“從0到1”的過程,而是從0.5、0.6乃至0.9起步。
在薩摩耶數(shù)科看來,遷移學習就是“借力打力”,酷似諸葛孔明草船借箭,通過“借力”它將自己學習的框架放大,找到更多更有“能力”的樣本,并且充分利用他們的能力。
如今遷移學習已成為機器學習的基礎研究領域之一,在計算機視覺、文本分類、醫(yī)療健康領域有著廣闊的應用場景,當然也包括金融領域。
“與廣告推薦等領域相比,金融領域獲取的無偏樣本不僅僅需要獲客成本、營銷推廣費用,更需要付出昂貴的客戶逾期成本。而使用遷移學習的時候,就可以直接采用大量的業(yè)務樣本,這種近乎于零成本的樣本獲取方式的優(yōu)勢正是建模樣本所或缺的,能夠解決有標注的樣本的昂貴的產(chǎn)生代價問題。” 薩摩耶數(shù)科人工智能部負責人指出。
薩摩耶數(shù)科是一家以AI為驅(qū)動的金融數(shù)字科技公司,現(xiàn)有團隊規(guī)模超450人,其中風控及研發(fā)技術人員占比80%以上,依托人工智能和云計算等技術,為金融機構提供全方位、專業(yè)的數(shù)字金融科技服務。截至2021年一季度,薩摩耶數(shù)科已與包括商業(yè)銀行、消費金融公司在內(nèi)的超100家機構達成合作,累計注冊用戶超7130萬。
而遷移學習就是薩摩耶數(shù)科在人工智能領域廣泛應用的技術之一。
薩摩耶數(shù)科與遷移學習
薩摩耶數(shù)科是國內(nèi)較早將遷移學習應用于金融科技領域的企業(yè)之一。通過結合薩摩耶數(shù)科內(nèi)部常用的自動建模平臺AUTOMAN,薩摩耶數(shù)科開發(fā)了一套合適自身特點和需求的遷移學習工具。
例如在通過AUTOMAN自動建模過程中,在存在兩份建模數(shù)據(jù)集(目標數(shù)據(jù)集、輔助數(shù)據(jù)集)的前提下,通過遷移學習的方式,來調(diào)整兩份樣本中每個樣本實例的權重,通過每一輪的迭代,使得目標數(shù)據(jù)集中的錯分樣本權重提高,同時使得輔助數(shù)據(jù)集中的錯分樣本權重降低;如此,使得輔助數(shù)據(jù)集中有用的樣本可以為建模集所用,而無用的樣本從建模集中剔除,來實現(xiàn)建模數(shù)據(jù)樣本的調(diào)整。
該工具是否真的能通過遷移學習的方法改善建模效果?薩摩耶數(shù)科舉了一個項目實例:
此項目模擬了兩個數(shù)據(jù)集用遷移學習方式改善建模效果的實例,實際的樣本構成如下表所示:
最終建模效果如下圖所示,在相同的跨時間建模樣本上驗證模型效果,KS從0.328提升到0.406,效果有了非常顯著的提升。盡管兩份數(shù)據(jù)集的正樣本比例有著巨大的差距(圖1所示),但遷移學習可以在迭代的過程中消除這種差異,將可用數(shù)據(jù)為建模數(shù)據(jù)集所用。
從此項目實例可以看出,遷移學習在金融領域大有可為,而薩摩耶數(shù)科就是這項技術的先行者之一。
經(jīng)過了十余年的發(fā)展,金融科技已經(jīng)走過了一個完整的周期,大浪淘沙之下,穿越周期的企業(yè)很少,其中就有薩摩耶數(shù)科的身影。“穿越周期需要終局思維”薩摩耶數(shù)科董事長林建明曾如此說。
薩摩耶數(shù)科的終局思維體現(xiàn)在哪里?就在諸如遷移學習等人工智能技術上。截止2021年Q1季度,薩摩耶數(shù)科知識產(chǎn)權申請(專利、商標、著作權)418個,行業(yè)獲獎超50項。
6月初,智源研究院理事長張宏江一次活動上指出:在智能化時代,AI已經(jīng)像電力一樣變成無所不在的能力,數(shù)據(jù)已經(jīng)像燃料一樣變得隨處都需要。
誠然,人工智能早已不再是局限于圍棋上的阿爾法狗,它與我們的生活聯(lián)系越來越緊密,若說AI是“電力”,數(shù)據(jù)是“燃料”,那遷移學習這類技術是什么呢?在薩摩耶數(shù)科看來,它是人類在提升“燃料”使用效率的探索,就像人類對內(nèi)燃機的改進和研究。
近日,由《亞洲銀行家》主辦的2021中國未來金融峰會暨中國獎項計劃頒獎禮圓滿落下帷幕,薩摩耶數(shù)科榮獲...
近日,互聯(lián)網(wǎng)及金融反詐聯(lián)盟季度會議在京召開。薩摩耶數(shù)科作為反詐聯(lián)盟成員受邀參會,共探企業(yè)反詐實踐及相...
運動是當代社會人“內(nèi)省”的秘訣,也影響和構建著工作生活的新思維。對企業(yè)家來說,運動的魅力更是精神鍛造...
為探索未來金融行業(yè)發(fā)展新業(yè)態(tài),“黃埔金融峰會”暨“影響力·中國”時代峰會于3月26日在廣州盛大舉行。...
在當前全球醫(yī)藥產(chǎn)業(yè)格局不斷演變的背景下,中國醫(yī)藥企業(yè)正積極拓展國際市場,以期實現(xiàn)產(chǎn)品價值的最大化。
從單點投資到系統(tǒng)賦能是英諾抗周期波動的底氣,也是英諾近幾年苦練內(nèi)功的結果。
在醫(yī)美行業(yè)蓬勃發(fā)展且持續(xù)規(guī)范的當下,江蘇吳中(600200.SH)一款備受矚目的產(chǎn)品正逐漸走進大眾視...
在商業(yè)環(huán)境加速變革、消費需求持續(xù)升級的背景下,特許經(jīng)營模式憑借其標準化運營與高效擴張能力,已成為推動...
3月2日,魚躍醫(yī)療與中國足協(xié)中國之隊在北京隆重舉行"健康致敬體育精神"為主題的簽約發(fā)布會,正式宣布魚...
當 DeepSeek 以劃時代之姿,定義 AI 的全新高度,商業(yè)世界的未來走向,成為時代共同追問。
業(yè)績驅(qū)動因素方面,主要受益于消費類電子業(yè)務持續(xù)復蘇向好,新能源業(yè)務大幅增長,2024年公司營業(yè)收入創(chuàng)...
北京,這座融合了古老與現(xiàn)代的城市,以其深厚的歷史底蘊和獨特的文化魅力吸引著全球的目光。
投資家網(wǎng)(www.51baobao.cn)是國內(nèi)領先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務,包括行業(yè)媒體、智庫服務、會議服務及生態(tài)服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。