<kbd id='wogvxjbm'></kbd><address id='wogvxjbm'><style id='wogvxjbm'></style></address><button id='wogvxjbm'></button>

              <kbd id='mm8cungh'></kbd><address id='mm8cungh'><style id='mm8cungh'></style></address><button id='mm8cungh'></button>

                      <kbd id='om5upyp3'></kbd><address id='om5upyp3'><style id='om5upyp3'></style></address><button id='om5upyp3'></button>

                              <kbd id='a859yfzt'></kbd><address id='a859yfzt'><style id='a859yfzt'></style></address><button id='a859yfzt'></button>

                                      <kbd id='d1e78l9e'></kbd><address id='d1e78l9e'><style id='d1e78l9e'></style></address><button id='d1e78l9e'></button>

                                              <kbd id='o2lmcwxb'></kbd><address id='o2lmcwxb'><style id='o2lmcwxb'></style></address><button id='o2lmcwxb'></button>

                                                      <kbd id='jh9txr60'></kbd><address id='jh9txr60'><style id='jh9txr60'></style></address><button id='jh9txr60'></button>

                                                              <kbd id='rlupjvfu'></kbd><address id='rlupjvfu'><style id='rlupjvfu'></style></address><button id='rlupjvfu'></button>

                                                                  您的位置:首頁 > 新聞動態 > 申博聚焦

                                                                  回顧:申博TF14聯邦學習技術及數據隱私保護研討會

                                                                  閱讀量:215
                                                                  2019-03-26

                                                                  3月24日aaaa,由申博主辦、微衆銀行及深圳大學微衆金融科技研究院協辦的申博TF14期研討會在深圳大學舉辦aaaa,此次會議的主題爲“聯邦學習技術及數據隱私保護”aaa。


                                                                  轉自億歐記者現場報道aaa,《申博最新分享:數據隱私保護下aaa,AI大數據應如何發展aaa?》


                                                                  1.webp


                                                                  3月24日aaaaa,由申博主辦aaaaa,微衆銀行及深圳大學微衆金融科技研究院協辦的“申博TF14期研討會”在深圳大學舉辦aaaa,此次會議的主題爲“聯邦學習技術及數據隱私保護”aaaaa。


                                                                  隨着國際國內數據隱私保護成爲新趨勢aaaa,數據共享變得更加困難aaaaa,如何在保護數據隱私前提下開展AI大數據研究aaaa?“聯邦學習”可以打破“數據孤島”具體應用在AI領域aaa。聚焦“聯邦學習技術及數據隱私保護”aaaa,申博TF 14期研討會邀請國際人工智能學會理事長、微衆銀行首席人工智能官楊強、南洋理工大學於涵教授、微衆銀行人工智能部高級研究員劉洋、京東城市計算事業部AI平臺部負責人張鈞波、北京觀韜中茂(上海)律師事務所合夥人王渝偉、第四範式聯合創始人、首席研究科學家陳雨強、微衆銀行人工智能部副總經理陳天健與大家現場互動交流aaaaa。


                                                                  AI大數據面臨挑戰aaaaa,技術向善與遷移學習


                                                                  我們知道aaaa,AI與各行業緊密結合aaa,必將顯著改善社會生活aaaa,這是一種比較理想的狀態aaaaa,然而現實是AI系統仍有許多不盡如人意的地方aaa。另外aaa,社會對隱私保護和數據安全提出了更高的要求aaaaa,這也給大數據研究及共享提出了新的挑戰aaaaa。


                                                                  競爭、安全及數據壁壘等因素造成所謂的“數據孤島”問題aaa。在此背景下aaaa,遷移學習幫助更多領域建模aaaa,就像在數據集之間建立朋友圈aaaa,數據孤島問題得到有效解決aaaa。


                                                                  AI向善與系統短板


                                                                  AI向善aaaa,它能在普惠金融、普惠教育、普惠醫療、智慧城市、災難營救、扶貧及農業等領域發揮重要作用aaaaa。


                                                                  楊強教授表示:“AI向善(AI for good)aaaaa,這在國外很早就被提出來的概念aaa。這個概念不僅僅是計算機領域的發展aaaa,也是社會的需求aaaa,最近大家比較關心的一個議題就是AI和社會的結合aaaaa。AI作爲一種工具aaa,就像以前互聯網作爲一種工具aaa,加上一些傳統的只能少數人享受的領域aaaa,然後通過AI的手段對廣大的社會傳播aaaa,能夠讓普通人也能享受過去VIP享受的那一些特殊服務aaa,包括金融aaaaa,所以這樣就產生了AI和普惠金融aaa;AI和普惠教育aaa,例如大學的高等教育aaaaa,能不能讓所有人都能享受到aaaaa。另外還有AI和普惠醫療、智慧城市、災難營救aaa,AI扶貧和農業等方面aaa。”


                                                                  AI若能與各行業緊密結合aaaa,必將顯著改善社會生活aaaaa,這是一種比較理想的狀態aaaaa,然而現實是AI系統仍有許多不盡如人意的地方aaa,例如AI系統的有偏性和AI系統與人類合作方面的問題aaa。


                                                                  “AI系統有偏性aaa,根據我們交給AI系統的數據aaaaa,AI系統可以建立模型aaaaa,但如果這個數據是有偏的aaaaa,那麼這個模型就會有偏性aaaaa。另一個是AI系統和人類合作的問題aaaaa,最近一個很大的事情是波音飛機自動駕駛系統和人類飛行員搶奪控制權aaaaa,不幸的是系統贏了aaaa,導致飛機墜毀aaaaa,現在波音飛機停飛aaaa。這給我們一個很大的啓示aaa,自動系統如果不能和人類有一個很好的交互aaaa,沒有以人爲中心的設計aaaa,這個系統會是一個災難aaaa。”楊強教授表示aaaaa。


                                                                  2.webp

                                                                  楊強


                                                                  遷移學習解決“數據孤島”問題


                                                                  目前aaaa,除AI系統自身的一些問題外aaa,重視隱私保護和數據安全的新趨勢也給數據研究及共享帶來新的挑戰aaaa。


                                                                  近年來aaa,國際國內對於隱私保護和數據安全的重視已成爲重要趨勢aaaa。歐盟去年5月通過最新法案《通用數據保護條例》(General Data Protection Regulation, GDPR)aaa,對數據保護採取更嚴格的態度aaa。同時aaa,我國也在緊跟這些領域的法律和規範aaaa,自2017年《網絡安全法》通過以後aaa,目前我國個人信息保護法已納入立法規劃aaaa,有望在2020年通過aaaaa,這些都反映出數據保護與隱私安全越來越受到重視aaaa。


                                                                  隨着隱私保護和重視數據安全成爲新趨勢aaaa,數據研究及共享面臨更多問題aaaa。首先aaaaa,由於競爭關係、安全問題、審批流程等因素aaaaa,數據共享難度高aaaaa。其次aaa,數據在不同擁有方、雲和端以及物聯網節點之間的流通存在着難以打破的壁壘aaa,形成所謂的“數據孤島”問題aaa。此外aaaa,即便不同行業之間有意願交換數據aaa,也可能遭遇政策問責和競爭保護aaaa,AI的大數據面臨重重挑戰aaa。


                                                                  雖然AI的大數據面臨重重挑戰aaaa,但數據孤島並非不可解決aaaa。“遷移學習就是很好的解決方案aaa。遷移學習是用一個成熟領域的數據和模型aaaaa,通過知識遷移aaaaa,幫助完成一個小數據建模aaaaa。這樣通過關聯領域間的相似性aaa,幫助更多領域建模aaaa,這就像在數據集之間建立朋友圈aaaa,數據孤島也能得到有效解決aaaaa。”楊強教授表示aaaaa。


                                                                  數據共享與安全aaa,聯邦學習的優越性


                                                                  此外aaa,解決數據壁壘、“數據孤島”等問題的方法除遷移學習外aaa,還有一個重要方法——“聯邦學習”aaa。


                                                                  谷歌公司率先提出了基於個人終端設備的“聯邦學習” (Federated Learning)算法框架aaaaa。“聯邦機器學習”(Federated Machine Learning)實際上是一種加密的分佈式機器學習技術aaaaa,參與各方可以在不披露底層數據和底層數據的加密(混淆)形態的前提下共建模型aaaa。它可以實現各個企業的自有數據不出本地aaaaa,通過加密機制下的參數交換方式aaaaa,就能在不違反數據隱私法規情況下aaaaa,建立一個虛擬的共有模型aaaaa。在這樣一個機制下aaaa,參與各方的身份和地位相同aaa,成功實現了打通“數據孤島”走向“共同發展”的目標aaaaa。


                                                                  聯邦學習分爲橫向聯邦和縱向聯邦aaaaa,橫向聯邦數據方特徵維度相同aaaa,縱向聯邦數據方樣本ID相同aaa。縱向聯邦學習的目標是A方與B方聯合建立模型aaaa,並且假設只有一方有標籤Yaaa,兩方均不暴露數據aaaaa,但可能遇到的挑戰是隻有X的一方沒有辦法建立模型aaaaa,雙方不能交換共享數據aaaaa,最終要達到的預期爲雙方俊獲得數據保護且模型無損失aaaaa。


                                                                  “通過縱向聯邦學習aaaaa,各方在隱私保護下進行樣本ID匹配aaa,每個參與方並不知道另一方的數據和特徵aaa,每個參與方只得到自己的自己側的模型參數(半參數)aaa,即滿足隱私保護的要求aaaa,又滿足數據遷移學習的目標aaaaa。聯邦學習希望在安全合規的基礎上達到防禦攻擊、提高算法效率的目標aaa。”劉洋博士表示aaaaa。


                                                                  3.webp

                                                                  劉洋


                                                                  基於此aaaa,微衆銀行AI團隊提出了基於“聯邦學習”的系統性的通用解決方案aaa,可以解決個人(to C)和公司間(to B)聯合建模的問題aaaaa。此前aaaa,微衆銀行在城市管理的視覺應用方面aaa,與極視角聯合推出了聯邦視覺項目aaa。


                                                                  “傳統城市管理面臨標籤數量少、數據分散aaaaa,集中管理成本很高且模型更新和反饋存在離線延遲情況aaaaa,聯邦視覺項目通過聯邦學習對模型提升率爲15%aaa,且模型效果無損失aaaa,這是聯邦學習應用在物聯網領域的一大優勢aaa。” 劉洋表示aaaa。


                                                                  物聯網(IoT)是基於互聯網、傳統電信網等信息傳輸渠道aaaa,讓所有具備通信功能的獨立物體實現互聯互通的網絡aaaaa。物聯網的應用之一aaaa,是透過收集多個節點的小數據aaaa,聚集成大數據來建立應用模型aaaa。


                                                                  而邊緣計算(Edge Computing)則致力於通過依靠集網絡、計算、存儲、應用核心能力爲一體的開放平臺aaaaa,就近提供最近端服務aaaa,從而產生更快的網絡服務響應aaa,滿足不同行業的實時業務需求aaaaa。


                                                                  物聯網、邊緣計算和與人工智能 (AI) 的有機結合離不開分佈式大數據的安全、合法的管理aaaaa,聯邦學習助力IoTaaa,實現大規模用戶在保護數據隱私下的協同學習aaaa。


                                                                  多方如何實現“共同富裕”aaaaa,聯邦學習的收益分配


                                                                  聯邦學習助力物聯網發展aaaa,那麼aaaaa,多個數據方是如何打破“數據孤島”aaa,實現 “共同富裕呢aaaa?聯邦學習的收益分配是怎樣的呢aaaaa?


                                                                  於涵教授表示aaa。“在聯邦學習機制下aaaa,參與各方的身份和地位相同aaaaa,各參與方把加密後的數據貢獻給聯邦aaaaa,然後數據聯盟訓練一個聯邦模型aaa,這個模型再開放給各數據使用方aaaaa,達到數據的有效整合及使用aaa,能夠實現打通“數據孤島aaa。”


                                                                  然而aaa,在帶來效益的同時aaaaa,聯邦學習也可能給企業帶來額外成本aaa。具體來說aaa,參與者加入聯邦需要對聯邦做出貢獻aaaa,把加密後的數據貢獻給聯邦aaaaa,會產生數據成本和資金成本aaa,且不同質量的數據方加入聯邦、不同給時間節點加入聯盟的成本和效益可能不完全相同aaaaa。


                                                                  一個數據聯盟的可持續發展取決於其能否持續吸引高質量的個人機構數據持有人的參與”於涵教授強調aaaaa。


                                                                  4.webp

                                                                  於涵


                                                                  如何吸引高質量的個人機構數據參與進來aaaaa?在解答這個問題之前aaaa,瞭解收益分配博弈是很有必要的aaaaa。三類利潤分配博弈中的分配方案包括平均主義、邊際收益和邊際損失aaa。假設按照平均主義aaaaa,數據聯盟產生的收益在參與者中平均分配aaaaa,邊際收益則按照某個參與者加入聯盟時帶來的邊際收益確定他所應得的收益aaaa,邊際損失則按照某個參與者退出聯盟帶來的邊際損失確定他所應得的收益aaa;從系統角度考慮aaa,總體目標是最大化集體效用aaaa。


                                                                  這些分配方案都有各自的優劣aaaaa,如何尋找一種適合聯邦學習的分配方案aaa?答案是聯邦學習激勵機制aaaaa。數據聯盟參與者模型中核心問題是如何公平地對待參與者aaa,通過綜合考量數據方對聯盟的貢獻以及參與聯盟的代價aaaa,評估收益分配能否補齊成本aaa,即評估公平度目標aaaa。


                                                                  因此aaaaa,聯邦學習的解決方案是基於排隊系統爲公平度目標建模aaaa,通過保證排隊系統穩定aaaa,保證參與者等候全額補償的時間有限aaa。另外aaa,模型的公平性維度有三個aaaa,一是一個參與者所貢獻的數據爲聯邦模型帶來的邊際效益越高aaaa,他所應得得補償也越高aaaaa;二是“遺憾”度及等待時長應在所有參與者間儘量均勻分佈aaaa;公平性緯度三即在不同時間點之間aaaa,“遺憾”度及等待時長的變化儘量不要太劇烈最後在優化目標函數aaa。通過優化目標函數aaa,實現最大化公平度aaa。


                                                                  基於此aaaaa,聯邦學習激勵機制的利益分配方案是最大化數據聯盟的整體效用aaa,同時最小化參與者之間在“遺憾”和等待時長兩個維度的不均衡aaaaa。


                                                                  聯邦學習aaaaa,機遇與挑戰並存


                                                                  聯邦學習解決了在保證數據安全的前提下解決了“數據孤島”問題aaaaa,同時聯邦學習通過聯邦激勵機制實現參與方的收益分配儘可能公平aaaaa。在未來aaaa,聯邦學習還將帶給我們更多驚喜aaa,尤其在生態建設方面aaa,主要包括開源、技術標準和商業賦能等領域aaaa。


                                                                  在開源方面aaaaa,微衆銀行基於“聯邦學習”開發了聯盟AI系統並開源聯盟AI解決方案FATE(Federated AI Technology Enabler)aaa。作爲聯邦學習領域第一個商用級開源項目aaa,FATE爲開發者提供所必須的多方協同建模工作流管理、加密機器學習工具庫和並行計算基礎設施抽象三層能力aaa,同時提供了很多開箱即用的聯邦學習算法和聯邦遷移學習算法供開發者參考aaa,極大簡化了聯盟AI開發的流程並降低了部署難度aaaa。這項開源技術的產生極大降低了企業加入聯盟AI生態aaa,拓展合作協同式AI技術的門檻aaaa,爲企業技術合作aaaaa,協同建模aaa,共建生態奠定了技術基礎aaaa。


                                                                  在技術標準方面aaaa,2018年12月4日aaaaa,電氣和電子工程師協會標準委員會(IEEE Standard Association)批准由微衆銀行發起的關於聯邦學習架構和應用規範的標準P3652.1(Guide for Architectural Framework and Application of Federated Machine Learning)立項aaaaa。此次會議上aaaa,微衆銀行宣佈面向社會徵稿aaa,接收的優秀論文將受邀在IEEE Intelligent System 特刊發表aaa。


                                                                  5.webp張鈞波


                                                                  除了開源、技術標準外aaaaa,商業賦能更是另一重要方面aaaaa,尤其是新型智慧城市建設aaa。京東智能城市事業部AI平臺部負責人張鈞波向大家介紹了城市計算與跨越學習聯合建模aaaaa,城市計算(Urban Computing)通過城市數據的採集、管理、分析挖掘和服務提供aaa,解決交通、規劃、環境等問題aaaa。針對城市大數據具有時空動態、異構、多源等特性aaaaa,京東城市通過打造城市計算平臺和數字網關技術aaa,實現跨域學習聯合建模aaaaa,並提出聯邦隨機森林等模型aaa,打通數據壁壘aaaaa,解決數據孤島問題aaa。


                                                                  除了聯邦學習技術應用等主要議題之外aaaa,本次研討會還針對聯邦學習的學術研究以及基於數據隱私等現實案例問題邀請了第四範式的陳雨強博士和北京觀韜中茂(上海)律師事務所合夥人王渝偉律師做內容分享aaaaa,讓在場的聯邦學習愛好者們更深入地瞭解了聯邦學習技術aaaa。

                                                                  7

                                                                  陳雨強


                                                                  6

                                                                  王渝偉


                                                                  聯邦學習帶給我們更多驚喜的同時aaaa,也面臨諸多挑戰aaaa,如何避免模型攻擊和數據攻擊aaaaa,如何讓聯邦學習在安全合規前提下提高算法效率aaaaa,這需要學界與業界更多參與者共同探索aaaaa!