技術(shù)
導(dǎo)讀:聯(lián)合學(xué)習(xí)由Google在2017年提出構(gòu)想,是一種去中心化的學(xué)習(xí)模型,通過(guò)該模型可以在邊緣設(shè)備上訓(xùn)練算法。
隨著全世界的開(kāi)發(fā)團(tuán)隊(duì)爭(zhēng)相開(kāi)發(fā)AI工具,在邊緣設(shè)備上訓(xùn)練算法變得越來(lái)越普遍。聯(lián)合學(xué)習(xí)是分布式機(jī)器學(xué)習(xí)的子集,是一種相對(duì)較新的方法,它允許企業(yè)在不直接訪問(wèn)原始用戶數(shù)據(jù)的情況下改進(jìn)其AI工具。
聯(lián)合學(xué)習(xí)由Google在2017年提出構(gòu)想,是一種去中心化的學(xué)習(xí)模型,通過(guò)該模型可以在邊緣設(shè)備上訓(xùn)練算法。關(guān)于Google的“設(shè)備上機(jī)器學(xué)習(xí)”方法,這家搜索巨頭將其預(yù)測(cè)文本算法推到了Android設(shè)備上,匯總了數(shù)據(jù),并將新知識(shí)的摘要發(fā)送回了中央服務(wù)器。為了保護(hù)用戶數(shù)據(jù)的完整性,此數(shù)據(jù)是通過(guò)同態(tài)加密或差分隱私傳遞的,這是對(duì)數(shù)據(jù)添加噪聲以使結(jié)果模糊的一種做法。
一般而言,通過(guò)聯(lián)合學(xué)習(xí),可以對(duì)AI算法進(jìn)行訓(xùn)練,而無(wú)需識(shí)別任何單個(gè)用戶的特定數(shù)據(jù)。實(shí)際上,原始數(shù)據(jù)永遠(yuǎn)不會(huì)離開(kāi)設(shè)備本身。僅匯總的模型更新會(huì)發(fā)回。這些模型更新隨后在交付到中央服務(wù)器后解密。然后,將更新后的模型的測(cè)試版本發(fā)送回選定的設(shè)備,并且在重復(fù)此過(guò)程數(shù)千次之后,顯著改善了AI算法,同時(shí)又不會(huì)危及用戶隱私。
預(yù)計(jì)該技術(shù)將在醫(yī)療保健領(lǐng)域掀起波瀾。例如,醫(yī)療初創(chuàng)公司Owkin目前正在探索聯(lián)合學(xué)習(xí)。為了利用來(lái)自多個(gè)醫(yī)療機(jī)構(gòu)的患者數(shù)據(jù),Owkin使用聯(lián)合學(xué)習(xí)來(lái)利用來(lái)自不同醫(yī)院的數(shù)據(jù)來(lái)構(gòu)建AI算法。這可能會(huì)產(chǎn)生深遠(yuǎn)的影響,尤其是醫(yī)院在保持患者數(shù)據(jù)的完整性并遵守HIPAA法規(guī)的前提下,能夠相互共享疾病進(jìn)展數(shù)據(jù)非常寶貴。絕非唯一的醫(yī)療行業(yè)采用這項(xiàng)技術(shù)。自動(dòng)駕駛汽車公司,智慧城市,無(wú)人機(jī)和金融科技組織將越來(lái)越多地使用聯(lián)合學(xué)習(xí)。其他一些聯(lián)合學(xué)習(xí)型初創(chuàng)公司也正在上市,包括Snips,S20.ai和Xnor.ai,后者最近被Apple收購(gòu)。
潛在問(wèn)題
中間人攻擊
鑒于這些AI算法值得大量投資,因此預(yù)計(jì)這些模型將成為黑客的攻擊目標(biāo)。那些邪惡的人將嘗試進(jìn)行中間人攻擊。但是,如前所述,通過(guò)添加噪聲并聚集來(lái)自各種設(shè)備的數(shù)據(jù),然后對(duì)該聚集的數(shù)據(jù)進(jìn)行加密,企業(yè)可能會(huì)使黑客感到困難。
模型中毒
可能更令人擔(dān)憂的是使模型本身中毒的攻擊??梢韵胂?,黑客可以通過(guò)自己的設(shè)備或通過(guò)接管網(wǎng)絡(luò)上其他用戶的設(shè)備來(lái)破壞模型。具有諷刺意味的是,由于聯(lián)合學(xué)習(xí)聚合了來(lái)自不同設(shè)備的數(shù)據(jù)并將加密的摘要發(fā)送回中央服務(wù)器,因此通過(guò)后門進(jìn)入的黑客得到了一定程度的掩蓋。因此,很難(即使不是不可能)識(shí)別異常的位置。
帶寬和處理限制
盡管設(shè)備上機(jī)器學(xué)習(xí)在不暴露原始用戶數(shù)據(jù)的情況下有效地訓(xùn)練了算法,但它確實(shí)需要大量的本地功能和內(nèi)存。企業(yè)試圖通過(guò)僅在設(shè)備空閑、充電或連接到Wi-Fi時(shí)在邊緣上訓(xùn)練其AI算法來(lái)規(guī)避這一問(wèn)題;但是,這是一個(gè)永恒的挑戰(zhàn)。
5G的影響
隨著5G在全球的擴(kuò)展,邊緣設(shè)備將不再受到帶寬和處理速度限制的限制。根據(jù)諾基亞最近的一份報(bào)告,每平方公里4G基站可以支持100000個(gè)設(shè)備。而即將到來(lái)的5G站將在同一地區(qū)支持多達(dá)100萬(wàn)個(gè)設(shè)備。通過(guò)增強(qiáng)的移動(dòng)寬帶和低延遲,5G將提供能源效率,同時(shí)促進(jìn)設(shè)備到設(shè)備通信(D2D)。實(shí)際上,據(jù)預(yù)測(cè),5G將帶來(lái)10-100倍的帶寬增加和5-10倍的等待時(shí)間減少。
隨著5G的普及,我們將體驗(yàn)到更快的網(wǎng)絡(luò),更多的端點(diǎn)和更大的攻擊面,這可能會(huì)吸引大量DDoS攻擊。此外,5G具有切片功能,該功能允許根據(jù)用戶的需要輕松地創(chuàng)建、修改和刪除切片(虛擬網(wǎng)絡(luò))。根據(jù)有關(guān)5G破壞力的研究手稿,該網(wǎng)絡(luò)切片組件是否能夠緩解安全隱患或帶來(lái)許多新問(wèn)題還有待觀察。
總而言之,從隱私和安全角度來(lái)看,都存在新的問(wèn)題;然而,事實(shí)仍然存在:5G最終將成為聯(lián)合學(xué)習(xí)的福音。