环球电气之家-午夜精彩视频-中国专业电气电子产品行业服务网站!

產(chǎn)品分類

當(dāng)前位置: 首頁 > 工業(yè)控制產(chǎn)品 > 自動化控制 > 人工智能

類型分類:
科普知識
數(shù)據(jù)分類:
人工智能

Think 2018背后:IBM占據(jù)人工智能訓(xùn)練的優(yōu)勢

發(fā)布日期:2022-10-09 點(diǎn)擊率:42


本文重點(diǎn)介紹IBM上周在Think 2018大會上各種公告背后的機(jī)器學(xué)習(xí)(ML)工作,這方面的工作很快將進(jìn)一步加速Watson和PowerAI的訓(xùn)練性能。這恰巧突出了IBM與NVIDIA的合作伙伴關(guān)系,以及NVIDIA針對GPU的NVlink互連技術(shù)。

blob.png

去年,IBM曾有一篇論文提到了如何在不到一小時(shí)的時(shí)間內(nèi)、高達(dá)95%的擴(kuò)展效率以及75%的準(zhǔn)確率訓(xùn)練機(jī)器學(xué)習(xí)圖像分類模型,采用了和Facebook用于訓(xùn)練一樣的數(shù)據(jù)集。2017年上半年,IBM使用面向高性能計(jì)算系統(tǒng)的基于POWER8的64位Power System S822LC運(yùn)行了這一訓(xùn)練基準(zhǔn)測試。這些系統(tǒng)中的每一個(gè)都有采用4個(gè)NVIDIA Tesla P100 SXM2連接的GPU,并使用IBM的PowerAI軟件平臺和Distributed Deep Learning (DDL)。

IBM的新論文“Snap Machine Learning”描述了一種新的IBM機(jī)器學(xué)習(xí)庫,可以更有效地利用可用的網(wǎng)絡(luò)、內(nèi)存和異構(gòu)計(jì)算資源,進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練任務(wù),也是基于基于一個(gè)新的平臺——IBM Power Systems AC922服務(wù)器。IBM AC922通過NVIDIA最新的NVlink 2.0接口,將4個(gè)SXM2連接的NVIDIA Tesla V100 GPU連接到雙POWER9處理器。

blob.png

IBM研究員兼IBM研究院加速認(rèn)知基礎(chǔ)架構(gòu)總監(jiān)Hillery Hunter談到了IBM為Snap Snap ML提高性能所做出的貢獻(xiàn):

- 更有效地將機(jī)器學(xué)習(xí)訓(xùn)練算法映射到大規(guī)模并行的GPU微架構(gòu)

- 更有效地從單一服務(wù)器機(jī)箱擴(kuò)展到一個(gè)服務(wù)器集群

- 通過最小化異構(gòu)處理節(jié)點(diǎn)(經(jīng)典處理器和GPU)與動態(tài)內(nèi)存調(diào)度器之間的通信,來改進(jìn)內(nèi)存管理,該調(diào)度器可將數(shù)據(jù)從處理器推測性地移動到GPU內(nèi)存(反之亦然)

- IBM集成了NVIDIA NVlink互連技術(shù),讓IBM POWER9能夠更快地與NVIDIA Tesla V100進(jìn)行通信,目前這已經(jīng)在IBM Power Systems AC922中支持了。

最終結(jié)果是,原來需要花費(fèi)數(shù)小時(shí)的訓(xùn)練任務(wù),現(xiàn)在在幾秒鐘內(nèi)就可以完成,而且不會降低準(zhǔn)確性。這是有可能實(shí)現(xiàn)的,因?yàn)镾nap可以更有效地分配和加速這些任務(wù)。Snap將加速多種邏輯和線性回歸分析,包括深度學(xué)習(xí)任務(wù)。

blob.png

IBM聲稱使用Criteo Labs在線廣告訓(xùn)練數(shù)據(jù)集的機(jī)器學(xué)習(xí)訓(xùn)練記錄比之前發(fā)布的記錄提高了46倍,訓(xùn)練準(zhǔn)確性沒有任何損失。之前的結(jié)果是在一年前發(fā)布的,但更重要的是,Google使用純處理器的云虛擬機(jī)(VM)實(shí)例就實(shí)現(xiàn)了該結(jié)果。Google可以輕松組裝60個(gè)工作虛擬機(jī)實(shí)例和29個(gè)參數(shù)虛擬機(jī)實(shí)例(總共89個(gè)云處理器實(shí)例)進(jìn)行訓(xùn)練。

然而,即使在一年前,Google的結(jié)果也是一個(gè)暴力擴(kuò)展處理器資源的示范,還有一個(gè)問題“為什么只用處理器周期進(jìn)行訓(xùn)練?”。在Google公布使用Criteo Labs訓(xùn)練數(shù)據(jù)集結(jié)果的時(shí)候,還沒有發(fā)出最初的TensorFlow處理單元(TPU)。也許這就是Google為什么不使用TPU來生成(當(dāng)時(shí))紀(jì)錄結(jié)果的原因。

一年后,IBM僅使用4臺Power System AC922服務(wù)器,每臺服務(wù)器包含2個(gè)POWER9處理器和4個(gè)NVIDIA Tesla V100 GPU,就擊敗了Google的紀(jì)錄。這個(gè)結(jié)果是將89個(gè)云虛擬機(jī)實(shí)例與安裝在4個(gè)服務(wù)器機(jī)箱(8個(gè)處理器和16個(gè)GPU)中的總計(jì)24個(gè)計(jì)算元件進(jìn)行比較,速度提高了46倍。

在關(guān)于Snap的論文中,IBM還將C9000服務(wù)器與基于英特爾處理器的主流服務(wù)器(使用Criteo Terabyte Click Log子集——前2億個(gè)訓(xùn)練樣例,一個(gè)合理大小的子集)進(jìn)行了直接比較。測試的系統(tǒng)是:

- 雙路Power System AC922服務(wù)器,采用的POWER9處理器通過NVlink 2.0連接至4個(gè)NVIDIA Tesla V100 GPU,但僅使用其中一個(gè)GPU進(jìn)行比較

- 采用英特爾至強(qiáng)Gold 6150處理器的雙路槽服務(wù)器,通過PCIe 3.0連至1個(gè)NVIDIA Tesla V100 GPU

IBM測量了通過NVlink 2.0連接的AC922系統(tǒng)有效帶寬為68.1GB/s,通過PCIe 3.0連接、基于英特爾處理器的系統(tǒng)有效帶寬為11.8GB / s。對于使用NVlink 2.0的AC922系統(tǒng)來說,這是一個(gè)5.8x處理器與GPU互連相比的優(yōu)勢。

Snap ML可管理處理器和GPU之間的數(shù)據(jù)移動。由于使用NVlink的數(shù)據(jù)傳輸速度幾乎快了6倍,所以Snap可以將處理器和GPU之間的數(shù)據(jù)拷貝時(shí)間隱藏在處理器和GPU的數(shù)據(jù)處理時(shí)間之后。

結(jié)果是,使用Power Systems AC922服務(wù)器的實(shí)際測量訓(xùn)練時(shí)間加速了3.5倍多,每個(gè)系統(tǒng)只使用1個(gè)GPU。

數(shù)據(jù)移動嚴(yán)重影響了機(jī)器學(xué)習(xí)的性能;測量跨NVlink的單個(gè)GPU的性能,與跨PCIe的單個(gè)GPU的性能之間的關(guān)系,應(yīng)該擴(kuò)展到對比使用這些連接的多個(gè)GPU。但是,此測試很好地表明,使用由NVlink連接的IBM POWER9處理器,相對4個(gè)或更多NVIDIA Tesla GPU集群仍應(yīng)具有可衡量的優(yōu)勢。該測試還強(qiáng)調(diào)了對標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)基準(zhǔn)測試的需求,該基準(zhǔn)測試能夠在使用真實(shí)應(yīng)用的服務(wù)器之間進(jìn)行直接比較。

訓(xùn)練時(shí)間提速3.5倍,這與整體基準(zhǔn)測試的性能領(lǐng)先同樣重要。

目前還沒有其他處理器制造商將NVIDIA NVlink互連技術(shù)直接集成到處理器套件中,所有競爭的服務(wù)器生態(tài)系統(tǒng)都依賴于PCIe互連。直接訪問NVlink和Snap ML軟件架構(gòu)都有助于加速訓(xùn)練。

在上周的Think 2018大會,IBM和蘋果公司宣布推出了IBM Watson Services for Core ML。這讓蘋果與IBM近4年的合作伙伴關(guān)系邁向了一個(gè)新的階段,讓蘋果iOS軟件開發(fā)人員能夠使用IBM領(lǐng)先的人工智能和機(jī)器學(xué)習(xí)開發(fā)環(huán)境,以及云訓(xùn)練支持。雙方將IBM Watson擴(kuò)展到在蘋果非常成功的消費(fèi)設(shè)備生態(tài)系統(tǒng)上運(yùn)行機(jī)器學(xué)習(xí)推理任務(wù)。更快速地培訓(xùn)機(jī)器學(xué)習(xí)模型,意味著可以為邊緣設(shè)備(如基于iOS的智能手機(jī))的推測任務(wù)提供更新的模型。

Snap ML將在今年晚些時(shí)候作為IBM PowerAI技術(shù)預(yù)覽組合的一部分問上市。

機(jī)器學(xué)習(xí)的訓(xùn)練時(shí)間提高3.5倍,這與整體基準(zhǔn)測試的性能領(lǐng)先同樣重要。

下一篇: PLC、DCS、FCS三大控

上一篇: 索爾維全系列Solef?PV

推薦產(chǎn)品

更多
主站蜘蛛池模板: lcd条形屏-液晶长条屏-户外广告屏-条形智能显示屏-深圳市条形智能电子有限公司 | 脑钠肽-白介素4|白介素8试剂盒-研域(上海)化学试剂有限公司 | 安徽合肥项目申报咨询公司_安徽合肥高新企业项目申报_安徽省科技项目申报代理 | 常州企业采购平台_常州MRO采购公司_常州米孚机电设备有限公司 | 杭州高温泵_热水泵_高温油泵|昆山奥兰克泵业制造有限公司 | 震动筛选机|震动分筛机|筛粉机|振筛机|振荡筛-振动筛分设备专业生产厂家高服机械 | 欧美日韩国产一区二区三区不_久久久久国产精品无码不卡_亚洲欧洲美洲无码精品AV_精品一区美女视频_日韩黄色性爱一级视频_日本五十路人妻斩_国产99视频免费精品是看4_亚洲中文字幕无码一二三四区_国产小萍萍挤奶喷奶水_亚洲另类精品无码在线一区 | 除湿机|工业除湿机|抽湿器|大型地下室车间仓库吊顶防爆除湿机|抽湿烘干房|新风除湿机|调温/降温除湿机|恒温恒湿机|加湿机-杭州川田电器有限公司 | 建筑资质代办-建筑资质转让找上海国信启航 | 植筋胶-粘钢胶-碳纤维布-碳纤维板-环氧砂浆-加固材料生产厂家-上海巧力建筑科技有限公司 | 精密五金加工厂-CNC数控车床加工_冲压件|蜗杆|螺杆加工「新锦泰」 | 恒温槽_恒温水槽_恒温水浴槽-上海方瑞仪器有限公司 | 恒温振荡混匀器-微孔板振荡器厂家-多管涡旋混匀器厂家-合肥艾本森(www.17world.net) | 高铝矾土熟料_细粉_骨料_消失模_铸造用铝矾土_铝酸钙粉—嵩峰厂家 | PSI渗透压仪,TPS酸度计,美国CHAI PCR仪,渗透压仪厂家_价格,微生物快速检测仪-华泰和合(北京)商贸有限公司 | 马尔表面粗糙度仪-MAHR-T500Hommel-Mitutoyo粗糙度仪-笃挚仪器 | 切铝机-数控切割机-型材切割机-铝型材切割机-【昆山邓氏精密机械有限公司】 | 广州中央空调回收,二手中央空调回收,旧空调回收,制冷设备回收,冷气机组回收公司-广州益夫制冷设备回收公司 | 金属切削液-脱水防锈油-电火花机油-抗磨液压油-深圳市雨辰宏业科技发展有限公司 | 印刷人才网 印刷、包装、造纸,中国80%的印刷企业人才招聘选印刷人才网! | 高考志愿规划师_高考规划师_高考培训师_高报师_升学规划师_高考志愿规划师培训认证机构「向阳生涯」 | 浇注料-高铝砖耐火砖-郑州凯瑞得窑炉耐火材料有限公司 | 涡轮流量计_LWGY智能气体液体电池供电计量表-金湖凯铭仪表有限公司 | 全自动过滤器_反冲洗过滤器_自清洗过滤器_量子除垢环_量子环除垢_量子除垢 - 安士睿(北京)过滤设备有限公司 | 云南标线|昆明划线|道路标线|交通标线-就选云南云路施工公司-云南云路科技有限公司 | 工控机-图像采集卡-PoE网卡-人工智能-工业主板-深圳朗锐智科 | 商标转让-商标注册-商标查询-软著专利服务平台 - 赣江万网 | 黑田精工电磁阀-CAMMOZI气缸-ROSS电磁-上海茂硕机械设备有限公司 | 理化生实验室设备,吊装实验室设备,顶装实验室设备,实验室成套设备厂家,校园功能室设备,智慧书法教室方案 - 东莞市惠森教学设备有限公司 | 食品级焦亚硫酸钠_工业级焦亚硫酸钠_焦亚硫酸钠-潍坊邦华化工有限公司 | 丝印油墨_水性油墨_环保油墨油漆厂家_37国际化工 | 大型果蔬切片机-水果冬瓜削皮机-洗菜机切菜机-肇庆市凤翔餐饮设备有限公司 | 密集柜_档案密集柜_智能密集架_密集柜厂家_密集架价格-智英伟业 密集架-密集柜厂家-智能档案密集架-自动选层柜订做-河北风顺金属制品有限公司 | 东亚液氮罐-液氮生物容器-乐山市东亚机电工贸有限公司 | 垃圾处理设备_餐厨垃圾处理设备_厨余垃圾处理设备_果蔬垃圾处理设备-深圳市三盛环保科技有限公司 | 货车视频监控,油管家,货车油管家-淄博世纪锐行电子科技 | 飞行者联盟-飞机模拟机_无人机_低空经济_航空技术交流平台 | 暖气片十大品牌厂家_铜铝复合暖气片厂家_暖气片什么牌子好_欣鑫达散热器 | 东莞画册设计_logo/vi设计_品牌包装设计 - 华略品牌设计公司 | 管家婆-管家婆软件-管家婆辉煌-管家婆进销存-管家婆工贸ERP | 登车桥动力单元-非标液压泵站-非标液压系统-深圳市三好科技有限公司 |