久久精品高清视频_久久久久国产成人精品亚洲午夜_免费日本一区_久久久久久穴

推廣 熱搜:   一元一分  昆山  血戰麻將群    麻將  品牌  梯子游戲  加工廠  冰球突破 

鼎盛公司上下分-微信【ds012044】

點擊圖片查看原圖
  • 發布日期:2023-07-15 16:14
  • 有效期至:長期有效
  • 商機區域:全國
  • 瀏覽次數12
  • 留言咨詢
詳細說明
 

“大模型時代,數據決定AI智能的高度。作為數據的載體,數據存儲成為AI大模型的關鍵基礎設施。”7月14日,華為數據存儲產品線總裁周躍峰在發布會上說道。

當天,華為發布大模型時代AI存儲新品,為基礎模型訓練、行業模型訓練,細分場景模型訓練推理提供存儲最優解,釋放AI新動能。

周躍峰告訴觀察者網等媒體,現在AI大模型非常熱門,但企業實施AI大模型的過程是一個復雜的系統過程,會面臨很多挑戰。具體來講,企業在開發及實施大模型應用過程中,面臨四大挑戰:

首先,數據準備時間長,數據來源分散,歸集慢,預處理百TB數據需10天左右;其次,多模態大模型以海量文本、圖片為訓練集,當前海量小文件的加載速度不足100MB/s,訓練集加載效率低;第三,大模型參數頻繁調優,訓練平臺不穩定,平均約2天出現一次訓練中斷,需要Checkpoint機制恢復訓練,故障恢復耗時超過一天;最后,大模型實施門檻高,系統搭建繁雜,資源調度難,GPU資源利用率通常不到40%。

華為數據存儲產品線總裁 周躍峰

周躍峰認為,目前大模型算力成本約占整個成本的25%,而數據清洗、預處理等工作,在不算數據存儲硬件的情況下,占到成本的22%。從這個角度看,數據機器存儲過程,在大模型時代越來越重要。這不僅僅是簡單的數據量變大,而且數據的處理過程,以及過程中對于硬件性能的要求越來越高。隨著大模型出現,數據存儲和處理相關領域未來會越來越有前景。

為順應大模型時代AI發展趨勢,華為針對不同行業、不同場景大模型應用,推出OceanStor A310深度學習數據湖存儲與FusionCube A3000訓/推超融合一體機。

OceanStor A310深度學習數據湖存儲,面向基礎/行業大模型數據湖場景,實現從數據歸集、預處理到模型訓練、推理應用的AI全流程海量數據管理。OceanStor A310單框5U支持業界最高的400GB/s帶寬以及1200萬IOPS的最高性能,可線性擴展至4096節點,實現多協議無損互通。全局文件系統GFS實現跨地域智能數據編織,簡化數據歸集流程;通過近存計算實現近數據預處理,減少數據搬移,預處理效率提升30 %。

FusionCube A3000訓/推超融合一體機,面向行業大模型訓練/推理場景,針對百億級模型應用,集成OceanStor A300高性能存儲節點、訓/推節點、交換設備、AI平臺軟件與管理運維軟件,為大模型伙伴提供拎包入住式的部署體驗,實現一站式交付。開箱即用,2小時內即可完成部署。訓/推節點與存儲節點均可獨立水平擴展,以匹配不同規模的模型需求。同時FusionCube A3000通過高性能容器實現多個模型訓練推理任務共享GPU,將資源利用率從40%提升到70%以上。FusionCube A3000支持兩種靈活的商業模式,包括華為昇騰一站式方案,以及開放計算、網絡、AI平臺軟件的第三方伙伴一站式方案。

“數據是很重要的,堪比人類發展歷史上的文字。”對于AI大模型的數據建設現狀,周躍峰認為,目前國內算力較多但存力較少,很多高價值的信息都沒有被記錄下來。

“目前ChatGPT英文大模型訓練效率高于中文的核心原因,就在于英文資料的數字化記錄遠遠多于中文,人工智能產業要得到高速的發展,一定要重視數據和信息的數字化的記錄。”他表示。

周躍峰還提到了未來AI大模型在數據建設方面亟待突破的三個要點:對原始數據進行預處理實現“數據更好用”、數據存儲與GPU更流暢地相配合、數據安全。

華為分布式存儲領域副總裁韓振興在會上表示,在算力和存力的建設過程中,一定是有一個最佳的算存比,并不是靠推算力就能把一個AI推得非常好。他認為,存力建設的落后可能加劇算力閑置,造成資源浪費;相反,高質量的存力將有助于提升AI訓練。

原文鏈接:http://www.525682.com/shangji/show-17479.html,轉載和復制請保留此鏈接。
以上就是關于鼎盛公司上下分-微信【ds012044】全部的內容,關注我們,帶您了解更多相關內容。
0相關評論
聯系方式
該企業最新商機
網站首頁  |  VIP套餐介紹  |  關于我們  |  聯系方式  |  手機版  |  版權隱私  |  SITEMAPS  |  網站地圖  |  排名推廣  |  廣告服務  |  積分換禮  |  網站留言  |  RSS訂閱  |  違規舉報