Huawei di Serdema Modelên Mezin de Hilberên Nû yên Hilberîna AI-ê ragihand

[Çîn, Shenzhen, 14ê Tîrmehê, 2023] Îro, Huawei çareseriya xweya hilanînê ya nû ya AI-yê ji bo serdema modelên mezin eşkere kir, ji bo perwerdehiya modela bingehîn, perwerdehiya modela taybetî-pîşesaziyê, û di senaryoyên dabeşkirî de çareseriyên hilanînê yên çêtirîn peyda dike, bi vî rengî kapasîteyên nû yên AI-ê derxistin.

Di pêşkeftin û pêkanîna sepanên modela mezin de, pargîdanî bi çar pirsgirêkên mezin re rû bi rû dimînin:

Ya yekem, dema ku ji bo amadekirina daneyê hewce dike dirêj e, çavkaniyên daneyê belav dibin, û kombûn hêdî ye, ji bo pêşîgirtina bi sedan terabyte daneyan nêzîkê 10 rojan digire. Ya duyemîn, ji bo modelên mezin ên pir-modal ên bi danehevên nivîs û wêneyan ên girseyî, leza barkirina heyî ya ji bo pelên piçûk ên girseyî ji 100MB/s kêmtir e, di encamê de ji bo barkirina koma perwerdehiyê karîgeriyek kêm heye. Ya sêyemîn, verastkirinên piralî yên parametreyê ji bo modelên mezin, ligel platformên perwerdehiyê yên ne aram, hema hema her 2 rojan dibe sedema qutbûna perwerdehiyê, hewce dike ku mekanîzmaya Checkpoint ji nû ve perwerdehiyê bide destpêkirin, digel ku başbûn rojekê digire. Di dawiyê de, bendavên pêkanîna bilind ên ji bo modelên mezin, sazkirina pergala tevlihev, kêşeyên plansazkirina çavkaniyê, û karanîna çavkaniya GPU bi gelemperî ji 40% di bin.

Huawei di serdema modelên mezin de bi meyla pêşkeftina AI-ê re hevaheng e, çareseriyên ku ji bo pîşesazî û senaryoyên cihêreng hatine çêkirin pêşkêşî dike. Ew OceanStor A310 Deep Learning Data Lake Storage û FusionCube A3000 Training/Inference Super-Converged Appliance destnîşan dike. OceanStor A310 Deep Learning Data Lake Storage hem senaryoyên gola daneya modela mezin a bingehîn û hem jî di asta pîşesaziyê de armanc dike, digihîje rêveberiya daneya AI-ê ya berfireh ji berhevkirina daneyan, pêşdibistanê heya perwerdehiya modelê, û sepanên encamdanê. OceanStor A310, di refikek 5U ya yekane de, 400 GB/s bandfirehiya pêşeng a pîşesaziyê û heya 12 mîlyon IOPS piştgirî dike, bi pîvana xêzikî heya 4096 nodeyan, danûstendina cross-protokola bêserûber dike. Pergala Pelê ya Gerdûnî (GFS) berhevkirina daneya aqilmend li seranserê herêman hêsan dike, pêvajoyên berhevkirina daneyan hêsan dike. Hesabkirina nêzê hilanînê pêş-pêvazkirina daneyê ya nêzik pêk tîne, tevgera daneyê kêm dike, û karbidestiya pêş-processing% 30 baştir dike.

FusionCube A3000 Training/Inference Super-Converged Appliance, ku ji bo senaryoyên perwerdehiya modela mezin a asta pîşesaziyê hatî sêwirandin, ji serîlêdanên ku modelên bi mîlyaran parametre re têkildar in vedihewîne. Ew girêkên hilanînê yên bi performansa bilind OceanStor A300, girêkên perwerdehî / encamgirtinê, alavên veguheztinê, nermalava platforma AI-ê, û nermalava rêveberî û xebitandinê yek dike, ji bo radestkirina yek-stop ezmûnek birêkûpêkkirina fîşa-û-play-ê ji hevkarên modela mezin re peyda dike. Amade ye ku bikar bîne, ew dikare di nav 2 demjimêran de were bicîh kirin. Hem girêkên perwerde / encam û hilanînê dikarin serbixwe û horizontî werin berfireh kirin da ku li gorî daxwazên pîvana modela cihêreng tevbigerin. Di vê navberê de, FusionCube A3000 konteynerên bi performansa bilind bikar tîne da ku gelek modelên perwerdehiyê û peywirên encamdanê bikar bîne da ku GPU-yê parve bike, karanîna çavkaniyê ji% 40 heya 70% zêde bike. FusionCube A3000 du modelên karsaziya maqûl piştgirî dike: Çareseriya Yek-Stop Huawei Ascend û çareseriya yek-stop hevparê sêyemîn bi nermalava vekirî, torê û platforma AI-ê.

Serokê Rêzeya Hilbera Hilberîna Daneyên Huawei Zhou Yuefeng got, "Di serdema modelên mezin de, dane bilindahiya îstîxbarata AI-ê diyar dike. Wekî hilgirê daneyê, hilanîna daneyê dibe binesaziya bingehîn a bingehîn ji bo modelên mezin ên AI. Huawei Data Storage dê nûvekirina xwe bidomîne, çareserî û hilberên cihêreng ji bo serdema modelên mezin ên AI-yê peyda bike, bi hevalbendan re hevkariyê bike da ku hêza AI-ê li seranserê cûrbecûr pîşesaziyan bimeşîne.


Dema şandinê: Tebax-01-2023