Nehêlin ku hilanîn di Perwerdehiya Modelê de bibe astengiya sereke

Hate gotin ku pargîdaniyên teknolojiyê an ji bo GPU-yan dikevin an jî li ser riya bidestxistina wan digerin. Di meha Nîsanê de, CEO yê Tesla Elon Musk 10,000 GPU kirî û diyar kir ku pargîdanî dê berdewam bike ku hejmareke mezin a GPU ji NVIDIA bikire. Di aliyê pargîdaniyê de, personelên IT-ê di heman demê de zorê dikişînin ku pê ewle bibin ku GPU bi domdarî têne bikar anîn da ku vegerandina veberhênanê zêde bikin. Lêbelê, hin pargîdan dikarin bibînin ku dema ku hejmara GPU zêde dibe, betaliya GPU girantir dibe.

Ger dîrok di derheqê hesabkirina performansa bilind (HPC) de tiştek fêrî me kir, ew e ku hilanîn û torê neyên qurban kirin ku pir zêde li ser hesabkirinê hûr bibin. Ger hilanîn nekare bi bandor daneyan veguhezîne yekîneyên hesabkeriyê, hetta di cîhanê de herî zêde GPU-yên we hebin, hûn ê negihîştina karîgeriya herî baş.

Li gorî Mike Matchett, analîstek li Small World Big Data, modelên piçûktir dikarin di bîranînê (RAM) de bêne darve kirin, û dihêle ku bêtir balê li ser hesabkirinê bide. Lêbelê, modelên mezintir ên mîna ChatGPT bi mîlyaran girêk ji ber lêçûna zêde nekarin di bîranînê de werin hilanîn.

"Hûn nekarin bi mîlyaran girêk di bîranînê de bicîh bikin, ji ber vê yekê hilanîn hîn girîngtir dibe," Matchett dibêje. Mixabin, hilanîna daneyê pir caran di dema pêvajoya plansaziyê de têne paşguh kirin.

Bi gelemperî, bêyî doza karanîna, di pêvajoya perwerdehiya modelê de çar xalên hevpar hene:

1. Perwerdehiya Modelê
2. Serlêdana Encam
3. Data Storage
4. Accelerated Computing

Dema ku modelan diafirînin û bicîh dikin, pir hewcedarî pêşî li delîlên têgînê (POC) an jîngehên ceribandinê digirin da ku perwerdehiya modelê bidin destpêkirin, digel ku hewcedariyên hilanîna daneyê ne girîng e.

Lêbelê, kêşe di vê rastiyê de ye ku perwerdehî an belavkirina encamnameyê dikare bi mehan an jî salan bidome. Gelek pargîdanî di vê demê de bi lez mezinahiyên modela xwe mezin dikin, û pêdivî ye ku binesaziyek berfireh bibe da ku model û berhevokên mezinbûyî bicîh bîne.

Lêkolîna Google li ser bi mîlyonan barkêşên perwerdehiya ML-ê diyar dike ku bi navînî% 30 ji dema perwerdehiyê li ser xeta daneya têketinê derbas dibe. Digel ku lêkolîna paşîn balê dikişîne ser xweşbînkirina GPU-yan da ku perwerdehiyê bileztir bike, hîn jî gelek pirsgirêk di xweşbînkirina beşên cihêreng ên lûleya daneyê de dimînin. Gava ku we hêza hesabkerî ya girîng hebe, tengahiya rastîn dibe ku hûn çiqas zû dikarin daneyan têxin nav hesaban da ku encaman bistînin.

Bi taybetî, kêşeyên di hilanîn û rêvebirina daneyê de ji bo mezinbûna daneyê plansaziyek hewce dike, ku dihêle hûn her ku hûn pêşde diçin nirxa daneyan bi domdarî derxînin, nemaze dema ku hûn dikevin nav dozên karanîna pêşkeftî yên wekî fêrbûna kûr û torên neuralî, yên ku daxwazên bilindtir li ser dikin. hilanîn di warê kapasîteyê, performansê û mezinbûnê de.

Gelek rindik:

Scalability
Fêrbûna makîneyê pêdivî ye ku meriv jimarek mezin a daneyan bigire, û her ku hêjmara daneyê zêde dibe, rastbûna modelan jî baştir dibe. Ev tê vê wateyê ku karsazî divê her roj bêtir daneyan berhev bikin û hilînin. Gava ku hilanînê nikaribe pîvanê bike, barkêşên xebata dane-zirav tengasiyan diafirînin, performansê sînordar dikin û di encamê de dema bêkar a GPU-yê biha dibe.

Flexibility
Piştgiriya maqûl a ji bo pir protokolan (tevî NFS, SMB, HTTP, FTP, HDFS, û S3) hewce ye ku hewcedariyên pergalên cihêreng bicîh bîne, ne ku bi yek celebek hawîrdorê ve were sînorkirin.

Latency
Derengiya I/O ji bo çêkirin û karanîna modelan girîng e ji ber ku dane gelek caran têne xwendin û ji nû ve têne xwendin. Kêmkirina derengiya I/O dikare dema perwerdehiya modelan bi roj an mehan kurt bike. Pêşveçûna modela bilez rasterast bi avantajên karsaziyê yên mezintir vedigere.

Rêwîtiyê
Rêbaza pergalên hilanînê ji bo perwerdehiya modela bikêr girîng e. Pêvajoyên perwerdehiyê mîqdarên mezin ên daneyê, bi gelemperî di saetekê de terabytes vedihewîne.

Gihîştina Parallel
Ji bo gihîştina berbi bilind, modelên perwerdehiyê çalakiyan li gelek karên paralel dabeş dikin. Ev bi gelemperî tê vê wateyê ku algorîtmayên fêrbûna makîneyê bi hevdemî digihîjin heman pelan ji pir pêvajoyan (bi potansiyel li ser gelek pêşkêşkerên laşî). Pergala hilanînê pêdivî ye ku daxwazên hevdemî bêyî tawîzkirina performansê bigire dest.

Dell PowerScale digel kapasîteyên xwe yên berbiçav ên di derengiya kêm, berbi bilind, û I/O-ya paralel a mezin de, pêvek hilanînê ya îdeal e ji bo hesabkirina GPU-lezkirî. PowerScale bi bandor dema ku hewce dike ji bo modelên analîzê yên ku berhevokên pir-terabyte perwerde dikin û ceribandin kêm dike. Di hilanîna tev-flash PowerScale de, firehiya bandê 18 qat zêde dibe, kelûpelên I/O ji holê radike, û dikare li komikên Isilon-ê yên heyî were zêdekirin da ku nirxa mîqdarên mezin ên daneya nesazkirî bilezîne û veke.

Digel vê yekê, kapasîteyên gihîştina pir-protokolê ya PowerScale ji bo xebitandina barkêşên xebatê nermbûnek bêsînor peyda dike, dihêle ku daneyan bi karanîna protokolek were hilanîn û bi karanîna din ve were gihîştin. Bi taybetî, taybetmendiyên hêzdar, nermbûn, berbelavbûn, û fonksiyona pola pargîdanî ya platforma PowerScale alîkariya çareserkirina pirsgirêkên jêrîn dike:

- Nûjeniyê heya 2,7 carî bilezînin, çerxa perwerdehiya modelê kêm bikin.

- Girtiyên I/O ji holê rakin û perwerde û rastkirina modela bileztir peyda bikin, rastbûna modelê çêtir bikin, hilberdariya zanistiya daneyê zêde bikin, û bi karanîna taybetmendiyên pola pargîdanî, performansa bilind, hevdemî, û pîvandinê ve vegera herî zêde li ser veberhênanên hesabkirinê peyda bikin. Rastiya modelê bi danehevên kûrtir û bi rezîliya bilindtir bi karanîna heya 119 PB kapasîteya hilanînê ya bi bandor di yek komê de zêde bikin.

- Bi destpêkirina pîvana piçûk û serbixwe ya hesab û hilanînê, bi peydakirina parastina daneyan û vebijarkên ewlehiyê yên zexm, bicîhkirina di pîvanê de bi dest bixin.

- Berhemdariya zanistiya daneyê bi analîtîkên li cîh û çareseriyên pejirandî yên ji bo bicîhkirina zûtir û kêm-rîsk çêtir bikin.

- Karanîna sêwiranên îsbatkirî yên ku li ser bingeha teknolojiyên herî baş-ne, di nav de lezkirina NVIDIA GPU û mîmariyên referansê bi pergalên NVIDIA DGX re. Performansa bilind û hevdemiya PowerScale di her qonaxek fêrbûna makîneyê de, ji wergirtina daneyan û amadekirinê heya perwerdehiya modelê û encamgirtinê, hewcedariyên performansa hilanînê pêk tîne. Bi pergala xebitandinê ya OneFS re, hemî girêk dikarin bêkêmasî di nav heman komê ya OneFS-a ajoker de, bi taybetmendiyên asta pargîdanî yên wekî rêveberiya performansê, rêveberiya daneyê, ewlehî û parastina daneyê re tevbigerin, ku ji bo karsaziyan bi leztir temamkirina perwerdehiya modelê û pejirandinê pêk tîne.


Dema şandinê: Tîrmeh-03-2023