„Nebius“ stiprina pozicijas: už pusę milijardo eurų perkama DI našumo technologija
Europos DI infrastruktūros bendrovė „Nebius“ pranešė įsigijusi JAV startuolį „Eigen AI“, kuris specializuojasi atvirojo kodo DI modelių našumo gerinime. Sandoris, kaip skelbiama, siekia apie 595 mln. eurų ir bus atsiskaityta grynaisiais bei akcijomis.
Amsterdame įsikūrusi „Nebius“ valdo ir vysto duomenų centrus, kuriuose diegiami GPU spartintuvai, o jų skaičiavimo pajėgumai nuomojami DI ir verslo klientams. Tokį modelį rinka dažnai vadina neocloud, kai alternatyvūs debesų paslaugų teikėjai koncentruojasi į DI darbo krūvius ir specializuotą programinę įrangą.
Kodėl inferencija tampa svarbiausia?
„Eigen AI“ technologija orientuota į inferenciją, kai apmokytas modelis taikomas realiems duomenims ir generuoja atsakymus ar sprendimus. Pastaraisiais metais būtent inferencija sparčiai auga, nes įmonėms vis dažniau reikia ne apmokyti modelius nuo nulio, o patikimai ir pigiau juos paleisti produktuose bei vidiniuose procesuose.
„Nebius“ teigimu, „Eigen AI“ sprendimai leidžia efektyviau išnaudoti vadinamuosius žetonus, tai yra modelio apdorojamus duomenų vienetus, nuo kurių tiesiogiai priklauso skaičiavimo sąnaudos. Praktikoje tai reiškia didesnį pralaidumą ir mažesnę vienos užklausos kainą be papildomo inžinerinio sudėtingumo klientų pusėje.
Kas tiksliai perkama kartu su technologija?
Kartu su produktu „Nebius“ įsigyja ir maždaug 20 žmonių „Eigen AI“ komandą, kurią bendrovė apibūdino kaip aukšto lygio inferencijos tyrėjų ir inžinierių grupę. Skelbiama, kad „Eigen AI“ įkūrėjai įkurs „Nebius“ inžinerijos ir tyrimų padalinį San Francisko įlankos regione.
Startuolio įkūrėjai Ryanas Hanrui Wangas ir Wei-Chen Wangas anksčiau dirbo MIT HAN Lab, kuriam vadovauja profesorius Song Han, žinomas modelių efektyvumo ir skaičiavimo optimizavimo tyrimais. Tokia kompetencija rinkoje ypač vertinama, nes našumo didinimas dažnai priklauso ne nuo vieno algoritmo, o nuo gilaus aparatinės ir programinės įrangos suderinimo.
Integracija į „Nebius“ produktus ir poveikis klientams
„Nebius“ nurodo, kad „Eigen AI“ optimizavimo sluoksnis bus integruotas tiesiai į „Nebius Token Factory“ ir taip turėtų mažinti inferencijos siaurąsias vietas, susijusias su atmintimi, maršrutizavimu ir skaičiavimu. Tokie trikdžiai dažnai pasireiškia, kai modeliai didėja, o užklausų srautai tampa nepastovūs ir sunkiai prognozuojami.
„Integruodama „Eigen AI“ optimizavimo sluoksnį tiesiai į „Nebius Token Factory“, „Nebius“ pašalina šį butelio kaklelį per visą gyvavimo ciklą“, – teigė bendrovė.
Įmonės vertinimu, tai klientams turėtų reikšti greitesnį sprendimų diegimą į gamybą, geresnę vieneto ekonomiją ir galimybę sparčiau pereiti prie naujų modelių. Praktinis poveikis bus ypač aktualus įmonėms, kurios diegia DI klientų aptarnavime, paieškoje, turinio generavime, duomenų analizėje ir automatizuotame dokumentų apdorojime.