„Alibaba” skyrė 290 mln. dolerių „ShengShu” – startuoliui, kuriančiam DI alternatyvą „ChatGPT”

2026-04-13, 22:15 3 min. skaitymo 0

Pekinas – „Alibaba“ debesijos padalinys investuoja į naujo tipo dirbtinį intelektą, kuris turėtų tiksliau atkartoti realų pasaulį ir remiasi kitokiu principu nei pokalbių robotai, tokie kaip „OpenAI“ „ChatGPT“.

Toks posūkis siejamas su vadinamųjų didžiųjų kalbos modelių (LLM), kurie daugiausia mokomi iš tekstų, ribotumais. Vietoje to kūrėjai vis dažniau dėmesį telkia į vadinamuosius pasaulio modelius, kurių pagrindas – vaizdo įrašai ir realaus gyvenimo fizinės situacijos.

Norėdama prisijungti prie šios tendencijos, „Alibaba“ pranešė vadovavusi 2 mlrd. juanių (apie 290 mln. JAV dolerių) investicijai į „ShengShu“ – startuolį, sukūrusį dirbtinio intelekto vaizdo generavimo įrankį „Vidu“. Serijos B finansavimo etape taip pat dalyvavo „TAL Education“ ir „Baidu Ventures“.

Ši investicija paskelbta praėjus maždaug dviem mėnesiams po to, kai „ShengShu“ pritraukė 600 mln. juanių iš „Qiming Venture Partners“ ir kitų investuotojų. Startuolis savo vertinimo neatskleidė.

„ShengShu“ teigimu, naujausios lėšos bus skirtos kurti „bendrą pasaulio modelį“, kuris pasitelkdamas dirbtinį intelektą sujungtų dvi šiuo metu atskiras sritis: skaitmeninį pasaulį (žaidimus ir DI generuojamus vaizdo įrašus) bei fizinį pasaulį (autonominį vairavimą ir robotus).

„ShengShu“ pabrėžė, kad bendras pasaulio modelis, paremtas multimodaliniais duomenimis – vaizdu, garsu ir prisilietimu – natūraliau perteikia fizinio pasaulio veikimo principus nei didieji kalbos modeliai.

„Siekiame sujungti suvokimą ir veiksmą, kad DI sistemos galėtų nuosekliai geriau modeliuoti ir prognozuoti realaus pasaulio elgesį“, – pranešime teigė „ShengShu“ įkūrėjas Zhu Jun.

Pasak „Artificial Analysis“, naujausias „ShengShu“ modelis „Vidu Q3 Pro“, pristatytas sausį, patenka tarp 10 geriausių DI modelių, gebančių generuoti vaizdo įrašus iš teksto ir vaizdų.

Įmonė „Vidu“ pasauliniu mastu pristatė keliais mėnesiais anksčiau, nei „OpenAI“ plačiau padarė prieinamą savo „Sora“ vaizdo generavimo įrankį, kuris vėliau buvo uždarytas. Panašius konkuruojančius sprendimus yra išleidusios ir Kinijos trumpo vaizdo platformos, tarp jų – „Kuaishou“ bei „ByteDance“.

Pasaulio modelių varžybos

„Alibaba“ plečia investicijas ir į kitus su šia kryptimi susijusius startuolius.

Praėjusį mėnesį „Alibaba“ ir „Baidu Ventures“ vadovavo 50 mln. JAV dolerių investicijai į „Tripo AI“ – platformą, kuri leidžia greitai generuoti skaitmeninius 3D modelius iš nuotraukų. „Tripo AI“ taip pat skelbia judanti nuo kalbos modeliams būdingų metodų link įrankių, paremtų fizine erdve, ir kurianti savo pasaulio modelį.

Rugsėjį „Alibaba“ taip pat vadovavo 60 mln. JAV dolerių investicijai į „PixVerse“, kuri šiemet pristatė DI pasaulio modelį, leidžiantį vartotojams nukreipti, kaip generuojant klostysis vaizdo įrašas.

„Alibaba“, pradėjusi veiklą elektroninės prekybos srityje, yra pristačiusi ir nemokamus atvirojo kodo vaizdo generavimo modelius, o vasarį paskelbė ir apie modelį, skirtą robotams.

Skaitykite mūsų naujienas „Facebook“ platformoje Sužinokite apie svarbiausius įvykius pirmieji!

Sekti

„ShengShu“ penktadienį pranešė turinti strateginių partnerysčių su įmonėmis, kuriančiomis įkūnytą (angl. embodied) dirbtinį intelektą – sistemas, tokias kaip humanoidiniai robotai, galintys sąveikauti su fiziniu pasauliu ir būti pritaikomi pramonėje, komercijoje bei namų aplinkoje.

Anot „Wired“ bendraįkūrėjo Kevin Kelly, pasaulio modeliai robotikai yra kritiškai svarbūs, nes vien LLM technologijos tam nepakanka. Jo teigimu, norint atkartoti žmogaus intelektą, dirbtiniam intelektui reikės trijų dalykų: samprotavimo, fizinio pasaulio supratimo ir nuolatinio mokymosi. Nors nuolatinio mokymosi kategorijos sprendimai dar nėra sukurti, LLM pagrindu veikiančios sistemos jau užtikrina žinių elementą, todėl proveržis pasaulio modelių srityje tampa viena svarbiausių krypčių.