„Ola“ įkūrėjas Bhavishas Aggarwalis investuoja 230 milijonų dolerių į AI startuolį, kurį įkūrė, nes šalis siekia įsitvirtinti lauke, kurioje dominuoja JAV ir Kinijos firmos.
„Aggarwal“ finansuoja investicijas į Krutmą daugiausia per savo šeimos biurą, o šaltinis, susipažinęs su šiuo klausimu, pasakojo „TechCrunch“. Antradienį X įraše Aggarwal teigė, kad Krutrimas siekia pritraukti 1,15 milijardo JAV dolerių investiciją iki kitų metų. Šaltinis teigė, kad jis sieks pakelti likusią kapitalo dalį iš išorės investuotojų.
Pranešimas apie finansavimą sutampa su vienaragio startuoliu „Krutrim“, kuris daro savo AI modelius atvirojo kodo ir atskleidžia planus sukurti tai, kas, jos teigimu, bus didžiausias Indijos superkompiuteris bendradarbiaujant su NVIDIA.
Laboratorija išleido „Krutrim-2“-12 milijardų parametrų kalbos modelį, kuris parodė stiprų našumą apdorojant indų kalbas. Sentimentų analizės testuose „Krutrim“ pasidalino antradienį, jis surinko 0,95, palyginti su 0,70 konkuruojantiems modeliams, tuo pačiu pasiekdamas 80% sėkmės procentą atliekant kodų generavimo užduotis.
Laboratorija atidarė kelis specializuotus modelius, įskaitant vaizdų apdorojimo sistemas, kalbos vertimą ir teksto paiešką, visa tai optimizuota indų kalboms.
„Mes dar niekur netoli pasaulinių etalonų, tačiau per vienerius metus padarėme didelę pažangą“, – rašė Aggarwal, kurio kitas įmones palaikė „SoftBank“, X. „Atviro tiekimo modeliais tikimės, kad visos Indijos AI bendruomenės bendradarbiavimo bendradarbiaudami bendradarbiauja sukurti pasaulinės klasės Indijos AI ekosistemą. “
Ši iniciatyva atsiranda, kai Indija siekia įsitvirtinti dirbtinio intelekto kraštovaizdyje, kuriame dominuoja JAV ir Kinijos kompanijos. Neseniai paskelbtas „Deepseek“ R1 „samprotavimų“ modelio, sukurto iš tariamai kuklaus biudžeto, išleidimo per technologijų pramonę išsiuntė šoko bangas.
Praėjusią savaitę Indija gyrė „Deepseek“ pažangą ir teigė, kad šalis surengs Kinijos AI laboratorijos didelius kalbų modelius vidaus serveriuose. Praėjusią savaitę „Krutrim's Cloud Arm“ pradėjo siūlyti „Deepseek“ Indijos serveriuose.
„Krutrim“ taip pat sukūrė savo vertinimo sistemą „Bharatbench“, kad įvertintų AI modelių kvalifikaciją Indijos kalbomis, atkreipdamas dėmesį į esamų etalonų spragą, kurioje daugiausia dėmesio skiriama anglų ir kinų kalba.
Laboratorijos techninis požiūris apima 128 000 kalbų konteksto lango naudojimą, leidžiantį jo sistemoms tvarkyti ilgesnius tekstus ir sudėtingesnius pokalbius. „The Startup“ paskelbta našumo metrika parodė, kad „Krutrim-2“ pasiekė aukštus gramatikos korekcijos (0,98) ir kelių posūkių pokalbius (0,91).
Investicijos po sausio mėnesio „Krutrim-1“, 7 milijardų parametrų sistemos, kuri tarnavo kaip pirmasis Indijos didelės kalbos modelis, pristatymas. Superkompiuterių diegimas su „NVIDIA“ planuojama veikti kovo mėnesį, o plėtra planuojama ištisus metus.