中國(guó)電信發(fā)布首個(gè)央企全自研視頻生成大模型
中國(guó)電信發(fā)布首個(gè)央企全自研視頻生成大模型

文章來(lái)源:中國(guó)電信集團(tuán)有限公司 發(fā)布時(shí)間:2024-12-05
12月3日,在中國(guó)電信“2024數(shù)字科技生態(tài)大會(huì)”上,中電信人工智能科技有限公司和中國(guó)電信人工智能研究院(TeleAI)發(fā)布了首個(gè)央企全自研視頻生成大模型,至此,星辰大模型系列已完成了全模態(tài)能力的構(gòu)建。同時(shí)還發(fā)布了革新傳統(tǒng)視覺(jué)算法生產(chǎn)流程的視覺(jué)大模型產(chǎn)用一體化平臺(tái),展示了具身智能、智傳網(wǎng)等一系列創(chuàng)新產(chǎn)品及科研成果。
該視頻生成大模型實(shí)現(xiàn)了從文字到分鏡圖和從分鏡圖到視頻的端到端生成,在主體目標(biāo)時(shí)空一致性、個(gè)體復(fù)雜動(dòng)作精準(zhǔn)控制、交互式動(dòng)作精確控制及角色動(dòng)作符合物理規(guī)律等核心技術(shù)上實(shí)現(xiàn)了全國(guó)領(lǐng)先。該能力的推出標(biāo)志著中國(guó)電信成為首家具備視覺(jué)、語(yǔ)音、語(yǔ)義、多模態(tài)全模態(tài)能力的央企,有望落地廣告?zhèn)髅健⑽穆媒逃阮I(lǐng)域。未來(lái),可通過(guò)整合語(yǔ)義、語(yǔ)音、文生圖、文生視頻等全棧大模型能力打通短視頻及影視劇制作的各個(gè)環(huán)節(jié),覆蓋文字腳本撰寫、分鏡腳本繪制、視頻拍攝及剪輯、配音及音效合成等全流程,提升視頻創(chuàng)作效率,實(shí)現(xiàn)降本增效。目前,該視頻生成大模型在權(quán)威視頻生成評(píng)測(cè)榜單VBench中排名第一。
同時(shí),中電信人工智能公司構(gòu)建了一款具有顛覆性意義的視覺(jué)大模型產(chǎn)用一體化平臺(tái),該平臺(tái)作為央企首個(gè)自主研發(fā)的視覺(jué)大模型產(chǎn)用一體化系統(tǒng),為政務(wù)、應(yīng)急、工業(yè)、能源等多個(gè)行業(yè)的開(kāi)發(fā)人員提供全方位賦能,實(shí)現(xiàn)全流程提效。該平臺(tái)已成功應(yīng)用于多省應(yīng)急項(xiàng)目,沉淀了森林煙火、洪澇災(zāi)害、路面坍塌等20余個(gè)應(yīng)急全流程感知場(chǎng)景,提升對(duì)災(zāi)害研判與應(yīng)急響應(yīng)的核心能力。
在本次數(shù)字科技生態(tài)大會(huì)的線下展臺(tái),中國(guó)電信還展示了一系列在具身智能方向的創(chuàng)新成果,包括可以用于生活服務(wù)的人形機(jī)器人、面向商場(chǎng)及展會(huì)場(chǎng)景的星小辰服務(wù)機(jī)器人、為視障人士提供導(dǎo)盲服務(wù)的智能機(jī)器狗,及整合了一系列大模型能力的AI智能眼鏡;一分鐘內(nèi)完成數(shù)字分身一鍵復(fù)刻的數(shù)字人技術(shù),星辰軟件工廠、星辰慧記、星辰智能體產(chǎn)品、中國(guó)電信家庭小管家、星辰大模型一體機(jī)等一系列智能產(chǎn)品。
中電信人工智能科技有限公司和中國(guó)電信人工智能研究院將持續(xù)推進(jìn)人工智能的技術(shù)攻關(guān)突破、向開(kāi)發(fā)者提供更優(yōu)質(zhì)的生態(tài)環(huán)境和研發(fā)平臺(tái)、為社會(huì)各界提供更加智能的產(chǎn)品方案。
【責(zé)任編輯:張宇暉】