來源:中國經(jīng)濟(jì)網(wǎng) 發(fā)布時(shí)間:2025-11-3 10:41
中國經(jīng)濟(jì)網(wǎng)北京10月31日訊(記者 李方) 10月27日,由中國科協(xié)主辦的2025年世界科技與發(fā)展論壇在北京開幕。百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜出席開幕式并做主題演講,分享了深度學(xué)習(xí)技術(shù)如何賦能AI+產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型。吳甜表示,深度學(xué)習(xí)是人工智能關(guān)鍵核心技術(shù),在過去一段時(shí)間驅(qū)動AI實(shí)現(xiàn)了飛躍式進(jìn)步,為大模型的爆發(fā)提供了基礎(chǔ)。深度學(xué)習(xí)平臺一方面支持大模型的研發(fā),另外一方面和大模型協(xié)同優(yōu)化,支撐產(chǎn)業(yè)智能化轉(zhuǎn)型。
百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心副主任吳甜
吳甜講到,深度學(xué)習(xí)平臺下接芯片,上承大模型和應(yīng)用,AI的開發(fā)、訓(xùn)練、推理部署以及產(chǎn)業(yè)落地,都離不開深度學(xué)習(xí)平臺的支撐。以百度飛槳為例,作為百度自研的產(chǎn)業(yè)級深度學(xué)習(xí)開源開放平臺,飛槳從核心框架、基礎(chǔ)模型庫,到端到端開發(fā)套件、工具與組件,以及星河社區(qū)等,全方位支持了文心大模型的演進(jìn)過程。目前,飛槳已適配 60多款系列芯片,創(chuàng)建超過110萬個(gè)模型。
文心大模型的能力拓展和效率提升,得益于飛槳和文心的聯(lián)合優(yōu)化,包括框架模型的聯(lián)合優(yōu)化,也包括框架算力的聯(lián)合優(yōu)化。通過訓(xùn)練和推理的技術(shù)創(chuàng)新,ERNIE-4.5-300B-A47B模型上實(shí)現(xiàn)預(yù)訓(xùn)練MFU達(dá)47%,ERNIE-4.5-300B-A47B模型在TPOT 50ms時(shí)延條件下,實(shí)現(xiàn)了輸入57K tokens/秒、輸出29K tokens/秒的高吞吐性能。
公開資料顯示,2018年底,百度就開展了大模型技術(shù)研發(fā),2019年3月正式發(fā)布文心大模型1.0,今年4月發(fā)布了多模態(tài)大模型文心4.5 Turbo和深度思考模型文心X1 Turbo,9月X1 Turbo升級為文心X1.1。在中文多模態(tài)視覺語言模型測評基準(zhǔn)SuperCLUE-VLM上,文心4.5 Turbo總分并列國內(nèi)第一;在中文精確指令遵循測評基準(zhǔn)SuperCLUE-CPIF,文心X1.1在任務(wù)類型、指令數(shù)量兩類劃分中均為國內(nèi)第一。此外,文心4.5的衍生模型PaddleOCR-VL、文心開源思考模型ERNIE-4.5-21B-A3B-Thinking等模型也多次登上Hugging Face全球模型總趨勢榜第一。
如何讓大模型在產(chǎn)業(yè)應(yīng)用中發(fā)揮更大的作用,讓千行百業(yè)得到更大的受益,吳甜認(rèn)為,能夠提供一系列豐富的產(chǎn)業(yè)級開發(fā)套件和工具的深度學(xué)習(xí)平臺至關(guān)重要。百度基于文心與飛槳打造的人工智能基礎(chǔ)技術(shù)底座,正在助力千行百業(yè)提效降本、增強(qiáng)企業(yè)經(jīng)營、決策等能力。
例如,在智能制造領(lǐng)域,中車集團(tuán)基于飛槳建立人工智能仿真平臺,支撐高鐵外形仿真設(shè)計(jì)周期由“天級”縮短至“秒級”;在智慧醫(yī)療領(lǐng)域,AI已經(jīng)能在病情收集、病歷整理、AI預(yù)審核和醫(yī)生復(fù)核等環(huán)節(jié)發(fā)揮作用,優(yōu)化患者就醫(yī)體驗(yàn)、提升醫(yī)生接診效率;在智慧能源領(lǐng)域,基于文心和飛槳及百度系列技術(shù)平臺打造的電網(wǎng)斷面調(diào)控智能體“大瓦特 - 天璇 - 阿度”,在廣西電網(wǎng)調(diào)度臺上線后,實(shí)現(xiàn)對600+廠站、90+斷面的監(jiān)控,實(shí)現(xiàn)“故障告警-斷面監(jiān)視-風(fēng)險(xiǎn)預(yù)測-高效預(yù)控”全流程智能決策。
吳甜還現(xiàn)場分享了基于文心大模型的最佳實(shí)踐——數(shù)字人。這套百度自研的多模協(xié)同的數(shù)字人技術(shù)包含劇本驅(qū)動的數(shù)字人多模協(xié)同、融合多模規(guī)劃與深度思考的劇本生成、動態(tài)決策的實(shí)時(shí)交互、文本自控的語音合成、高一致性超擬真數(shù)字人長視頻生成五項(xiàng)創(chuàng)新技術(shù),實(shí)現(xiàn)了數(shù)字人“神、形、音、容、話”的高度統(tǒng)一。最終呈現(xiàn)出一個(gè)具備高表現(xiàn)力,內(nèi)容吸引人,人-物-場可自由交互的超擬真數(shù)字人。
目前,百度數(shù)字人已在電商等多個(gè)領(lǐng)域展現(xiàn)出顯著的商業(yè)價(jià)值。百度已經(jīng)助力打造超過10萬數(shù)字人主播,直播轉(zhuǎn)化率提升31%,開播成本下降80%。公開資料顯示,在百度慧播星的應(yīng)用實(shí)踐中,數(shù)字人直播的線上表現(xiàn)超過了真人。此前,羅永浩數(shù)字人直播首秀GMV突破行業(yè)新紀(jì)錄,部分核心品類帶貨量超過真人直播。
吳甜最后表示,技術(shù)持續(xù)革新不斷驅(qū)動應(yīng)用創(chuàng)新,應(yīng)用創(chuàng)新進(jìn)而轉(zhuǎn)化為實(shí)際商業(yè)價(jià)值,最終推動產(chǎn)業(yè)向更高級形態(tài)轉(zhuǎn)型升級。目前飛槳文心開發(fā)者數(shù)量已超過2333萬,服務(wù)超過76萬家企業(yè)。