百度文心 4.0 Turbo 來了！聯合飛槳框架 3.0 推理性能躍升 30%，文心快碼升級至 2.5 版

2024-06-29 12:34
AI前線

作者 | 華衛

6 月 28 日，百度推出了文心大模型 4.0 Turbo，並公佈一系列技術、產品、生態最新成果，包括新一代的飛槳框架 3.0、文心快碼 2.5。

“文心一言累計用戶規模已達 3 億，日調用次數也達到了 5 億。”現場，百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峯還披露了文心一言的最新數據。

王海峯認爲，通用人工智能已經越來越近，而大模型技術爲其帶來了曙光：一是人工智能技術的通用性，大模型在面向不同任務、語言、模態、場景時的通用性越來越強；二是能力的全面性，人工智能的理解、生成、邏輯、記憶等四項基礎能力越強，越接近通用人工智能。

文心 4.0 Turbo 開放

上下文窗口提升至 128k

大會現場，王海峯發佈了文心大模型 4.0 Turbo，網頁版、APP、API 陸續面向用戶開放，開發者登錄百度智能雲千帆大模型平臺即可使用文心大模型 4.0 Turbo API 服務。

據介紹，通過數據、基礎模型、對齊技術、提示、知識增強、檢索增強和對話增強等核心技術的持續創新以及飛槳文心的聯合優化，文心大模型 4.0 Turbo 的速度更快、效果更好。

其在基礎大模型的基礎上，進一步創新智能體技術，包括理解、規劃、反思和進化，能夠做到可靠執行、自我進化，並一定程度上將思考過程白盒化，讓機器像人一樣思考和行動，能夠調用工具自主完成複雜任務，在環境中持續學習實現自主進化。

王海峯表示，文心一言 4.0 Turbo 的上下文輸入長度從 4.0 版的 2K tokens 升級到了 128K tokens，能夠同時閱讀 100 個文件或網址，AI 生圖分辨率也從 512*512 提升至 1024*1024。

百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示，過去半年文心大模型取得了顯著進展，用戶日均提問量增加 78%，提問平均長度提升 89%。文心大模型爲用戶提供的幫助從簡單需求延伸到更多元、複雜的任務。

截至目前，文心大模型已累計生成 70 億行代碼、創作 5.9 億篇文章、編撰百萬篇專業研報、解答了 1.7 億學習問題，輔助 1.3 億人次工作等。與此同時，文心大模型還支持了大量的應用創新。“在大模型應用落地過程中，選擇合適的模型對應用效果至關重要。“吳甜介紹到。

具體能力表現上，文心輕量級模型適合解決確定場景的問題，同時具有成本更低、速度更快的優勢；3.5 是一個強通用性模型，適用於日常信息處理和文本生成任務；4.0 規模更大、能力更強，具備更強的理解能力、邏輯推理能力與更豐富的知識，可以提供專業深度的幫助；4.0 工具版基於智能體技術，擅長綜合運用多種工具和數據，按要求完成非常複雜的任務。

大會現場，百度還發布了與中國工程院朱有勇院士及團隊共同打造的首個農業智能體“農民院士智能體”，以及和上海體育大學共同研發的國內首個面向體育行業的大模型上體體育大模型。

飛槳新一代框架 3.0

提升模型推理性能 30%

“文心一言的快速發展，包括整個文心大模型的快速發展，離不開飛槳平臺的支撐。”王海峯表示。據介紹，文心大模型的持續快速進化，得益於百度在芯片、框架、模型和應用上的佈局，尤其是飛槳深度學習平臺和文心的聯合優化，包括訓練吞吐、分佈式擴展、多模型結構混合並行和硬件通信層的聯合優化。

現場，百度 AI 技術生態總經理馬豔軍主要詳細解讀了飛槳新一代框架 3.0 的設計理念和技術特點。“在 3.0 版本的設計中，我們充分考慮了目前大模型技術發展和異構多芯的趨勢，並從三個方面做了綜合考量，一是保障大模型訓練和推理的性能，二是足夠簡化大模型本身的開發和調優過程，三是更好適配各種各樣的芯片。”

據介紹，飛槳框架 3.0 面向大模型、異構多芯進行專屬設計，向下適配異構多芯，向上一體化支撐大模型的訓練、推理，同時具有動靜統一自動並行、編譯器自動優化、大模型訓推一體、大模型多硬件適配四項能力。

其中，自動並行能力可以把代碼開發做更好的封裝，訓推一體讓訓練與推理的能力相互複用，爲大模型全流程提供統一的開發體驗和極致的訓練效率。而通過一系列的編譯器自動優化過程，不管是對於語言模型還是擴散模型，整個推理性能都能提升到 30%。

飛槳框架 3.0 還爲大模型硬件適配提供了功能完善、低成本的方案，建設了面向硬件廠商的代碼合入、持續集成、模型迴歸測試等研發基礎設施，爲硬件適配提供了全套保障。馬豔軍表示，“在 3.0 版本中，硬件廠商只需要針對基礎算子做適配，大幅減少了對應的開發工作量。”

此外，新一代框架也爲文心大模型提供了壓縮、推理、服務等支撐。在 AI for Science 領域，飛槳框架 3.0 爲科學計算提供了高階自動微分、編譯優化、分佈式訓練能力支撐，還建設了面向通用數理問題求解的賽槳 PaddleScience 以及專注於生物計算的螺旋槳 PaddleHelix 工具包。飛槳框架 3.0 還原生支持複數技術體系，這對於如氣象預報、汽車 / 飛行器氣動分析等場景下的數據特徵分析具有重要意義。

“文心快碼” 升級至 2.5 版

代碼採納率達 46%

現場，百度副總裁陳洋宣佈智能代碼助手 Comate 的中文名爲“文心快碼”，併發布了最新升級的版本文心快碼 2.5。據介紹，文心快碼 2.5 在知識增強、企業研發全流程賦能、企業級安全等方面實現了能力提升。

在之前續寫、解釋代碼、問答等能力的基礎上，新版本可深度解讀代碼庫、關聯權威公域和私域知識生成新的代碼，生成的代碼更加安全，並且可以智能檢測安全漏洞、一鍵修復漏洞，支持混合雲部署等。

陳洋表示，文心快碼的“快”主要體現在三大方面：開發速度快、業務迭代快、企業落地快，提供標準版、專業版、企業版、企業專有版 4 大版本。

目前，百度 80% 的工程師已經在深度使用文心快碼，其中代碼採納率已達到 46%，新增代碼生成佔比 29%，百度單位時間提交代碼數量增加 35%、研發單週交付佔比達到了 57%，整體研發提效 14% 以上。

“原本需要 7 天才能完成的工程量，在 5 天就能夠開發完成；百度內部一半以上的研發需求，可以在一週之內完成交付。”陳洋介紹，喜馬拉雅一個季度落地文心快碼的採納率就可以達到了 44%。

與此同時，文心快碼還已應用到包括上海三菱電梯、軟通動力、吉利汽車、晶合集成電路和奈雪的茶等企業，覆蓋金融、汽車、機械製造、軟件服務等諸多領域。

結語

現場，百度文心大模型同甲骨文信息處理教育部重點實驗室打造的“來自甲骨文的回答”互動程序也正式上線，通過調用文心一言的對話能力及對甲骨文文字的釋義，古老的甲骨文“活起來”了。

同時，百度與國際愛護動物基金會聯合發佈“AI 守護官 2.0 版”，通過飛槳平臺開發工具 PaddleX 定製打造的模型，提高了鑑別野生動物製品的準確度，縮短了耗費時間，用技術讓野生動物保護更加高效。

如今，大模型爲代表的人工智能正加速各行各業轉型升級。正如王海峯所說，人工智能基於深度學習及大模型工程平臺，包括算法、數據、模型、工具等，已經具備了非常強的通用性以及標準化、模塊化和自動化的特徵，進入到工業大生產階段，通用人工智能將加速到來。

活動推薦

AICon 全球人工智能開發與應用大會將於 8 月 18 日至 19 日在上海舉辦，匯聚頂尖企業專家，深入端側AI、大模型訓練、安全實踐、RAG應用、多模態創新等前沿話題。現在大會已開始正式報名，6 月 30 日前可以享受 8 折優惠，單張門票節省 960 元（原價 4800 元），詳情可聯繫票務經理 13269078023 諮詢。

內容推薦

大模型正在推動歷史性技術革命，知識觸手可及。2024年6月14日至15日，ArchSummit全球架構師峯會在深圳成功舉辦，我們精選了峯會中聚焦AI大模型技術應用的相關PPT，內容涵蓋了華爲雲AI原生應用引擎的架構與實踐、微衆銀行大模型研發實踐以及B站容量管理實踐等。關注「AI前線」，回覆關鍵詞「大模型落地」免費獲取PPT資料。

今日薦文

好消息：OpenAI 突然發了新模型！壞消息：只是糾錯，沒你想得逆天

從AI高管到犀利CEO，賈揚清創業這一年：我們的目標是做AI時代的“第一朵雲”

沒想到國內大模型廠商又一次high起來，是因爲OpenAI 斷供！

一羣頂尖搜索人才如何2個月出貨，還把GPU利用率幹到60%！揭祕百川智能研發大模型這一年

1個芯片頂英偉達3個？這個偏愛印度的創始人爆肝8年，終於等來搶英偉達潑天富貴的一天！

揭祕大模型技術在快手搜索的應用

你也「在看」嗎？👇