“未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發者,用自己的創造力改變世界。”
4月16日,Create 2024百度AI開發者大會在深圳舉辦。百度創始人、董事長兼首席執行官李彥宏發表了題為《人人都是開發者》的主旨演講。他認為,大模型和生成式AI將徹底改變開發者這個群體。
“AI正在掀起一場創造力革命,未來開發應用就像拍短視頻一樣簡單,人人都是開發者,人人都是創造者。”
百度已經為開發者們準備好了三大“開箱即用”的工具,包括智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。“這三個工具,都代表了先進生產力。”
值得一提的是,李彥宏現場分享了百度在開發AI原生應用上的具體思路,并表示:“這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”這三個開發AI原生應用的思路分別是:MoE、小模型和智能體。
會上,李彥宏正式發布了文心大模型4.0的工具版。他還透露,截至目前,文心一言用戶數已經突破2億。“文心大模型已成為中國領先、應用廣泛的AI基礎模型。”
得益于文心大模型的強大,開發者通過文心4.0降維裁剪出來的更小尺寸模型,明顯要比直接拿開源模型調出來的,在同等尺寸下效果更好;同等效果下,成本明顯更低。“大家以前用開源覺得便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落后。”
以下為李彥宏的主要觀點:
自然語言將成為新的通用編程語言
只要會說話就可以成為一名開發者
“大模型和生成式AI,將徹底改變開發者這個群體。過去,開發者用代碼改變世界;未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發者,用自己的創造力改變世界。”
“上崗一年多,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業,生成的代碼采納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。”
“今天,你不會寫代碼,也可以做出一個AI應用;不用編程,也可以做出一個智能體。AI正在掀起一場創造力革命,未來開發應用就像拍短視頻一樣簡單,人人都是開發者,人人都是創造者。”
AgentBuilder、AppBuilder、ModelBuilder
都代表了先進生產力
“作為一家技術公司,百度的角色定位,就是盡可能地為大家提供所需的開發工具,不斷提升整個社會的創造力。”
“具體來說,我們提供1個強大的基礎模型系列,也就是文心大模型系列,這包括旗艦版的ERNIE3.5,ERNIE4.0,也包括輕量版的ERNIE Speed、Lite、Tiny等等。”
“我們還提供基于大模型來開發各種應用的工具,包括智能體開發工具AgentBuilder,AI原生應用開發工具AppBuilder,以及各種尺寸的模型定制工具ModelBuilder。這三個工具,都代表了先進生產力。”
文心一言用戶數突破2億
文心大模型4.0工具版正式發布
“文心一言從去年3月16日發布,到今天是一年零一個月的時間。我們的用戶數突破了2億,API日均調用量也突破了2億,服務客戶數達到了8.5萬,利用千帆平臺開發的AI原生應用數超過了19萬。”
“近幾個月來,文心大模型在代碼生成、代碼解釋、代碼優化等通用能力方面實現了進一步的顯著提升,達到國際領先水平。今天,我們正式發布文心大模型4.0的工具版。”
“文心大模型已經成為中國領先、應用廣泛的AI基礎模型。”
“相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調用1萬次,同樣成本現在一天可以調用100萬次。”
開發AI原生應用的具體思路
是過去一年踩了無數坑、交了高昂學費換來的
“大模型本身并不直接創造價值,基于大模型開發出來的AI應用才能滿足真實的市場需求。”
“今天我想跟大家分享的是一些基于大模型開發AI原生應用的具體思路和工具。這是我們百度根據過去一年的實踐,踩了無數的坑,交了高昂的學費換來的。”
“第一是MoE。未來大型的AI原生應用基本是MoE架構,這里所說的MoE不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。”
“第二是小模型。小模型推理成本低,響應速度快,在一些特定場景中,經過SFT精調后的小模型,它的使用效果可以媲美大模型。這就是我們發布Speed、Lite、Tiny三個輕量模型的原因。我們通過大模型,壓縮蒸餾出來一個基礎模型,然后再用數據去訓練,這比從頭開始訓練小模型,效果要好很多,比基于開源模型訓練出來的模型,效果更好,速度更快,成本更低。”
“第三是智能體。智能體是當下很熱的一個話題,隨著智能體能力的提升,會不斷催生出大量新的應用。智能體機制,包括理解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成復雜任務,在環境中持續學習、實現自我迭代和進化。在一些復雜系統中,我們還可以讓不同的智能體互動,相互協作,更高質量地完成任務。”
智能體是未來離每個人最近
最主流的大模型使用方式
“智能體可能是未來離每個人最近、最主流的大模型使用方式,基于強大的基礎模型,智能體可以批量生成,應用在各種各樣的場景。”
“百度剛剛升級了文心智能體平臺。截至目前,已經有3萬多個智能體被創建、5萬多名開發者和上萬家企業入駐。我們的目標是,讓每個人、每個組織都成為智能體的開發者,打造國內最完整的智能體生態。那如何實現這個目標呢?就是給大家提供零門檻的智能體開發工具AgentBuilder。”
“今天,每一個商家、每一個客戶,都能在百度擁有專屬的智能體。整個過程完全不需要編程,通過類似提示詞的信息輸入和簡單的幾步操作調優,就能迅速生成一個智能體,成為7X24小時在線的金牌業務員。”
現場,李彥宏演示了新加坡旅游局、啟德教育和索菲亞三個智能體案例,手把手教開發者用自然語言,5分鐘、零門檻創建一個智能體。
“啟德教育智能體非常的受歡迎,上線第一周,就成功分發了155萬次,與用戶交互了5.8萬次,線索轉化量直線增長、有效線索的轉化成本明顯降低,經營效率大幅提升。”
“索菲亞商家智能體上線以來,有效線索成本下降了30%。也就是說,它獲得一個有效客戶,如果過去的成本是100塊,現在只需要70塊了。”
AppBuilder:最好用的AI原生應用開發工具
用自然語言三步就能開發一個應用
“AppBuilder,它是目前最好用的AI原生應用開發工具。在AppBuilder上面,我們提前封裝和預置了開發AI原生應用所需的各種組件和框架,大幅降低開發門檻。”
“最快只需三步,開發者就可以用自然語言開發出一個AI原生應用,并且能夠便捷地發布、集成到各種各樣的業務環境中。”
現場,通過“游樂場排隊助手”、華北電力大學“華電AI助理”和百度文庫智能漫畫生成三個案例,李彥宏展示了一個AI原生應用的創建過程。只需名稱設定、填寫角色指令、插入組件簡單三步,即可創建一個AI原生應用。
他還指出,AppBuilder擁有兩大優勢:
“一是功能強大。依托文心4.0對指令的理解和遵循能力,我們的AppBuilder能保證冷啟動就能達到一個不錯的水平,不會因為效果差,再花很長時間去調優,大大降低了開發門檻。依托檢索增強技術RAG,在知識問答等典型場景,我們的問答準確率和友好回復程度都達到了95%以上,大幅超越其他同類產品。”
“AppBuilder還提供豐富完整的組件工具,包括百度搜索等基于百度多年技術積累的AI能力組件、大模型能力組件,還有百度獨家開放的業務組件等55個組件。以及一些主流場景的第三方API,比如航班查詢、論文查詢等。我們還支持自定義組件,客戶可以直接對接自己專有的任何工具和數據。這些豐富的組件,共同支撐起了AI原生應用的高效開發。”
“二是簡單易用。使用AppBuilder,只需三步即可快速創建應用、一鍵分發。我們也支持開源的SDK,方便大家進行二次開發。”
各種尺寸的模型定制工具ModelBuilder
高效低價生產模型
“更適合專業開發者使用的工具,那就是ModelBuilder,它可以根據開發者的需求定制任意尺寸的模型,并根據細分場景對模型進一步精調SFT,這樣就能達到更好的效果。”
現場,李彥宏展示了教育行業作文批改的案例,經過數據處理、模型精調后的“作文批改助手”,不僅可以擁有更專業的老師點評思維、做到格式遵循,而且相比未精調模型,精調后的模型打分與真實的老師點評分數更為接近。
他還在現場與小度實時互動,展示小度用MoE多個模型組合的方式來執行不同任務,例如使用小模型ERNIE Tiny執行模型路由工作,而性能很好的文心4.0則用來執行日程安排等復雜需求。據介紹,相比全部使用文心大模型的旗艦版,小度可以實現響應速度提升2倍,成本下降99%。
李彥宏表示,“這幾個關于ModelBuilder的例子,展示的是百度高效低價生產模型的能力。”
“為了方便大家快速上手,ModelBuilder預置了全面、豐富的大模型。包括ERNIE3.5和ERNIE4.0,這是旗艦版的大模型,它適合通用的復雜場景,能力強大;還有三個輕量級的大模型,ERNIE Speed、Lite、Tiny;另外還有兩個垂直場景的模型,ERNIE Character適合角色扮演,ERNIE Functions適合對話或問答場景中的外部工具使用和業務函數調用。當然,ModelBuilder也支持國內外第三方主流模型,總數量達到77個,是國內擁有大模型數量最多的開發平臺。”
開源模型會越來越落后
“因為有了強大的基礎模型文心4.0,我們可以根據需要,兼顧效果、響應速度,推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,并且支持精調和post pretrain。”
“這樣通過降維裁剪出來的模型,明顯比直接拿開源模型調出來的,在同等尺寸下效果更好,同等效果下,成本明顯更低。”
“大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落后。”
多模態大模型是通往AGI的必經之路
視覺大模型最大的應用場景是自動駕駛
“面向未來,我認為多模態大模型,或者說文字、圖片、語音、視頻等多模態的融合,是基礎模型非常重要的長期發展方向,是通往AGI的必經之路。百度在這些領域有著長期投入,并將及時更新大模型的最新進展。”
“我有一個非常不一樣的判斷:視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是領先的,是自動駕駛的全球領導者,我們不只訓練AI如何生成視頻,更訓練AI理解真實世界發生的事情并預測未來。”
“基于超過1億公里的、中國復雜城市道路測試里程數據,百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、適應性更強、更安全的自動駕駛方案。”
人人都可以成為開發者,未來
必將是一個由開發者一起創造出來的未來
“今天的中國,有10億互聯網用戶,有強大的基礎大模型,有足夠多的AI應用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持‘人工智能+’行動,每一個人,每一家企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。”
“人人都可以成為開發者,而未來,也必將是一個由開發者一起創造出來的未來!”
文/十一