<span id="r1dp9"></span>
<span id="r1dp9"><video id="r1dp9"><ruby id="r1dp9"></ruby></video></span><ruby id="r1dp9"><video id="r1dp9"><del id="r1dp9"></del></video></ruby>
<strike id="r1dp9"></strike>
<ruby id="r1dp9"></ruby>
<th id="r1dp9"><video id="r1dp9"></video></th><strike id="r1dp9"></strike><strike id="r1dp9"><dl id="r1dp9"><ruby id="r1dp9"></ruby></dl></strike>
<span id="r1dp9"></span>
<strike id="r1dp9"><dl id="r1dp9"><ruby id="r1dp9"></ruby></dl></strike>
您當前的位置:首頁 > 電腦百科 > 人工智能

大模型2024:先把價格打下去

時間:2024-03-12 10:24:13  來源:驚蟄研究所  作者:

  作者|昭覺

  來源|驚蟄研究所

  AI新星OpenAI最近有點頭疼,不僅公司和CEO被馬斯克起訴,其拳頭產品GPT-4在性能和價格上均面臨競爭對手的沖擊。

  近期,成立不到一年的法國人工智能創企Mistral AI發布了最新大模型Mistral Large,并推出了首個聊天機器人產品Le Chat,直接對標ChatGPT。據了解,Mistral Large在目前所有能通過API訪問的大模型中評分第二,僅次于GPT-4。

  更值得關注的是,Mistral AI還與微軟達成了更加深入的合作協議,微軟將投資入股Mistral AI,并為其提供算力和云服務,而Mistral AI的大模型資源也將在微軟的Azure云平臺中售賣。要知道,上一個有此待遇的AI創業公司還是OpenAI。

  除此之外,更低廉的API接口價格也讓Mistral Large成為了GPT-4的有力競爭者,并有望在當前的大模型軍備競賽中掀起一場價格戰。

  比GPT-4更具性價比?

  作為一款誕生于歐洲的大模型,Mistral Large支持英語、法語、西班牙語、德語和意大利語,可深度理解語法和文化背景。另外,Mistral Large的上下文窗口為32K,可從約2.4萬個英文單詞的大型文檔中精準提取信息;具備精確的指令跟隨能力,便于開發者定制審核策略;支持原生函數調用和限定輸出模式,助力應用開發規?;图夹g?,F代化。

  性能方面,雖然Mistral AI并未公布Mistral Large的參數量,但其關鍵性能已達到業界前三。

  具體來看,Mistral Large在MMLU基準測試中的常識和推理得分為81.2%,僅次于GPT-4的86.4%。Mistral Large達到了頂級的推理能力,可用于復雜的多語言推理任務,包括文本理解、轉換和代碼生成。其推理準確性優于Anthropic的Claude 2、谷歌的Gemini 1.0 Pro、OpenAI的GPT-3.5,推理速度甚至超過了GPT-4和Gemini Pro,顯示了其在處理復雜任務時的高效能力。

  多語言能力測試中,Mistral Large在法語、德語、西班牙語和意大利語的Arc Challenge、HellaSwag、MMLU等基準測試中的表現均遠超目前公認最強的開源大模型——Meta的LLaMA 2 70B。

  數學和編程能力方面,Mistral Large同樣表現不俗:其在MBPP基準測試中的編程得分高于LLaMA 2 70B,在Math maj@4基準測試中的數學得分也領先于GPT-3.5、Gemini Pro 1.0等模型。

  作為Mistral AI商用系列中的旗艦模型,Mistral Large與GPT-4一樣并未開源。用戶可通過三種方式訪問與使用Mistral模型:其中,在歐洲的Mistral Al基礎設施上安全托管的La Plateforme是開發者訪問Mistral Al所有模型的首選方式,開發者可通過點擊創建自己的應用程序和服務;Mistral Al的開源模型目前可通過GCP、AWS、Azure、NVIDIA等云服務商獲得,而Mistral Large目前僅通過Azure云平臺提供服務,包括Azure AI Studio和Azure machine Learning。

  此外,開發者還可以通過虛擬云或on-prem自行部署使用Mistral模型,這種方式提供了更高級的自定義和控制,自有數據將保留在公司內部。

  價格方面,目前上下文窗口為128k的GPT-4 Turbo的輸入價格為0.01美元/1000 token,輸出價格為0.03美元/1000 token。相比之下,Mistral Large的輸入、輸出價格均為前者的80%。

  體驗方面,有AI創業者指出,Mistral Large的使用體驗碾壓曾經的第三名Claude 2。截至2023年11月,OpenAI的開發者規模達200萬,其中包含92%的世界500強企業。而Mistral Large直逼GPT-4的性能和更低的售價有望為需求量巨大的企業用戶節省一大筆開支,從被OpenAI壟斷的MaaS(模型即服務)市場撕開一個口子。

  MoE架構立大功

  Mistral Large把價格打下來的底氣是更低的訓練成本。OpenAI CEO Sam Altman曾表示,GPT-4的模型訓練成本“遠遠超過了”5000萬至1億美元。而據Mistral AI創始人Arthur Mensch透露,Mistral Large的訓練成本不到2200萬美元,約為GPT-4的五分之一。

  除了真金白銀的訓練成本,后來者居上的Mistral Large的時間成本也更具優勢。OpenAI從成立到推出GPT-4,足足用了8年,而Mistral AI推出僅次于GPT-4的Mistral Large只用了9個月。

  Mistral AI號稱歐洲版OpenAI,創始團隊由Meta和Deepmind的前科學家們組成。成立后的半年多時間里,Mistral AI接連完成1.05億歐元種子輪融資和后續的4.15億歐元融資,得到美國光速、a16z等頂級VC以及英偉達、賽富時、法巴銀行的青睞。

  同期,Mistral AI先后推出號稱當時“最強的70億參數開源模型”Mistral 7B、首個開源MoE大模型Mistral 8x7B。其中,Mistral 8x7B更是以一條簡單粗暴的磁力鏈接引領了大模型發布的新范式,給業界帶來震撼。

  憑借巨額融資疊加新品發布,Mistral AI的估值也曾一夜之間飆升至20億美元,成為大模型領域的新晉獨角獸。而Mistral AI更引人關注的是,從初期只有6人的小團隊成長至今,Mistral AI一直是MoE路線的忠實信徒。

  MoE即“混合專家模型”,這種模型設計策略通過將大模型分解為多個子模塊,提高模型的容量、處理能力和效率。MoE架構主要由“專家”和門控機制兩部分構成。每個“專家”相當于一個小型的Transformer模型,專門處理特定類型的輸入數據,多個“專家”的結合則使模型具備了更好的性能。而門控機制則用于判定輸入樣本需由哪些“專家”接管處理。

  大模型的大規模應用與其算力成本緊密相關。對于模型廠商而言,目前主要的算力成本包括預訓練成本和推理成本。除去GPU每秒運算次數和顯卡的租用成本這兩個常量后,大模型的預訓練成本與模型參數量和訓練數據的token量正相關,推理成本與模型參數量正相關。而大模型的性能通常與其參數量相關聯,而越高的參數量意味著越高的算力成本。因此,如何在同樣的算力成本下提升大模型的參數量成了破局的關鍵。

  而MoE的解題思路是引入稀疏性,即模型訓練過程中,各有所長的“專家”們獨立訓練、各司其職,在過濾重復信息、減少數據干擾的同時大幅提升模型的學習速度與泛化能力;在推理過程中,每次推理只按需調用部分“專家”,激活其對應的部分參數,如此便有效降低了相同參數下大模型的算力成本。

  有意思的是,OpenAI在去年成為“當紅炸子雞”成功得到眾多重度用戶的續費后,被曝采用MOE重新設計了GPT-4構架,導致性能受到影響。盡管OpenAI官方并未對此進行正面回應,但利用MOE架構降低訓練成本,已經被認為是一個無比自然的發展方向。

  Mistral AI同樣未公布大模型的具體參數與訓練數據Token數,但此前谷歌應用MoE開發出的GLaM模型參數量達12000億、訓練數據16000億token,分別是GPT-3.5的6.8倍和5.3倍,其實際的訓練成本卻只有GPT-3.5的三分之一也印證了MoE框架的高效。

  延續著MoE的路線,如果說此前發布的開源模型Mistral 7B、Mistral 8x7B實現了對LLaMA等大參數開源模型的逆襲,此次發布的Mistral Large則是Mistral AI對可持續商業模式的探索,試圖以閉源模型搭建可盈利的產品線。

  大模型進入成本戰

  頂著對華芯片禁售的壓力,芯片巨頭英偉達以一份耀眼的四季報打消了市場顧慮:在數據中心與游戲業務雙核驅動下,英偉達2023年四季度營收、凈利潤大幅超出預期,毛利率再創歷史新高。業績加持下,英偉達業績已突破2萬億美元,更接連超越亞馬遜、沙特阿美,成為僅次于微軟和蘋果的全球第三大公司。

  數據、算力和算法構成了大模型的基石。在當下這波如火如荼的大模型淘金熱中,從學界到初創企業再到巨頭紛紛下場,而無論其技術路線是開源或閉源,應用場景是通用或垂直,AI芯片作為大模型大腦,始終是模型預訓練和推理必不可少的工具。

  身為高端GPU市場中唯一的提供方,“軍火商”英偉達是這場大模型軍備競賽中永遠的贏家——以A100為例,若要通過訓練達到ChatGPT級別的性能,至少消耗一萬張A100加速卡,巨頭們囤貨的單位也以萬張起,怎能不賺得盆滿缽滿?

  但換個角度來看,在GPU供應短缺的背景下,一張A100顯卡售價約10000美元甚至更高,對于大模型廠商來說,在應用落地和商業化前景仍不明朗的情況下,動輒上億美元真金白銀的投入必然肉疼。在算力、數據、人力等資源成本高企的情況下,如何用相對低的成本訓練出一個想要的大模型,并以一個用戶可接受的成本讓大模型跑起來是大模型行業在2024年的當務之急。

  在保證同等效果前提下,提高硬件利用率,縮短算力使用時長;優化工具鏈以提高訓練、推理效率;適配低價GPU是當前國內大模型廠商降本的主流方法論。

  例如,面向大模型訓練,騰訊升級了自研機器學習框架Angel,針對預訓練、模型精調和強化學習等全流程進行了加速和優化,提升了內存的利用率。借此,大模型訓練效率可提升至主流開源框架的2.6倍,用該框架訓練千億級大模型可節省50%算力成本,大模型推理速度提高了1.3倍。

  京東云推出vGPU池化方案,提供一站式GPU算力池化能力,結合算力的任意切分和按需分配,在同等GPU數量的前提下,實現了數倍業務量擴展和資源共享,降低了硬件采購成本,使用更少的AI芯片支撐了更多的訓練和推理任務,GPU利用率最高提升70%,大幅降低大模型推理成本。

  阿里云通義大模型則聚焦于規模定理,基于小模型數據分布、規則和配比,研究大規模參數下如何提升模型能力,并通過對底層集群的優化,將模型訓練效率提升了30%,訓練穩定性提升了15%。

  百度升級了異構計算平臺“百舸”,將訓練和推理場景的吞吐量提高了30%-60%,意味著原先需要用100天的訓練才能達成的效果,現在只需40-70天,節約時間等于間接省錢。同時,在英偉達之外,百度的“千帆”大模型平臺還兼容昆侖芯、昇騰、海光DCU、英特爾等國內外其他主流AI芯片,通過組合選項完成低成本的算力適配。

  正所謂“早買早享受,晚買有折扣。”當前,Mistral AI以性價比暫時領先,但也有不少開發者還在等待OpenAI大模型產品的升級降價。畢竟,正是OpenAI自己在GPT-4發布后不到8個月就推出了更強也更便宜的GPT-4 Turbo。  



Tags:大模型   點擊:()  評論:()
聲明:本站部分內容及圖片來自互聯網,轉載是出于傳遞更多信息之目的,內容觀點僅代表作者本人,不構成投資建議。投資者據此操作,風險自擔。如有任何標注錯誤或版權侵犯請與我們聯系,我們將及時更正、刪除。
▌相關推薦
AI程序員上崗 垂類大模型應用迎來井噴期
能自動寫代碼的“AI員工”、逐漸告別不夠好用的智能客服,無需費時費力開發的工業AI控制器&hellip;&hellip;隨著人工智能大模型能力開始深入多個行業,IT、工業生產、金融、服務...【詳細內容】
2024-04-08  Search: 大模型  點擊:(3)  評論:(0)  加入收藏
AI程序員上崗 垂類大模型應用迎來井噴期
能自動寫代碼的“AI員工”、逐漸告別不夠好用的智能客服,無需費時費力開發的工業AI控制器&hellip;&hellip;隨著人工智能大模型能力開始深入多個行業,IT、工業生產、金融、服務...【詳細內容】
2024-04-07  Search: 大模型  點擊:(2)  評論:(0)  加入收藏
AI干掉聲優?音頻大模型追逐“圖靈時刻”
七十年前,“人工智能之父”圖靈提出,如果人無法判斷屏幕的另一側究竟是人還是機器,就證明機器具備了人一樣的智能。這一經典的圖靈測試如同北斗星一般,指引著AI行業的工作者們不...【詳細內容】
2024-04-03  Search: 大模型  點擊:(5)  評論:(0)  加入收藏
大模型Kimi火了,長文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200萬字無損上下文,在長上下文窗口技術上再次取得突破,引燃人工智能領域新一輪投資熱情?! z影/寧穎OpenAI官方去年11月發布的GPT-4 Turbo,支持1...【詳細內容】
2024-03-29  Search: 大模型  點擊:(13)  評論:(0)  加入收藏
大模型應用的 10 種架構模式
作者 | 曹洪偉在塑造新領域的過程中,我們往往依賴于一些經過實踐驗證的策略、方法和模式。這種觀念對于軟件工程領域的專業人士來說,已經司空見慣,設計模式已成為程序員們的重...【詳細內容】
2024-03-27  Search: 大模型  點擊:(13)  評論:(0)  加入收藏
超長文本是AI大模型的能力突破口嗎?
◎記者 劉怡鶴近日,能“一口氣讀完20萬字小說”的AI大模型應用Kimi再次為國內AI產業添了一把火。業內認為,國產大模型能力提升或成今年國內AI領域最核心的主線。超長上下文是...【詳細內容】
2024-03-26  Search: 大模型  點擊:(8)  評論:(0)  加入收藏
百度AI“咬”了一口蘋果 大模型商用有戲了?
百度3月25日突傳利好。據知情人士透露,百度將為蘋果今年發布的iPhone16、Mac系統和ios18提供AI功能。消息人士稱,蘋果曾與阿里以及另外一家國產大模型公司進行過洽談,最后確定...【詳細內容】
2024-03-26  Search: 大模型  點擊:(17)  評論:(0)  加入收藏
Kimi引燃大模型“長文本競賽”,阿里360百度急出手
從ChapGPT到Sora,從數千億參數到千萬長文本,大模型浪潮下,永遠不缺熱點。近日,“Kimi概念股暴漲”“Kimi為宕機道歉”等詞條先后沖上微博熱搜,讓月之暗面這家剛成立一年的人工智...【詳細內容】
2024-03-25  Search: 大模型  點擊:(15)  評論:(0)  加入收藏
Kimi爆了 國產大模型應用元年還遠嗎?
國產大模型應用Kimi近日可謂橫空出世。根據Similarweb數據,Kimi智能助手的周度訪問量由23年12月初的15萬提升至近期(3.10-3.16)的超過200萬,APP端下載量也快速提升,從2月初的效率...【詳細內容】
2024-03-22  Search: 大模型  點擊:(14)  評論:(0)  加入收藏
國產大模型開卷“比誰長”?Kimi爆火點燃長文本競爭賽道
來源:財聯社近日,又一現象級AI應用Kimi爆火出圈,在用戶端和資本市場都掀起波瀾,引發多個Kimi相關概念股異常波動。海天瑞聲(688787.SH)、中廣天擇(603721.SH)等上市公司紛紛回應“無...【詳細內容】
2024-03-22  Search: 大模型  點擊:(5)  評論:(0)  加入收藏
▌簡易百科推薦
多方熱議人工智能產業新機遇
編者按&emsp;&emsp;從前沿科技展會到高層對話平臺,從上海、重慶到博鰲,從線上到線下&hellip;&hellip;一場場高規格、大規模的盛會中,人工智能正在成為各界熱議的高頻詞。賦能千...【詳細內容】
2024-04-08    中國家電網  Tags:人工智能   點擊:(2)  評論:(0)  加入收藏
?人形機器人時代來了嗎
日前,由中國人形機器人(11.080, -0.05, -0.45%)百人會主辦的人形機器人大賽在北京經濟技術開發區開賽。工作人員向參觀者展示一款人形機器人。參觀者與一款陪護型人形機器人...【詳細內容】
2024-04-08    中國青年報  Tags:?人形機器人   點擊:(2)  評論:(0)  加入收藏
AI重塑社交:騰訊與字節跳動的新賽場
文|新火種 一號編輯|美美最近,騰訊和字節跳動這兩大互聯網巨頭幾乎同步推出了各自的AI社交產品,盡管騰訊和字節跳動在前段時間剛剛“破冰”,但這一舉措不僅意味著這兩大巨頭之...【詳細內容】
2024-04-07    藍鯨財經  Tags:AI   點擊:(6)  評論:(0)  加入收藏
第一批用 Kimi 做內容的網紅已經殺瘋了
作者:王東東 文章來自:斗戰圣佛小組技術信仰派 VS 市場信仰派 朱嘯虎和月之暗面老板楊植麟在前幾天有一場不算 battle 的 battle。battle 的爭論點是:大模型有沒有戲。技術派...【詳細內容】
2024-04-04    斗戰圣佛小組  Tags:Kimi   點擊:(4)  評論:(0)  加入收藏
昆侖萬維發布面向人工智能時代的六條人才宣言
過去的一年多,是人工智能取得非凡進步的一年。在這充滿突破性技術飛躍和備受爭議的一年里,我們見證了人工智能的快速發展和廣泛的影響,人工智能已經迅速地融入了我們的生活,深刻...【詳細內容】
2024-04-03    砍柴網  Tags:昆侖萬維   點擊:(7)  評論:(0)  加入收藏
AI干掉聲優?音頻大模型追逐“圖靈時刻”
七十年前,“人工智能之父”圖靈提出,如果人無法判斷屏幕的另一側究竟是人還是機器,就證明機器具備了人一樣的智能。這一經典的圖靈測試如同北斗星一般,指引著AI行業的工作者們不...【詳細內容】
2024-04-03    第一財經網  Tags:AI   點擊:(5)  評論:(0)  加入收藏
生成式人工智能有哪些新趨勢?
相較于去年,當下我們所能體驗的人工智能技術的范圍已經大幅提升。從搜索引擎、電商平臺再到社媒平臺,只要是以搜索結果為導向的內容,都會出現它的身影。但其實,人工智能的應用場...【詳細內容】
2024-04-03  品談教師幫    Tags:人工智能   點擊:(6)  評論:(0)  加入收藏
AI世界的新難題:互聯網的信息不夠用了!
高質量數據的緊缺正成為AI發展的重要障礙。4月1日,據媒體報道,隨著OpenAI、Google等企業不斷深入發展AI技術,科技巨頭們遇到了一個新問題:現有的互聯網信息量可能不足以支撐他們...【詳細內容】
2024-04-02  硬AI    Tags:AI   點擊:(6)  評論:(0)  加入收藏
今天起,ChatGPT無需注冊就能用了!
 來源:量子位    金磊 克雷西 發自 凹非寺  就在剛剛,OpenAI狠狠地open了一把:從今天起,ChatGPT打開即用,無需再注冊帳號和登錄了!  像這樣,直接登錄網站,然后就可以開啟對...【詳細內容】
2024-04-02    量子位   Tags:ChatGPT   點擊:(7)  評論:(0)  加入收藏
AI時代,面對死亡有了第二種選擇?
今年春節期間,羅佩璽瞞著媽媽用AI技術“復活”了外婆,她將媽媽現在的模樣和外婆留下的老照片合成在一起。時隔60多年,媽媽和外婆終于又“見面”了,這是她送給媽媽的生日禮物。收...【詳細內容】
2024-04-02    中國青年報  Tags:AI時代   點擊:(7)  評論:(0)  加入收藏
站內最新
站內熱門
相關頭條
站內頭條
日无码在线观看