【#區(qū)塊鏈# #2024 年,誰能成為中國大模型的 F4?#】
文章來源:AI科技評論
作者:何思思
如果用一個詞描述2023年大模型的發(fā)展,“瘋狂”似乎再適合不過了。
2023年年初,大模型席卷了整個科技圈,并貫穿了各企業(yè)發(fā)展的始終。
從大模型這個新物種涌現(xiàn)出來的智能能力看,人們愿意相信,它可能會顛覆原有的生產(chǎn)生活方式,甚至?xí)苿涌萍?、?jīng)濟向前發(fā)展一大步。于是,以百度、阿里、華為代表的大廠紛紛押注,進軍大模型賽道,并很快研發(fā)出了文心、千義通問、混元、盤古等大模型,并持續(xù)迭代創(chuàng)新。
從各個維度來看,無論是在人才儲備和技術(shù)方面,頭部大廠都是最具備大模型的研發(fā)實力的廠商。但是這個過程中,不少創(chuàng)業(yè)公司也想要嘗嘗鮮,其中有幾家的呼聲尤為高,如智譜 AI、MiniMax、百川智能、月之暗面等。此外,面壁智能、深言科技、零一萬物等企業(yè)也快速成長。他們在大模型方面的一系列動作,在整個科技圈掀起了一層又一層浪,甚至要比頭部大廠顯得更為激進。
但大模型終究是一場殘酷的競賽。2023 年如火如荼,主要拼融資與模型層,市場對大模型的認知也還處于初步階段。到了 2024 年,隨著市場對大模型的認知逐步深入,資本的布局逐漸明朗,大模型公司所面臨的挑戰(zhàn)也同步升級。除了模型能力,算力、數(shù)據(jù)、商業(yè)化等等也都要交出新的答卷。
新的一年,大浪淘沙,“大模型 F4”孰是孰非,或許還有新的變數(shù)。
智譜 AI 可以說是國內(nèi)最早研發(fā)大模型的企業(yè)之一。公開資料顯示,智譜成立于2019年6月11日,由清華大學(xué)知識工程實驗室(KEG)技術(shù)成果轉(zhuǎn)化而來,團隊的核心人員來自清華,是此次大模型浪潮中清華系參與的代表。
智譜 AI 團隊的核心人員曾參與過清華大學(xué)與智源研究院大模型合作項目“悟道”的研發(fā)工作,為智譜在大模型領(lǐng)域的發(fā)展打下了堅實基礎(chǔ)。
作為最早參與中國大模型研究的創(chuàng)業(yè)團隊之一,智譜是最早研發(fā)出千億參數(shù)大模型的公司之一,早于 ChatGPT 火熱之前:2022 年 8 月,智譜發(fā)布了雙語千億級超大規(guī)模預(yù)訓(xùn)練模型 GLM-130B,支持中英雙語,在多個公開評測集上性能超過GPT-3。2023 年 ChatGPT 爆發(fā)后,智譜僅用了兩個月的時間就成功復(fù)刻 ChatGPT,開發(fā)出了 ChatGLM。
除了語言大模型,智譜在代碼生成、文生圖、多模態(tài)、對話等不同領(lǐng)域也均有不同參數(shù)版本的大模型,是目前中國在大模型種類與多樣性上布局最多的創(chuàng)業(yè)公司。比如語言模型,有適合用于在手機上的端側(cè)模型,1.5 B、3B、6B,也有可商業(yè)化的12B、32B、66B、130B參數(shù)的模型。2024 年 1 月,智譜舉行開發(fā)者大會“DevDay”,發(fā)布了新一代對標(biāo) OpenAI GPT-4 的基座大模型 GLM-4。
因為技術(shù)先行,智譜在商業(yè)化上也走得比其他家快。據(jù)了解,智譜是目前國內(nèi)少有的開始商業(yè)化的大模型公司之一。在過去的一年,在商業(yè)化上,智譜首先沖 B 端與 G 端,商業(yè)化團隊也從十幾人擴張到了 100 人以上。據(jù) AI 科技評論了解,智譜在 2023 年的商業(yè)收入在 2 億至 4 億人民幣之間。
融資上,據(jù) AI 科技評論多方驗證,目前智譜的融資金額與估值在國內(nèi)大模型初創(chuàng)公司中排名第一。據(jù)官方消息,智譜 AI 已累計融資超過 25 億人民幣,目前估值超過 200 億人民幣(報價 40 億美金)。消息稱,智譜近期還會公布新一輪融資情況。
據(jù) AI 科技評論了解, MiniMax 的估值在國內(nèi)諸多大模型公司中僅次于智譜 AI。
MiniMax 成立于 2021 年 11 月。據(jù) AI 科技評論了解,MiniMax 的創(chuàng)始團隊最早活躍于美國硅谷,早在 OpenAI 于 2020 年 6 月發(fā)布 GPT-3 時就已捕捉到該機構(gòu)與大模型方向的潛力,因此回國創(chuàng)業(yè)。MiniMax 的創(chuàng)始團隊成員信息相對于其他大模型公司來說更為低調(diào),其中一個聯(lián)合創(chuàng)始人是前商湯研究院副院長、通用智能技術(shù)負責(zé)人閆俊杰,技術(shù)風(fēng)格偏工程化。
目前,MiniMax 的團隊成員規(guī)模也已經(jīng)超過 200 人。2023 年,MiniMax 給外界呈現(xiàn)兩個印象:一是底層模型覆蓋了文本到視覺、文本到語音、文本到文本三個模態(tài);二是產(chǎn)品與商業(yè)兩條腿走路,覆蓋 B 端與 C 端,以 C 端影響力為主,推出了星野、Talkie 等交互型創(chuàng)新產(chǎn)品,以及面向 B 端的“MiniMax 開放平臺”。
前不久,AI 科技評論報道了 MiniMax 最新語音大模型:個性經(jīng)濟時代,MiniMax 語音大模型如何 To C?
2024 年伊始,MiniMax 也發(fā)布了新一代語言大模型 abab6。
成立于 2023 年年中的零一萬物在技術(shù)與估值上的沖勁同樣不容小覷。據(jù) AI 科技評論了解,盡管去年出現(xiàn) Yi 風(fēng)波的影響,但零一萬物的大模型在海內(nèi)外的開發(fā)者中頗具口碑,估值也水漲船高。
2023 年 11 月 6 日,零一萬發(fā)布首款開源大模型——Yi 系列大模型,包括 Yi-6B、Yi-34B。Yi-6B 適合個人及研究用途,Yi-34B 更應(yīng)用于多元的場景,更滿足開源社區(qū)的需求。2024年1月22日,零一萬物發(fā)布并開源了多模態(tài)語言大模型Yi-VL,同樣包括 Yi-VL-34B 和 Yi-VL-6B 兩個版本。
據(jù) AI 科技評論了解,目前零一萬物的團隊規(guī)模在 200 人左右,聚集了來自 OpenAI、谷歌與微軟的海外優(yōu)秀人才,以及國內(nèi)知名互聯(lián)網(wǎng)大廠、上一代 AI 獨角獸的算法工程師。較其他大模型創(chuàng)業(yè)團隊來說,零一萬物的成員平均年齡較大,技術(shù)經(jīng)驗豐富,同時團隊也在注重招入年輕人才。
有投資人士向 AI 科技評論評價,“零一萬物可能是國內(nèi)最擅長 To VC(面向風(fēng)險投資人)的大模型創(chuàng)業(yè)公司?!绷阋蝗f物的創(chuàng)始人李開復(fù)博士是技術(shù)出身,同時有多年的投資經(jīng)驗,在這波大模型的投資圈中口碑甚佳。盡管一直保持低調(diào)行事的風(fēng)格,但據(jù)最新了解,零一萬物的估值已經(jīng)達到 20 億美元。
商業(yè)化方面,據(jù)知情人士透露,2024 年,零一萬物主要發(fā)力 C 端市場。
目前百川智能的估值在國內(nèi)大模型賽道中排名前三。據(jù) AI 科技評論了解,百川智能正在進行新一輪 3 億美元融資,融資結(jié)果還未確定。
百川的創(chuàng)始人兼 CEO 是王小川,核心骨干來自前搜狗團隊。過去一年,百川在大模型的成果發(fā)布上頻次最多。AI 科技評論了解,百川內(nèi)部在大模型的研發(fā)上啟動賽馬機制,兩個團隊或多個團隊同時展開同一款大模型的研發(fā),哪個團隊的效果更好、更快研發(fā)完,就上線哪個團隊的大模型。
2023 年,僅成立不到 100 天的時間,百川智能就將其研發(fā)的 Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat 與其 4bit 量化版本開源、免費可商用,之后又上線了大模型 API,緊接著開放了基于搜索增強的 Baichuan2-Turbo 系列 API,包含 Baichuan2-Turbo-192K 及 Baichuan2-Turb。2024 年 1 月 29 日,百川智能發(fā)布了超千億參數(shù)的大語言模型 Baichuan 3。
截至目前,百川智能的融資金額已達 3.5 億美元,如今估值 18 億美金。
與智譜 AI 一樣,月之暗面也是清華系的大模型創(chuàng)業(yè)公司,成立于 2023 年 4 月。月之暗面的創(chuàng)始人楊植麟也是智源與清華合作項目悟道的核心參與成員,本科就讀于清華計算機系期間師從唐杰,曾參與創(chuàng)立另一家自然語言處理技術(shù)為核心的初創(chuàng)公司循環(huán)智能。
據(jù)多位投資圈與技術(shù)圈的資深人士評價,楊植麟是他們接觸過的“國內(nèi)最了解大模型技術(shù)的年輕人之一”。楊植麟在大模型方面有清楚的規(guī)劃與邏輯,對于 AGI 的推動有明確的時間線。在目標(biāo)上,月之暗面的野心也很大,據(jù)接近月之暗面的人透露,月之暗面在技術(shù)上追趕的目標(biāo)只有兩個:一個是 OpenAI,一個是 Anthropic AI。
月之暗面的團隊中,創(chuàng)始人楊植麟與三位聯(lián)合創(chuàng)始人張宇韜、周昕宇、吳育昕均畢業(yè)于清華,核心成員曾參與谷歌 Bard、盤古、悟道等多個大模型的研發(fā),多項核心技術(shù)被 Google PaLM、Meta LLaMa、Stable Diffusion 等主流產(chǎn)品采用。
因此,月之暗面雖是后來者,但在融資與估值上也增長迅猛。如 AI 科技評論不久前報道,月之暗面正在進行新一輪 2 億美元的融資,投前估值 15 億美金。據(jù)最新了解,如新一輪融資順利進行,月之暗面的投后估值將超過 20 億美金。
目前,月之暗面的團隊在 100 到 200 人間,技術(shù)團隊以 90 后為主,人才密度極高。此外,據(jù)悉,除了長文本處理,月之暗面也在長視頻領(lǐng)域有布局,主打 C 端市場,技術(shù)棧與產(chǎn)品在國內(nèi)大模型初創(chuàng)公司中的氣質(zhì)也很獨特。
除了上述提到的五家企業(yè),大模型賽道也還有一些新星正冉冉升起,如面壁智能、元象唯星、深度求索(幻方旗下 AI 創(chuàng)業(yè)公司)、深言科技等等,同樣值得我們的關(guān)注。
毫無疑問,智譜 AI、MiniMax、零一萬物、百川智能與月之暗面在 2023 年的融資能力最為突出,也最受行業(yè)關(guān)注。如大模型是一個新的科技浪潮,模型、基建、數(shù)據(jù)、人才、資金等等均是重要影響因素。但這是一場馬拉松賽跑,誰能堅持到最后,誰才有可能成為贏家。
2024 年,融資、人才、商業(yè)、產(chǎn)品的多維度挑戰(zhàn)下,誰能最終成為國內(nèi)大模型的 F4?或許這仍是一個值得期待的答案。
小編推薦下載
相關(guān)推薦
相關(guān)文章
更多>>資訊排行
同類軟件下載
終極F4賽車 體育競技
我不可能成為社畜 模擬經(jīng)營
中國模型網(wǎng) 購物優(yōu)惠
我不可能成為社畜安卓版 模擬經(jīng)營
中國大能手 學(xué)習(xí)工具
中國大閘蟹 生活實用
中國大律師 生活實用
中國大蒜網(wǎng) 生活實用
中國大學(xué)MOOC 學(xué)習(xí)工具
中國大米平臺 購物優(yōu)惠
熱門標(biāo)簽