首頁 > 區(qū)塊鏈 > 2024 年，誰能成為中國大模型的 F4？

2024 年，誰能成為中國大模型的 F4？

時間：2024-02-07 14:18:00

來源：hao86下載

區(qū)塊鏈

【#區(qū)塊鏈# #2024 年，誰能成為中國大模型的 F4？#】

文章來源：AI科技評論

作者：何思思

圖片來源：由無界AI生成

如果用一個詞描述2023年大模型的發(fā)展，“瘋狂”似乎再適合不過了。

2023年年初，大模型席卷了整個科技圈，并貫穿了各企業(yè)發(fā)展的始終。

從大模型這個新物種涌現(xiàn)出來的智能能力看，人們愿意相信，它可能會顛覆原有的生產(chǎn)生活方式，甚至?xí)苿涌萍?、?jīng)濟向前發(fā)展一大步。于是，以百度、阿里、華為代表的大廠紛紛押注，進軍大模型賽道，并很快研發(fā)出了文心、千義通問、混元、盤古等大模型，并持續(xù)迭代創(chuàng)新。

從各個維度來看，無論是在人才儲備和技術(shù)方面，頭部大廠都是最具備大模型的研發(fā)實力的廠商。但是這個過程中，不少創(chuàng)業(yè)公司也想要嘗嘗鮮，其中有幾家的呼聲尤為高，如智譜 AI、MiniMax、百川智能、月之暗面等。此外，面壁智能、深言科技、零一萬物等企業(yè)也快速成長。他們在大模型方面的一系列動作，在整個科技圈掀起了一層又一層浪，甚至要比頭部大廠顯得更為激進。

但大模型終究是一場殘酷的競賽。2023 年如火如荼，主要拼融資與模型層，市場對大模型的認知也還處于初步階段。到了 2024 年，隨著市場對大模型的認知逐步深入，資本的布局逐漸明朗，大模型公司所面臨的挑戰(zhàn)也同步升級。除了模型能力，算力、數(shù)據(jù)、商業(yè)化等等也都要交出新的答卷。

新的一年，大浪淘沙，“大模型 F4”孰是孰非，或許還有新的變數(shù)。

1、智譜 AI：估值超 200 億

智譜 AI 可以說是國內(nèi)最早研發(fā)大模型的企業(yè)之一。公開資料顯示，智譜成立于2019年6月11日，由清華大學(xué)知識工程實驗室（KEG）技術(shù)成果轉(zhuǎn)化而來，團隊的核心人員來自清華，是此次大模型浪潮中清華系參與的代表。

智譜 AI 團隊的核心人員曾參與過清華大學(xué)與智源研究院大模型合作項目“悟道”的研發(fā)工作，為智譜在大模型領(lǐng)域的發(fā)展打下了堅實基礎(chǔ)。

作為最早參與中國大模型研究的創(chuàng)業(yè)團隊之一，智譜是最早研發(fā)出千億參數(shù)大模型的公司之一，早于 ChatGPT 火熱之前：2022 年 8 月，智譜發(fā)布了雙語千億級超大規(guī)模預(yù)訓(xùn)練模型 GLM-130B，支持中英雙語，在多個公開評測集上性能超過GPT-3。2023 年 ChatGPT 爆發(fā)后，智譜僅用了兩個月的時間就成功復(fù)刻 ChatGPT，開發(fā)出了 ChatGLM。

除了語言大模型，智譜在代碼生成、文生圖、多模態(tài)、對話等不同領(lǐng)域也均有不同參數(shù)版本的大模型，是目前中國在大模型種類與多樣性上布局最多的創(chuàng)業(yè)公司。比如語言模型，有適合用于在手機上的端側(cè)模型，1.5 B、3B、6B，也有可商業(yè)化的12B、32B、66B、130B參數(shù)的模型。2024 年 1 月，智譜舉行開發(fā)者大會“DevDay”，發(fā)布了新一代對標(biāo) OpenAI GPT-4 的基座大模型 GLM-4。

因為技術(shù)先行，智譜在商業(yè)化上也走得比其他家快。據(jù)了解，智譜是目前國內(nèi)少有的開始商業(yè)化的大模型公司之一。在過去的一年，在商業(yè)化上，智譜首先沖 B 端與 G 端，商業(yè)化團隊也從十幾人擴張到了 100 人以上。據(jù) AI 科技評論了解，智譜在 2023 年的商業(yè)收入在 2 億至 4 億人民幣之間。

融資上，據(jù) AI 科技評論多方驗證，目前智譜的融資金額與估值在國內(nèi)大模型初創(chuàng)公司中排名第一。據(jù)官方消息，智譜 AI 已累計融資超過 25 億人民幣，目前估值超過 200 億人民幣（報價 40 億美金）。消息稱，智譜近期還會公布新一輪融資情況。

2、MiniMax：估值超 20 億美元

據(jù) AI 科技評論了解， MiniMax 的估值在國內(nèi)諸多大模型公司中僅次于智譜 AI。

MiniMax 成立于 2021 年 11 月。據(jù) AI 科技評論了解，MiniMax 的創(chuàng)始團隊最早活躍于美國硅谷，早在 OpenAI 于 2020 年 6 月發(fā)布 GPT-3 時就已捕捉到該機構(gòu)與大模型方向的潛力，因此回國創(chuàng)業(yè)。MiniMax 的創(chuàng)始團隊成員信息相對于其他大模型公司來說更為低調(diào)，其中一個聯(lián)合創(chuàng)始人是前商湯研究院副院長、通用智能技術(shù)負責(zé)人閆俊杰，技術(shù)風(fēng)格偏工程化。

目前，MiniMax 的團隊成員規(guī)模也已經(jīng)超過 200 人。2023 年，MiniMax 給外界呈現(xiàn)兩個印象：一是底層模型覆蓋了文本到視覺、文本到語音、文本到文本三個模態(tài)；二是產(chǎn)品與商業(yè)兩條腿走路，覆蓋 B 端與 C 端，以 C 端影響力為主，推出了星野、Talkie 等交互型創(chuàng)新產(chǎn)品，以及面向 B 端的“MiniMax 開放平臺”。

前不久，AI 科技評論報道了 MiniMax 最新語音大模型：個性經(jīng)濟時代，MiniMax 語音大模型如何 To C？

2024 年伊始，MiniMax 也發(fā)布了新一代語言大模型 abab6。

3、零一萬物：估值 20 億美元

成立于 2023 年年中的零一萬物在技術(shù)與估值上的沖勁同樣不容小覷。據(jù) AI 科技評論了解，盡管去年出現(xiàn) Yi 風(fēng)波的影響，但零一萬物的大模型在海內(nèi)外的開發(fā)者中頗具口碑，估值也水漲船高。

2023 年 11 月 6 日，零一萬發(fā)布首款開源大模型——Yi 系列大模型，包括 Yi-6B、Yi-34B。Yi-6B 適合個人及研究用途，Yi-34B 更應(yīng)用于多元的場景，更滿足開源社區(qū)的需求。2024年1月22日，零一萬物發(fā)布并開源了多模態(tài)語言大模型Yi-VL，同樣包括 Yi-VL-34B 和 Yi-VL-6B 兩個版本。

據(jù) AI 科技評論了解，目前零一萬物的團隊規(guī)模在 200 人左右，聚集了來自 OpenAI、谷歌與微軟的海外優(yōu)秀人才，以及國內(nèi)知名互聯(lián)網(wǎng)大廠、上一代 AI 獨角獸的算法工程師。較其他大模型創(chuàng)業(yè)團隊來說，零一萬物的成員平均年齡較大，技術(shù)經(jīng)驗豐富，同時團隊也在注重招入年輕人才。

有投資人士向 AI 科技評論評價，“零一萬物可能是國內(nèi)最擅長 To VC（面向風(fēng)險投資人）的大模型創(chuàng)業(yè)公司?！绷阋蝗f物的創(chuàng)始人李開復(fù)博士是技術(shù)出身，同時有多年的投資經(jīng)驗，在這波大模型的投資圈中口碑甚佳。盡管一直保持低調(diào)行事的風(fēng)格，但據(jù)最新了解，零一萬物的估值已經(jīng)達到 20 億美元。

商業(yè)化方面，據(jù)知情人士透露，2024 年，零一萬物主要發(fā)力 C 端市場。

4、百川智能：估值 18 億美元

目前百川智能的估值在國內(nèi)大模型賽道中排名前三。據(jù) AI 科技評論了解，百川智能正在進行新一輪 3 億美元融資，融資結(jié)果還未確定。

百川的創(chuàng)始人兼 CEO 是王小川，核心骨干來自前搜狗團隊。過去一年，百川在大模型的成果發(fā)布上頻次最多。AI 科技評論了解，百川內(nèi)部在大模型的研發(fā)上啟動賽馬機制，兩個團隊或多個團隊同時展開同一款大模型的研發(fā)，哪個團隊的效果更好、更快研發(fā)完，就上線哪個團隊的大模型。

2023 年，僅成立不到 100 天的時間，百川智能就將其研發(fā)的 Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat 與其 4bit 量化版本開源、免費可商用，之后又上線了大模型 API，緊接著開放了基于搜索增強的 Baichuan2-Turbo 系列 API，包含 Baichuan2-Turbo-192K 及 Baichuan2-Turb。2024 年 1 月 29 日，百川智能發(fā)布了超千億參數(shù)的大語言模型 Baichuan 3。

截至目前，百川智能的融資金額已達 3.5 億美元，如今估值 18 億美金。

5、月之暗面：投前估值 15 億美元

與智譜 AI 一樣，月之暗面也是清華系的大模型創(chuàng)業(yè)公司，成立于 2023 年 4 月。月之暗面的創(chuàng)始人楊植麟也是智源與清華合作項目悟道的核心參與成員，本科就讀于清華計算機系期間師從唐杰，曾參與創(chuàng)立另一家自然語言處理技術(shù)為核心的初創(chuàng)公司循環(huán)智能。

據(jù)多位投資圈與技術(shù)圈的資深人士評價，楊植麟是他們接觸過的“國內(nèi)最了解大模型技術(shù)的年輕人之一”。楊植麟在大模型方面有清楚的規(guī)劃與邏輯，對于 AGI 的推動有明確的時間線。在目標(biāo)上，月之暗面的野心也很大，據(jù)接近月之暗面的人透露，月之暗面在技術(shù)上追趕的目標(biāo)只有兩個：一個是 OpenAI，一個是 Anthropic AI。

月之暗面的團隊中，創(chuàng)始人楊植麟與三位聯(lián)合創(chuàng)始人張宇韜、周昕宇、吳育昕均畢業(yè)于清華，核心成員曾參與谷歌 Bard、盤古、悟道等多個大模型的研發(fā)，多項核心技術(shù)被 Google PaLM、Meta LLaMa、Stable Diffusion 等主流產(chǎn)品采用。

因此，月之暗面雖是后來者，但在融資與估值上也增長迅猛。如 AI 科技評論不久前報道，月之暗面正在進行新一輪 2 億美元的融資，投前估值 15 億美金。據(jù)最新了解，如新一輪融資順利進行，月之暗面的投后估值將超過 20 億美金。

目前，月之暗面的團隊在 100 到 200 人間，技術(shù)團隊以 90 后為主，人才密度極高。此外，據(jù)悉，除了長文本處理，月之暗面也在長視頻領(lǐng)域有布局，主打 C 端市場，技術(shù)棧與產(chǎn)品在國內(nèi)大模型初創(chuàng)公司中的氣質(zhì)也很獨特。