文 | 蘇建勛
如果你抱著“圍觀炫技”的念頭觀看人工智能公司「第四范式」最近的發布會,或許不會感受到獵奇般的興奮。事實上,在創始人戴文淵的籌劃里,他就沒打算讓聊天、畫圖、寫小說、寫代碼這類To C式的噱頭成為第四范式頭頂上的標簽——盡管多數AI公司都對此樂此不疲。
【資料圖】
“式說”大模型的寫代碼示例;圖片來自第四范式
4月26日,第四范式首次展示其大模型產品「式說3.0」,在半個小時的斷網環境下用畫飛機、寫代碼秀了下模型肌肉后,戴文淵拋出了他認為的“更重要的事”:
“今天更重要的,是想跟大家分享我們要做的事情:用生成式AI重構企業軟件,我們稱之為AIGS。”戴文淵談到。
AIGS(AI-Generated Software),戴文淵將其定為第四范式的核心戰略,也是這位曾經的ACM世界冠軍、百度最年輕的T10科學家、江湖人稱“戴神”的AI獨角獸公司CEO,為2023年的這波AI浪潮,交上的第一張答卷。
“這次的變化很難估計是多少萬億的市場,大家都有機會?!闭劶盁岢睕坝康腁I領域,戴文淵對36氪表示,而他眼中屬于第四范式的機會,來自于中國軟件市場的特殊生態。
一個直觀的感性認知是,國內B端軟件在體驗上乏善可陳,“我們公司的報銷系統也挺難用”,戴文淵坦承。在他的理想中,相比在系統菜單欄逐個點擊的報銷動作,如果能給軟件安上生成式AI的心臟——用Chat的方式說“我要報銷”,把票拍給系統、識別出餐票、詢問用餐對象,得到回復后完成報銷——這種體驗顯然比現在的報銷系統要強得多。
不論是內部OA、ERP、CRM,還是外部業務管理軟件,上述可以被AI優化的場景不勝枚舉。
比如物流,區域經理想知道某個快遞員上周有沒有偷懶;比如工廠,車間主任想知道流水線有沒有違規操作——在過去,他們要從密密麻麻的Excel表格、監控視頻等數據庫中找尋蛛絲馬跡,但現在,只需要在“式說”的對話框中提問:
上周朝陽區有哪些快遞員送件量在2000以下?
近三天工廠里有沒有出現過違規操作?
如同搜索引擎的一個問答瞬間,“式說”就能依據企業的快遞員當班/發件數據、工廠流水線視頻監控記錄……找到問題的答案。
“企業都有這些數據,但你不能要求一個區域經理會操作數據庫,如果用更加自然的交互方式,其實可以很好地幫助企業管好團隊?!贝魑臏Y對36氪表示。
“式說”在裝配集裝箱的應用示例;圖片來自第四范式
不過,只有用戶體驗還不夠。第四范式敢于提出AIGS的另一原因,是AI對于軟件開發效率的極大提升。
由于人力成本不高,國內To B軟件有著“定制化”的夢魘,軟件商們被一個個菜單式的需求所困,靠臟活累活掙著“人/天”費用,稍有項目失控,就會面臨企業盈虧的失衡。
而生成式AI的革新,正是打破原有菜單式的軟件交互,轉而將重點放在算力、數據端的升級,面向用戶的,僅是一個干凈簡潔的對話框。
“轉變為AIGS的商業模式后,開發功能點就不用很長時間,只要你的軟件還在使用,就能持續不斷獲得算力的收入,對軟件公司來說,是一個特別大的商業模式革新?!贝魑臏Y對36氪說道。
如何落地AIGS?戴文淵用了“修圖”的場景,將其路徑總結為三個階段:
第一階段,Copilot(企業AI助手)調動不同的信息、數據、應用,作為助手完成用戶的指令。相當于在所有企業級軟件系統里,配備一個指揮官。指揮官聽用戶的指揮,比如“把照片亮度調亮20%”。
第二階段,Copilot+基于企業規則的“知識庫”,AI能夠參照規則做復雜工作,進一步豐富「對話框」的能力。比如AI查詢了“人像美化”知識庫后,能執行把照片修好看的步驟。
第三階段,Copilot+COT(思維鏈)。軟件系統的使用行為最終會被大模型學會,形成AI針對這個領域的思維鏈,意味著“把照片處理得更好看”這種復雜指令,AI能自動按照步驟完成。
總結來說,在第四范式的“式說3.0”大模型產品中,COT代表思維推理能力,讓機器從“圖片調亮20%”的單點步驟,進化至“把圖P好看”;而Copilot則把人的指令翻譯成要調用后臺的哪個API,兩者相結合,才能賦予企業軟件新的交互形式。
在談到第四范式帶來的軟件革命時,一位國產工業CAD廠商代表難掩興奮:“第一次看到的時候還是蠻震撼的”。
他分享了幾個場景:將“式說”模型嵌入內部工具后,可以通過多模態的形式迅速從幾十萬的零件庫中搜索到類似零件,還能在工藝設計環節,讓機器給出幾個零部件之間的裝配組合。這一切都是完成在一個“對話框”里。
“式說”在零部件的應用示例;圖片來自第四范式
是侵襲,也是革命,新的生產力替代舊的,向來是商業社會中的殘酷法則。
當36氪拋出這樣一個問題:“有沒有可能某家軟件公司通過生成式AI,成長為一家比Salesforce更厲害的公司?”幾乎沒有猶豫,戴文淵當即給出了肯定回復。
“未來另一條AGI(通用人工智能)的路線,是把現在所有軟件改造一遍。”戴文淵對36氪說。
以下是36氪等媒體專訪第四范式創始人戴文淵的采訪實錄,經編輯后發布:
一、談軟件變革:提升體驗+開發效率,To B 軟件亟待革命
Q:去年底您看到ChatGPT推出后,有什么感受?
戴文淵:實話實說,我們也沒能預見ChatGPT這種現象級的東西,在那個時間點能出來。
當時可以預見的是,GPT-3出來后,GPT路線的生成式終將有天會爆發,但是從去年底到這段時間的爆發,確實是早于我們的預期。
Q:ChatGPT爆發的時候,第四范式在這方面的積累有哪些?
戴文淵:對于業內來說,不需要等到爆發,最早谷歌BERT出來,大模型就沒有疑問了,等到GPT3就更加明確。
2018年,我們組建了大概一百多人的研究團隊,可以想象成第四范式的達摩院(當然沒有達摩院投入那么大),要保持對新技術的敏銳和提前投入。
(如果在)去年9、10月份談生成式AI,大家覺得這不鬼扯?現在最大的變化,是我們看到的這些方向都可以變成產品,變成商業化的路線往市場推進,這是ChatGPT最大的幫助——把整個市場的信心從0以下調到1了。
Q:客戶都是有迫切的需求,哪怕還不知道需求是什么。
戴文淵:這有點像當時的AlphaGo,市場早期其實也不知道AlphaGo是什么。但就想知道對我有沒有用。
這次GPT的發展速度比AlphaGo要快得多。從不知道ChatGPT是什么,到需要ChatGPT幫我做點事,也就持續了一個多月,這次的爆發速度比AlphaGo所帶來的AI熱潮與機會要大得多。
Q:第四范式很快推出了產品“式說”,這款產品迭代過程中有沒有一些有意思的故事?
戴文淵:到了今年3月底,我們和客戶的認知都在往前,當中很重要的是(意識到)企業內部軟件的問題。
如果你看企業內部的軟件,或者對比toC端和toB端的軟件——toC端軟件的用戶體驗在過去十幾年已被打磨到較高水準(比如抖音);但是toB端,想象一下企業內的報銷系統、HR系統、流程OA系統……體驗還是很差。
我們公司的報銷系統也挺難用,(理想中)如果用Chat的方式說“我要報銷”,你把票拍給系統,系統識別票的內容,識別出來是餐票,問你用餐的對象,得到回復后完成報銷。這種體驗顯然比現在的報銷系統要強得多。
這是其一,用戶體驗的提升。
其二,是開發迭代周期的提升。原先菜單式的開發,每次升級要以月計。而現在新的交互模式下,ChatGPT每天都在提升,但你感受不到它的界面發生變化,這是數據層面的升級,這種新型軟件開發形態的迭代周期也在不斷提升。
所以我們在3月底,大概發第二個版本的時候,就強調多模態和Copilot能力,首先你要去改造軟件,不能只有自然語言;第二,要支持用“對話”去調用軟件的某一個功能,才能實現軟件的改造。
很重要的一點,軟件不完全是一個個功能。比如Photoshop,才菜單欄里把圖片亮度調到5%,這是功能;對應到Chat方式,我說“把照片P好看”,就不是功能了,Photoshop里沒這樣的功能。但Photoshop現在能不能一鍵美顏?還不行。因為需要我們定義一鍵美顏執行的步驟是什么。
如果你要實現一個功能,要通過鼠標點菜單三下才能實現,體驗就不會比語音交互更好;所以用新型的交互模式替代老的,會給toB端的軟件體驗帶來很大提升。
Q:所以您希望用AI的能力重構軟件?
戴文淵:絕大多數軟件是菜單式的,你調取一個功能,在菜單里點一個下拉菜單,再點幾下進入到某一個功能。
現在當我們有更強的自然語言后,可以通過更好的交互方式實現功能調用。本質上,我們要干兩件事,第一是把軟件轉換成新型的交互;第二個是在新型交互上,通過不斷學習軟件的使用過程,讓軟件解決越來越復雜的任務。
Q:看起來,AIGS更像是一個優化數字化轉型的工具。
戴文淵:這是現在非常容易量化的點。原來IT部門開發一個功能,無論是自己開發,還是請外包,可能需要十個人開發半年。現在用新型的開發方式,一兩個人開發一兩天就搞定了。不說最后效果怎樣,整個開發效率是提升了。
我們一直在這個產業鏈里,過去和這些軟件公司互為生態。軟件公司需要第四范式提供決策類模型,第四范式也需要把決策類模型裝到應用軟件里。這樣的關系里,我們能夠看到生態的作用、問題和挑戰。
幾年前GPT3出來之后,我們基本上有了一個判斷:未來是能夠改變軟件產業的,當軟件產業被改變后,整個行業的業務價值、商業模式都會得到飛躍。
Q:這也是您做AIGS的初衷?
戴文淵:我覺得未來另一條AGI(通用人工智能)的路線,是把現在所有軟件改造一遍,改造完以后,就覆蓋了所有領域。
很難想象,通過一個大模型解決所有領域的問題,這個模型量太夸張了,OpenAI的CEO也在講,他們也要轉變技術路線。如果實現AGI是必須通過一個模型無限地擴大,最后是走不通的,至少在當前的計算架構下走不通。
Q:“所有軟件改造一遍”,您預計這個過程會持續多久?這是在原有基礎上可以修繕的,還是一個徹底顛覆的過程?
戴文淵:起碼要五年,軟件的改變不可能一步到位,使用習慣也不可能一天內從一個菜單直接跨到對話框,需要一個循序漸進的過程。
單個軟件可能一到三年可以完成轉變,但整個行業起碼要五年,改變完以后,會是一個完全的、跨時代的升級。
Q:現在“式說”有哪些代表性的場景和案例?
戴文淵:我們真正target的是企業銷售管理軟件、財務管理、采購軟件、研發的軟件,以及像制造企業的CAD軟件等。
比如CAD軟件,我們能實現新型的交互,可以找到相似的零件,把兩個零件做裝配;比如門店管理,看哪些人上班遲到了,哪些人沒有按照規則操作。很多店長不會用傳統門店管理軟件,還是用最原始的方式管,用更好的交互形態,其實能很好地賦能基層員工。
還有快遞,比如倉庫經理想知道轄區內快遞員最近一個月運了多少單,投遞冠軍是誰,誰偷懶。企業都有這些數據,但你不能要求一個區域經理會操作數據庫,如果用更加自然的交互方式,其實可以很好地幫助企業管理好團隊。
我只是舉了一些例子,這個適用面是非常廣的,本質上每個企業里都有各種各樣的管理軟件,它們都能用更好的形態去實現。
二、談趨勢:算力不可能無限擴張;生成式AI短期內toB機會更大
Q:您剛剛談到我們跟軟件公司互為生態,里面有很多問題跟挑戰,具體是什么呢?
戴文淵:最大的問題是中國軟件市場的問題,如果從投資者的視角來看,通常認為中國的軟件市場很小,甚至“不太值錢”,但實際上不是這樣,中國的軟件市場是一個巨大的市場,只不過標準化軟件市場比較小。
為什么會這樣?因為中國有人口紅利。美國沒有人口紅利,企業只能買標準化軟件,定制化軟件是買不起的。但在中國,企業買得起定制化軟件,所以標準化軟件市場就小了。
中國的軟件市場其實比海外大得多,但是極度分散。問題大家都能看到,就是高度的定制化,有大量人力成本。企業都挺辛苦的。要不斷做非常精細的、非標的項目管理。一旦管不好,企業就會從盈利變成虧損,導致這個市場最大的企業也只占千分之幾的市場份額。
GPT技術出來以后能改變的,就是原先大量的定制功能點開發、菜單重新排布和流程改變上,用對話式的方式就都替代了,一下子從一個很差的商業模式變成一個很好的商業模式。
同時對于客戶來說,過去雖然說可以定制,但體驗也不好,很多軟件最后功能多到上千個后,其實這些功能都找不到了。
用新的交互方式,客戶體驗也得到提升,所以從各個方面來說,這次的技術革命是各方都獲益的一個局面。
Q:融入AI后,軟件有了更好的商業模式,核心還是成本跟定制化的改變?
戴文淵:對。原來軟件公司的商業模式是什么?派20個人做了半年,開發完就結束了,如果沒有新的功能點,也沒有后續的收入。
轉變為新的商業模式后,開發功能點不需要很長時間,主要的成本消耗在算力,而不是在人力。只要你的軟件還在被使用,你就能持續不斷獲得算力的收入,對軟件公司來說,是一個特別大的商業模式革新。
Q:算力的問題,咱們怎么解決?
戴文淵:此時此刻能上牌桌的(AI公司),都有一定的算力門檻,但我們作為中國公司,永遠需要考慮的問題,是有沒有國產替代方案。
對于中國芯片來說,現在需要一個調整。從追求極致的計算,調整為追求三者(顯存、帶寬)的平衡,肯定要給他們點時間。
從算力差距來看,對于GPU來說,差兩倍其實還好。假設我用了比你差2倍的GPU,我能跑1000億參數,你能跑1000多億參數,兩者其實沒有特別本質的區別。1000多億肯定比1000億好,但你是感受不到明顯差異的,當然,1萬億參數和1000億參數還是有本質區別。我覺得還是要給國產芯片更多信心。
Q:您覺得算力和數據誰更重要?
戴文淵:數據最重要。但這個要辯證來看,數據充分到一定程度后,再多就沒那么重要了。
比方說《紅樓夢》看過一百遍了,再多看兩遍也還好。未來在AGI決勝的,其實是一個個領域里的數據。比方說你在Photoshop這個軟件積累足夠多了,這個領域里你就無敵了。
Q:您怎么看待算力擴張和大模型能力的關系?
戴文淵:OpenAI的模型能力,一方面是依靠英偉達度算力的提升;另外一方面是微軟的投資,你花了100倍的錢,算力提升很多,數量級就上去了。
但到了那個(算力)的數量級后,你還能再花10倍的錢嗎?這個算力還能再提升100倍嗎?當你想再往上提升一個數量級的時候,這個問題就要面對了。
如果算力已經無法再提升數量級,我們怎么通過一個模型的無限擴大實現AGI?還是通過N個模型一起去覆蓋?確實如果你有足夠多的模型,也能覆蓋一個完整的AGI。
Q:我們怎么讓這個模型成本更可控一些?
戴文淵:成本可控是一個比較現實的問題。在不同領域是需要不同尺寸的模型,不是所有領域都支持一個萬億級參數的(模型)。
過去認為10億(1B)參數以上都叫大模型,但不同的場景盈利能力不一樣,能夠負擔的模型尺寸也不一樣。我們說成本可控,是得看這個場景能負擔多大的模型,以及我們能不能裁剪到它能夠負擔的大小,最后其實要達到某種折中。
Q:第四范式一直在提“AI for everyone”,這個理念是不是到今天能夠真正實現了?
戴文淵:通用大模型的出現讓AI覆蓋面擴大了,原先我們需要找到適合AI的場景,比如說搜索、資訊推薦。為什么需要找呢?原先AI只能干單點的事,沒有到那么通用。除了這些點以外的地方,都不是AI覆蓋的,是軟件覆蓋的。
Q:我們能看到AI帶來的生產力變化是非線性的增長,跟互聯網或者芯片的迭代方式有很大區別,這也是現在那么多人選擇創業的原因,您怎么看這個現象?
戴文淵:是的。這次的變化很難估計是多少萬億的市場,大家都是有機會的。
Q:從大模型來看,現在有toC和toB兩種路徑,您覺得短期內哪個更有機會?
戴文淵:我認為短期內toB更有機會。拋開監管層面的問題,更容易被改進的是原來水平較低的,現有的toC軟件體驗比toB好得多,后者就更容易被替代。
Q:您覺得底層模型研發更賺錢,還是上層應用開發更賺錢?
戴文淵:最后其實都賺錢,英特爾也賺錢,微軟也賺錢。
Q:是不是可能會出現一種情況,某家軟件公司通過生成式AI,成長為一家比Salesforce更厲害的公司,是有這種可能性的?
戴文淵:這是一定的。
責任編輯:Rex_29