
6月8日-9日,36氪WAVES新浪潮2023大會在北京金海湖國際會展中心順利舉辦。「WAVES」作為36氪全新推出的峰會IP,靈感來自于世界電影史上知名的“法國新浪潮電影運動”。我們想借此表達:年輕一代人不滿足于現狀、勇敢開拓和創造的精神。所以本次WAVES大會的slogan是:浪潮偏愛年輕人。
我們認為,“年輕”不止是一個年齡上的概念,而更是一種對活力、想象力的描述。某種程度上,36氪就是一個伴隨著年輕一代創業者、或者說“創新精神”一起成長起來的公司。這也是我們一直引以為傲的一點:在多數媒體還在追逐大公司的時代,我們就將目光著眼那些名不見經傳的小公司、或“小人物”身上。
(資料圖片僅供參考)
WAVES新浪潮2023大會集聚創投、科技、人文、音樂多元場景,致力于打造出一場聚焦青年創始人和投資人的商業新勢力派對。
8日上午,針對新一輪的AI新浪潮所產生的影響,真格基金管理合伙人戴雨森、IDEA研究院講席科學家張家興、昆侖萬維 CEO方漢、中國人民大學高瓴人工智能學院教授盧志武、瀾舟科技合伙人、首席產品官李京梅與暗涌主筆于麗麗一起參與了主題為“被仰望的與被遺忘的”圓桌討論,以下為對話內容,經36氪編輯整理:
峰會現場
1.
36氪:我們這個環節的主題叫“被仰望的的與被遺忘的”,聽上去有一些抽象,其實想討論的是這一波AI新浪潮所超產生的影響,而所有的新浪潮都會有過度被推崇的部分和疏漏的部分。首先請各位老師介紹下自己,以及所在平臺正在做的大模型相關的一些情況。
戴雨森:真格基金是中國領先的天使投資基金,其實在過去十幾年我們投資了很多AI相關的項目,在大模型浪潮開始之后,我們發現,很多過去投資過的項目,已經成為了大模型浪潮中的中間力量。
比如說我們之前投了好幾家領先的AI芯片公司,像瀚博、沐曦、燧原等。大模型本身的話,我們新投了王慧文的光年之外,楊植麟的月之暗面這兩家做大模型的公司,以及我們在十幾年前就投了出門問問,他們也在自建大模型,叫做序列猴子。在AI領域需要的中間件,例如我們投資了潞晨科技,他們的開源框架在模型訓練和推理加速里也是很受關注的。此外我們在應用端也有一些相關的投資布局。
整體來講,在這一波AI新浪潮出現的時候,對于真格來說已經不是一個新的浪潮,并且我們也感覺到很多新的機會正在重新屬于年輕人,所以我們還是比較激動的,從基金的角度和我個人的角度也花了很多的精力去關注和學習。
張家興:我是來自IDEA研究院的張家興,IDEA認知計算與自然語言研究中心,大概兩年前成立,從成立就一直在做大模型,然后我們作為一個整個大模型的系列叫做風神榜大模型系列,我們已經開源100多個模型,從數量來說中國第一大的整個預系列模型體系,在ChatGTP出來之前做過各個機構和垂直能力方面比較有影響力的一些工作,然后在這一次ChatGTP出來之后反正也是給大家一個很大的啟發,然后證明了通用模型才是未來真正的發展方向,我們也是轉向專門做通用的大模型。
幾個星期前,我們也是剛剛開源我們風神榜的下面一個新的子系列叫姜子牙系列,我們姜子牙預系列大模型也是在中文上非常好的表現,我們也是開源出來,希望更多的人能夠用我們的模型做出一些好的工作出來。
方漢:我是昆侖萬維的CEO方漢,昆侖萬維是A股上市公司,主要的業務在海外,目前我們78%的營收來自于海外,在全球70多個國家和地區有業務,全球的月活用戶4億左右,在海外我們做的業務主要是內容與社交相關方向。在2020年6月GPT3出現之后,對我們觸動比較大,我們當時判斷這是內容生成領域的里程碑,所以我們從2020年8月就啟動大模型的研發,2021年我們就發布了一個131億參數中文預訓練大模型,同年我們啟動了音樂生成的研究工作,今年4月份我們也發布了一個千億級別的中文預訓練大模型“天工”。
盧志武:大家好!我是來自人民大學的盧志武。我們團隊其實從2020年就開始做大模型了,當時做的第一個多模態大模型叫文瀾,在過去兩年有一些影響力。我們一直是做多模態,我們現在的模型是ChatImg2.0版本。大家可以關注一下公眾號,可以試用一下,我自己覺得還可以。然后,我們學院昨天也發布了一個語言大模型叫玉蘭,是開源的,大家都可以試用看看效果怎么樣。
李京梅:我來自瀾舟科技,是一家兩年的創業公司。我們是2021年開始在李開復老師的創新工場孵化,今年已經兩年了,我們的創始人周明老師之前是微軟亞洲研究院的副院長,也是NLP領域的專家。
我們公司的定位是一家認知智能公司,在創業之初就開始做預訓練模型,我們這個技術的名字叫孟子,比較中國化,也致敬了中國的傳統文化,所以我們比較關注中國市場中文這個領域大模型。
如今孟子已經是我們的一個大模型的系列,只是在ChatGPT出來之前我們走的是輕量化的一個技術路線,今年有了ChatGPT的破圈,所以我們在技術上也做了一定的轉型。今年 3月份我們對外推出了自己的孟子生成式大模型(孟子GPT),5月份開始面向友好伙伴跟客戶做了邀請的測試,反響還不錯。
我們現在對外發布推出的是一個百億參數量的孟子GPT大模型,之后我們會繼續訓練一些幾百億參數量的一個模型,所以瀾舟在孟子大模型賽道選型是基于通用模型底座,聚焦垂直領域和專業賽道。目前孟子大模型已經落地金融、營銷、文化娛樂、還有機器翻譯這個領域,所以接下來我們也會持續基于我們自己的通用底座在行業這個大模型的賽道持續做商業化落地。在開源方面,從2021年開始,孟子一系列模型陸續入駐GitHub和Hugging?face開源社區,同時,在阿里魔搭社區也開源了差不多20個左右的模型,接下來我們希望跟社區可以多做一些互動,收集反饋,我們也會持續做一些大模型的開源,這個是我們孟子大模型現在的一些進展。
2.
36氪:剛才雨森也提到過,這一波浪潮對普通人和行業人士來說,感知上有明顯的時間差,所以第一個問題是,你們個人最早被大模型沖擊到大概是怎樣的一種場景和時刻?以及在這一波的浪潮中你們覺得可能真正的里程碑事件是什么?
戴雨森:AI在創投界近十幾年都是一個比較熱的話題,只是隨著一波一波新技術的興衰不斷進入冬天和春天。但是這一次由ChatGPT引發的大模型熱潮其實有一個最不一樣的特點,那就是它真正進入了主流用戶的日常使用。最近有一個統計,ChatGPT的月活可能已經過了十億。尤其在海外,我們會發現,大量的辦公室工作者、學生、設計師等普通人都在大量使用ChatGPT或者Midjourney這樣的產品,說明這一次生成式AI技術真正已經到了跨越鴻溝進入市場主流的階段。
與此同時,作為一個產品,我覺得ChatGPT是橫空出世的。因為我們之前也用過大量對話智能助手這樣的產品,基本還處在人工智障的階段。但是ChatGPT已經具備了非常寬泛、非常通用的能力,這是之前任何產品都沒有過的。
對我自己來講使用這些產品的過程中有很多震撼時刻,比如說第一次用Midjourney訓練出非常逼真的照片級的圖片的時候,又比如最近我有一個特別有趣的案例就是,claude?100K的模型發布后,我把張一鳴從12到16年的微博全部都丟進去,我首先問這個作者是誰?它說不知道。但是我又問,你從已有的內容,推理這個人創辦的公司2023年可能是什么樣? 它說第一這個公司應該已經是一家規模很大的互聯網公司、第二可能在重點開拓海外業務,并且這個人可能23年已經脫離一線管理了。我非常震驚,問:這你怎么知道的?Claude說從微博看出來,他對于復雜的管理并不是很感興趣,而且經歷過創業十幾年可能已經心生退意。雖然原因不是那么準確,但是對結果的預計是非常非常有意思的。包括當時看微軟的那篇文章Sparks?of?AGI也是發現,之前像Lecun這樣的大佬以及很多專家都覺得大語言模型只是一個概率游戲,只是文本預測模型,不具備對世界的理解能力,但是你發現GPT4確實具備很多對世界理解的證據,例如把獨角獸的角取下來,大模型說應該裝上去,這里缺一個角。這些能力在我們過去看到的AI的產品或者技術里面還是比較罕見1的,所以我們現在對未來的可能充滿了興奮。
張家興:說起ChatGTP這個出來之后對我們的震撼,應該說對我的震撼是非常大的,因為我個人來說我從12年開始做深度學習,最近應該說七八年一直在做自然語言這個方向,我們已經算是讓這個領域有了很大的突破,但是終究有一些問題沒有解決的那么好,非常精準的自然語言理解,完全受控的文本生成,用自然語言推理,其實在ChatGTP出來之前我過往的工作,尤其加入IDEA研究院很多工作都是這一方面,其實是有一些突破,過去一年是有一些突破,但是嚴格來說還都是非常漸進式的一點一點上升,ChatGTP出來之后因為我覺得這就是GPT3又某一種升級,但是后來試了之后可以用一個詞來形容就是非常震撼。說實在至少中文領域英文也是差不多信息抽取最強的模型了,結果在ChatGPT出來之前人家沒有專門做這一件事情,依然效果強多少,所以讓我們意識到可能之前這個技術真的發生變化,以前我們曾經的為每一個任務去設計模型結構,為每一個任務專門的去訓練的這個時代過去了,我們終于從技術角度來說,通用這一件事情,終于成為一種可能,我們就做一個像ChatGPT這樣的模型,把所有的任務都放進去之后,那既然每一個任務都比以前做的要好,而且這個提升是一個質的提升。
盧志武:有兩個事情。一個是2021年,DALL-E剛出來的時候,做的文生圖效果確實讓人很驚艷,那個時候我覺得整個學術圈還是挺震驚的。另外一個就是大模型,今年GPT-4,雖然ChatGPT也很驚艷,但是GPT4還是給我帶來更大的震驚,主要是什么?很多人用GPT-4評測以后,可能做了很嚴格的評測,認為它具有早期的AGI能力,這個確實對我們沖擊特別大,因為所有做AI的人都是夢寐以求要實現AGI,現在有一個模型已經開始具備AGI特質了,肯定給我們帶來很多憧憬,當然帶來很多挑戰。總之,這兩個事情對我影響是最大的。
李京梅:說起震撼,我也有一些體會。近十幾年我主要都是在做產品。早期做過研發,純軟件工程。剛才家興講的今天大模型的可解釋性越來越黑客化,早期我做軟件工程師的時候,還是覺得軟件工程能夠做到一分努力一分耕耘,總是有一分結果,基本上是可預測、看得到,但是今天大模型之所以破圈,是因為很多時候超乎了人的預期。
再說近些年人工智能給我的一些感受,在2015年、2016年,那時候在微軟做認知服務0到1的黑科技上云的工作,也是做產品工作,當時的一個破圈事件是“how-old.net”,在座的有一定年齡,應該有印象,那是我印象中能夠跟今天ChatGPT的破圈相提并論的。在普通群眾中破圈的是人臉識別,雖然界面就是個網頁,并沒有什么特別炫酷的交互或者視覺的沖擊力,但對于當時來說,第一次發現人工智能跟你有這么近距離的體感,大家還是非常興奮的。
拉回到近期,跟我自己的經驗非常相關,當時微軟從高科技、黑科技上云更多的是人臉識別、圖象識別、語音識別,還有一個language understanding,它是一個語言理解服務,是一種感知智能,也就是看見、聽到,最多就是懂了。但是近些年,尤其是在去年開始講生成式AI,到去年9月底AIGC,其實主要是生圖,但是從AIGC本身來說,海外認為的是生成式AI,從理解了、看見了、聽見了到能不能創造,這是非常大的里程碑,也是個人體感非常強烈的破圈,尤其是看到群眾興奮的在朋友圈以及群聊中去曬AI生成的圖。這個興奮的浪潮在持續高漲的過程中,ChatGPT又出來了,但僅是在技術圈里、AI圈里。
真正的破圈是到春節的時候,再一次的破圈以及震撼我的,準確的是3月15號,GPT4出來了,然后沒幾天,17號微軟的Office“全家桶”出來了,雖然沒有直接上手可以試,但是當你看到操作的視頻就會非常震憾,這個震撼在于這種創作型的、這種生成式的AI真的要去顛覆你身邊所有的應用。因為這么多年大家感同身受,Office已經很好了,但是如何把生成式AI創造智能,嵌入到身邊的這些應用里,我覺得這幾個點是我個人特別特別關注的,主要還是從應用的這個角度。
3.
36氪:回到當下,過去幾個月稱得上國產大模型的春天,在你們看來,中國國產大模型相比美國真正的差距在哪里?其中關鍵問題是什么,這一浪潮中,中國跟世界的差距是拉大了還是縮小了?
戴雨森:從投資的角度觀察,目前算力、數據、算法各個方面都有一些積累上的差距。OpenAI在這個過程中,通過大量的資金、長期的研究和堅持打造了GPT4這樣非常強大的大模型。我們現在很多團隊都是看到了ChatGPT的結果之后,才開始從資本的角度或者人才算力的角度去開始做,所以現在肯定是有一個比較大的差距,人家已經跑前面去了,咱們才開始起跑,在比較短的時間內這個差距會進一步拉大。
整體來講的話,我覺得中國學者在AI領域的學術積累還是非常頭部的,其實在AI圈里面很多頂會論文,著名框架的發明人都是中國人,所以人才其實是不缺的,但是現在競爭格局比較分散,可能會影響到在尖端技術上的突破。我覺得百模大戰并不是一個好事兒,其實很多是行業浮躁和泡沫的體現。在喧囂之后如何盡快市場格局能夠收斂,把這些本來就比較稀少的資源集中起來重點突破,這個可能是我們要追趕或者在一些領域反超的路徑。現在資源本來就少,分散到很多的項目和團隊上,我覺得也是不太持續的。現在雖然做大模型的公司很多,但很多公司其實只是在用Supervised?Fine?Tuning等比較快捷的技術做一個語言能力還可以的模型出來,但是真正能夠資金實力和技術實力去挑戰GPT4以及更先進技術的團隊和項目可能還是比較少的。
張家興:首先我們還是要承認國內大模型跟OpenAI這個的差距,這個差距不光是我們跟他們的差距,國外很多公司跟他們之間也有很大的差距,這個主要原因是在于在ChatGPT出來之前,其實大模型這個領域已經存在了,只不過這個領域屬于百花齊放的階段,大家有眾多的模型結構,針對不同的任務、不同的領域大家,也有不同的模型結構跟訓練方法的思考,呈現百花齊放的狀態。但是OpenAI堅持選擇了在當時看來也是眾多方向中的一個方向,最終它勝利了,這是它本質原因,這個方向確實堅持了很久了,他們做通用人工智能這件事情很早就在說,一幾年他們就在說這件事情,因為積累的比較多,這條道路勝利了,那么其他人不只是我們,包括美國的其他公司其實也都是在追趕的狀態。
中國來說,反正我們在追趕中有劣勢也有優勢,劣勢剛才戴總也提到了包括資本的投入,甚至包括本身算力的規模,其實都是屬于一個劣勢,當然我們也要看到優勢,我們應該看到這一代AI跟之前的AI本質的不同。如果我們回想到2012年的時候,其實對今天這種情況還是樂觀的,中國整個學術界在世界上的話語權更加什么都沒有,因為當時大家知道“三巨頭”以及他們的學生基本引領了整個領域。所以說中國其實深度學習過去十年中,比如說華人做出的有影響力工作不是特別多,很少的。
但是到了這個時代因為整個發生了變化,剛才盧老師也所了,學生都不知道該干啥了,整個AI技術的接力棒,前沿技術的接力棒已經從研究走向了團隊式的“研究+開發”,明顯呈現了一種工程化的趨勢,AI開始搞工程化的話,中國還是有很大的優勢。過去十年,中國因為互聯網、數字化轉型積累了那么多算法工程師,尤其是懂深度學習的工程師,這都成為非常重要的人力資源,所以大家可以看到,這一波其實如果相對十年前我們追的是非常快,整個中國追的是非常快,有很多團隊都能做出比較像樣的模型,在逐漸拉近距離,承認差距,結合我們現在的優勢以及剛才說的對比,我們對當下還是要充滿樂觀的。
方漢:因為我深度參與了大模型的訓練過程,我來談談我自己的感受。為什么OpenAI被譏笑為CloseAI?其實大家會發現,它在各種演講以及論文中公開了自己的數據及來源,也把自己的算法和訓練步驟都講出來了,但是最保守的機密其實是如何對數據進行預處理的階段,所以本質上大模型的訓練現在的差距其實是工程上的技巧,而OpenAI花了整整五年時間在這方面去積累,其實我覺得這是全世界所有其他公司同OpenAI的差距。
但是我們認為,工程上的差距一定是可以追平的,只要有海量的試錯機會。但是從另外一個角度而言,我們與美國很大的一個差距就是我們在大模型訓練底層技術上仍然有差距,例如OpenAI覺得效率不夠高,會寫自己的compiler,但是中國有能力做這樣的公司寥寥無幾。
我剛才跟大家分享過,我天天在讀大模型相關的論文,我有個習慣,當我看到一篇論文有意思的話,我一定會聯系作者,去和作者交流。在我目前感興趣的論文中,中國的博士寫出來的論文大概占1%的話,那么美國人寫出來的論文大概能占2%,其中,美國博士論文里能占到2%的部分中有一半是中國人寫的,所以我個人對國內大模型的前景比較樂觀。在下一代大模型創新中,我們中國的主力是這批正在讀書的博士,我覺得他們的水平以及創新能力并不弱于美國人,只要我們給他們機會,他們一定會成長起來。如果需要我現在舉出有中國科研人員引領的項目案例,我能舉出來很多,我個人還是比較偏樂觀的。
盧志武:我覺得國內跟國外最大的差別還是說,如果從大語言模型上,最大的差別就是說大家都沉不下心把底座做好,你剛才說國產大模型的春天,這個都是假象,因為大部分都是微調國外底座模型的。
方漢:我是堅決反對,我們自己做大模型訓練,可以很清楚的告訴你們,中國第一批出來的大模型里面,這么說吧,至少我可以拍著胸脯保證,我們天宮跟它一毛錢的關系都沒有,因為我們從2020年開始做了,連OPT都沒有,我覺得你也不能一棒子都打死。
盧志武:我知道,但是你這個我不太清楚,我看到了很多,因為一測就知道。當然也有一些團隊在模型底座上投入很多精力,大部分還是很浮躁的。我反而覺得語言模型上面差距會越來越大。
36氪:盧老師是更悲觀的一個視角。
盧志武:為什么會是這樣,看一堆模型出來了,只是因為這個語言模型架構已經公布了,但是如果沒有公布,為什么前面不出來,這不是很奇怪的一個事兒嗎?我覺得不符合邏輯的,大家都不愿意去做底座。從這個角度,大家能不能跳出語言模型?反正已經落后了,當然有人要追。有沒有別的方面還能追得上的?GPT4的框架是未知的,大家都是公平的,我們就去探索,在這個點上我們追上它還是有可能的,并且GPT-4訓練算力耗得那么多,OpenAI自己它也承受不了,如果要把視頻加進去,我估計也做不好。總之,從這種角度,真正把類GPT-4模型做出來,我覺得大家都是公平的,有機會追得上的。我認為語言模型上反而沒什么機會。
方漢: ?我堅決反對上一位老師的觀點,我們自己做大模型訓練,在中國第一批出來的大模型中,我可以拍著胸脯保證,我們昆侖萬維發布的“天工”大模型跟外網的開源模型一點關系也沒有,因為我們從2020年就開始做中文預訓練大模型的研發,2021年發布了140億參數的中文預訓練大模型,那個時間點世界上還沒有任何公開的開源GPT大模型可以參考。
李京梅:今天無論哪一個評測榜或者企業自評,國內還沒有哪一家說我已經跟ChatGPT,不要講GPT4,就是ChatGPT3.5,能夠比肩了。今天這種現狀,從創業公司做商業化落地的角度看,是否考慮過即使今天ChatGPT在中國并且在你手里,可以做私有化嗎?是不是可以用起來?我覺得答案也是否定的。
我們看了很多行業,尤其是行業性較強的,比如金融行業,它的數據并不能放到互聯網上,還是有很多私域數據。不管是行業的習慣還是監管或者其他原因,總之這個數據并不飄在互聯網上,這種數據也不是純粹的底座技術就可以解決的。所以能看到,即使有了這樣的底座,通用的能力,還是要加工程。所謂的工程就是今天在行業里看到如何解決準確性的問題,GPT4比GPT3.5提升了很多。所以從落地應用的角度看,無論是自研的還是基于開源的LLaMA模型,微調后怎么去用,需要把最后一公里,可能不止一公里,十公里也好,要去做好。這是一個我覺得國內在人工智能技術、AI工程或者軟件工程里面,一定可以用上的策略。在剖析了OpenAI團隊后,其實是有很多華人甚至國內留學去的,所以人才方面我們完全不落后,這是都能有目共睹的。
這是一個落地層面。翻回來,從我觀察來看,無論是去年的AIGC還是今天的ChatGPT,這些技術大家都去追了,會不會哪天世界某個角落又蹦出新的技術,我們又沒有跟上?所以前瞻性的研究需要長期堅持。從創業、商業化角度分析,越前瞻、越看不清的東西,成功的幾率也是越低的。再從投資角度來說,是否有資本愿意做長期的投入?這些不是某一個人或者某一個公司可以解決的,我也沒有答案。?OpenAI它不是一夜成名,不是一夜暴富,雖然OpenAI沒有把論文發出來,但是它的技術2017年就有了,前期的臟活苦活累活也都干了,所以其實也是長期的堅持。微軟雖然投入了,微軟自己的研究院也沒有先做出來,谷歌這么多年AI的標簽,也沒有先做出來。所以概括來說,前瞻性技術型的研究投入以及高校人才的培養,是需要引導的,也是一個長期堅持的事情。
4.
36氪:各位老師怎么看大模型未來的競爭格局,哪些參與者可能能存活下來,現在的普通創業者是否還有參與的機會,另外關于大模型的創業,關于它的商業化路線一直存在很多爭議,很多人說在中國做大模型單純走2C的路線是很艱難,所以想問一怎么看2C和2B它可能面對的機會和挑戰?
戴雨森:我感覺在中國做2B服務可能更艱難,至少做過企業服務的創業者應該會有更深刻的感受。中國互聯網之前一大特點就是要直接找用戶收錢很難,很多時候都是「羊毛出在豬身上」,企業服務的格局也會受到市場付費意愿、客戶采購方式特點的限制。我倒是覺得面向消費者應用的機會在中國還是很大的,雖然咱們跑出來的應用商業模式跟美國ChatGPT?Midjourney直接賣用戶訂閱估計還是會一如既往的有很大區別。
企業服務領域,OpenAI和Claude在美國可以直接通過公有云賣API服務,但在中國估計只是提供API還不夠,我聽說很多做大模型的公司針對企業客戶現在是連服務器帶模型一起賣,還得提供訓練和微調服務。
然后顯然上百個模型混戰肯定不是長期的狀態,我覺得這里面分幾類:
第一類就是真的能夠往智能前沿探索,我覺得這么多大佬都說AGI是比互聯網更大的機會,這個的立足點是我們能做出能夠使用工具、解決任務、分解任務的AGI,這樣的實現需要非常強的能力,坦率來講已經超越了傳統NLP 任務的范疇.所以我覺得這個可能能持續做到世界領先水平的人哪怕是在美國也會是比較少的。
第二類機會,可能在垂直領域里,比如說醫療、法律這些原來薪酬比較高的領域,可能可以使用大模型再加上垂直領域的數據進行精調,來創造對應的copilot。在這些垂直細分領域,可能我們不需要把所有的領域任務都做的那么好,這個可能是行業應用機會。
第三類機會,我堅信在應用端肯定會有很多很有意思的機會。我們看到了在美國Midjourney、Jasper這些產品都是用戶很喜歡,商業化很優秀的。我們也有投資做應用的公司,推出的產品在國外反響也很好。有人說這些應用是不是就是GPT套殼,我認為這個領域技術可能不是最關鍵的,重要的是怎么把大模型的能力和用戶場景有效的對應起來,給用戶提供價值,長期來看是靠專有的用戶數據和關系,以及用戶習慣和品牌等形成壁壘。
其實仔細想想,首先iPhone發布之前,投移動互聯網應用基本上沒有跑出來的。但2007年iPhone發布后,要在頭幾年去預測十年后移動互聯網的終局形態和大贏家也是很難的,我們在2010年是基本不可能想清楚最后是字節、快手、拼多多、美團、小紅書這些商業模式最后成為中國移動互聯網的大贏家。因此在這一波AI技術革命的早期,我們堅持以創業者為中心,相信優秀的創業者最后終究會找到方向。
總結來講我覺得中國2C比2B機會大,最后不需要那么多真正的大模型,而是需要很多在垂直領域能夠解決問題的模型和產品。
張家興:我也同意戴總的觀點,我們不一定非得說有一個通用大模型,要更多的垂直領域的這些模型,然后這一塊就是對于整個大模型的落地以及它的整個商業化,我一直有一個想法大家如何去思考我們通用大模型這些事情,它到底是像OPENAI給大家呈現出來的,或者是2C產品,還是怎么去想?
其實我還是把這個東西類比成當年的深度學習,因為我也是完整的經歷了整個深度學習的周期,就是實際上通用大模型是一門技術,就跟當年深度學習出來之后,因為深度學習之前,其實機器學習一直都存在,只不過它各方面做的不好,所以說很多場景,要么效果不好,要么沒辦法應用,深度學習全部刷了一遍,包括后來10年之后大家見到很多互聯網的一些應用,包括一些比如說短視頻直播都是跟深度學習技術有關,否則不可能出現。
那么大模型也一樣,現在看到通用大模型也是一樣,其實更多的是對我們以前曾經的這種AI化的,我們說這個世界在信息化、數字化、AI化,我們AI化的一個進一步的深化吧,從這種情況下實際上作為一個技術來說,它是要有一個完整的生態體系的,從這生態體系來說。
但是深度學習因為那個時代技術應該或者說它的復雜程度或者成本沒有達到那個程度,就是這個生態體系還沒有劃分的很清楚,但是到模型不得不進行生態體系的建設,因為大家知道做一個通用大模型確實成本太高,也需要專門的投入和專門化的團隊來做,所以最上游一些做通用大模型的公司,接著往下沿著大模型做各方面垂直大模型,然后還有做各個行業落地的以及每個行業里面自己在應用它去做事情,以及過程中云廠家包括做算力各個廠家在里面,整個生態體系,如果大家看到這個生態體系的話,就會發現這里面機會蠻多,而不是聽聽眼睛就得盯著做什么什么模型,不是這樣機會非常多。
我覺得第一個當做技術來看,必然會在各個場景要有應用,也絕不是一個通用大模型就能解決全部場景問題,需要每一個場景針對場景做自己的模型,每一個場景中讓每一個模型跟你的場景能夠形成這樣一個閉環,場景越好就你涉及到的數據越多模型越好,再就是說站在一個馬上就要展開的生態角度來看,想一想自己可以占據哪個生態位。
方漢:首先,各種各樣的小模型的能力其實嚴重依賴于大模型底座;第二,2B或者2C的機會,中國與國外的競爭格局完全不一樣,但是也有一些相對共通的方面,目前在中國2B端很難有一家獨大的情況,而是比較碎片化,大模型在B端的應用是一個大家都能賺到錢、但是大家又很難賺到特別多錢的局面。對于一家創業公司而言,B端還是一個不錯的起點。
對于C端而言,我覺得分兩個方向,一是效率工具,也就是說我們把大模型作為我們日常工作的一個效率工具。在這一點上,我認為,國外的訂閱模式,在中國一定不會成功,中國一定是免費模式,中國模式的效率工具入口已經被office、企業AIM等就是我們上班打開的工具入口占領,目前創業公司的機會其實不多,因為很難改變用戶的習慣,去創造另外一個工具的入口。但是在另外一個領域,所謂的內容生成領域,創業公司的機會就會更多一些,因為在這個領域,大公司其實沒有把用戶的心智徹底壟斷掉,用戶就是相對碎片化。
最后,其實這一波大模型或者通用人工智能的是遠遠超過產品進展,我也經常跟中國的最頂尖的產品經理聊,我感覺產品經理是處在很懵的狀態,大模型是很厲害,能用來干什么?我覺得要給我們中國的產品經理一些耐心,我相信通過這些產品經理的創意以及努力,能夠打破現在的范式。
目前B端和C端的競爭實際上還是1.0模式,就是老的商業模式去套大模型來做我們的創業方向,我認為必然有2.0模式,就是徹底摒棄現在傳統商業模式,利用大模型的能力去創造出新的商業范式,我個人認為,在中國可以再創造出下一代的BAT和TMD,我認為是有這個機會的。
盧志武:其實我們2020年把文瀾模型做出來以后,一直在探索這個落地。但是這個落地很難,就是大模型落地確實有很多問題。當然到今天為止,還是有一些自己的想法,雖然我是個教授,主要在學校,我認為大模型落地目前就是API調用的方式,還有一種大模型的定制化或者行業里面再去重新訓,我覺得這兩種方式其實都不是很好的。API調用有很明顯的問題,比如說很多場景,政府的場景,因為數據的問題不可能讓你去調的。
然后定制化也是一個苦活,雖然也能復制,但其實每一家它都有自己的特別要求,最后變成一個一個做項目,這兩個事情我都做過,就比如說我們跟榮耀也做過,反正最后變成做項目,能賺錢但是很辛苦,就這樣的。所以我最近也在探索想一個新的路,我正好是做多模態大模型,因為多模態可以接攝像頭,而很多硬件都是有攝像頭,那可以把模型集成在一個硬件里面,比如說無人機、機器人這樣,我們就變成了去賣產品,可能是一條新路,可以避免我剛才說的兩個問題,然后API調用很多場景用不了,其實成本也挺高的,如果變成做產品可能稍微會好一點,這是我們的探索。
另外,文生圖這個領域我覺得小B還是有機會的,我們最近也在這個上面探索。
李京梅:瀾舟科技是一個創業公司,我們如今做大模型也有深耕行業的模型,針對這幾年探討的ToB和Not ToB,瀾舟的商業化賽道主要是B端,也包括一些文化娛樂、營銷,我們是通過ToB再ToC。每一個企業都有自己的基因和選擇的賽道,B端這個賽道我覺得今天中國跟海外有一些差異,早期我在美國也做過不少B端的服務型的一些工作。
在國內,?ToB產品或者解決方案必須一家從頭做到尾,其實是可以分層,比如做底座或者工具平臺。我相信大模型跟數據是在一起的,如果是互聯網公開數據,那它就是在互聯網上,如果是行業的數據,那它就應該在行業里,數據在哪,大模型就在哪,但當前是否具備相關的人才呢?所以無論是哪個行業,還是要有行業能夠降低落地的成本、應用的這種工具型的平臺,比如分層底座的工程平臺、行業的端到端應用、效率型的工具,這也是一種產品。并不局限于群眾可以直接體驗到、能夠上手的、可以日常用的才叫產品。所以無論是ToC還是ToB,大模型的商業化落地,在國內都還沒有那么清楚,但能夠看到這種浮躁的這種熱潮已經降溫,尤其B端已經開始進行理性化的思考。
我覺得接下來的這個商業化,尤其是在B端的一些賽道,當然我們也是有選擇,有一些是包容性比較容錯性高一些,肯定是先能落地,寫網文營銷尤其是社媒上的營銷,但是金融容錯率比較低,我覺得這是有一個過程,目前我們還是走垂直領域專業賽道,在B端或者是在一些細分的行業里愿意跟市場、跟客戶一起去探索往前,最主要的ToB還是Not ToB還是做出價值,這是我現在的觀點。
5.
36氪:本來還有更長問題,因為時間關系縮減一下,這一波AI新浪潮讓很多的白領可能會被替代的焦慮中,如果是面對一個擇業的年輕人或者教育孩子的家長,各位老師會有何建議,能否用一句話概括一下。
戴雨森:就跟當時互聯網一樣,擁抱新技術、學習新技術、成為新技術專家,這個是最直接的。
張家興:不要去做那些所有人都能做的事情,盡量發現自己與眾不同的事情,因為所有人能做的事情,現在機器都做的挺好的。
方漢:大家不用杞人憂天,我覺得下一代更善于利用AI,更善于去開發AI,對于我們來說,只要永遠保持一顆好奇的心態,就不會被各種各樣新技術淘汰。
盧志武:擁抱AI。
李京梅:要有一個與時俱進的心態,保持持續學習的心態,就不會被時代淘汰。
關鍵詞: