
請ChatGPT寫一篇介紹生成式人工智能的文章,它生成的文章標題頗能體現人類愛與恐懼交織的情緒——“釋放生成式人工智能的創造力:改變科技并引發對人類的威脅”
很少有技術像生成式人工智能這樣,受到的評價如此分化。所謂生成式人工智能(AIGC),是指能夠根據提示生成文本、圖像或其他信息的人工智能系統。去年11月誕生的ChatGPT是其中最知名的代表。
(資料圖)
追捧者認為它和互聯網、鉛字印刷術、電的發明同等重要,微軟聯合創始人蓋茨說:“人工智能有能力改變世界。”恐懼者認為它是“人類未來文明的最大風險之一”,特斯拉首席執行官馬斯克猜測它有可能控制甚至毀滅人類文明。不屑一顧者認為“它的智商甚至不如狗”,圖靈獎得主楊立昆斷言,“5年內,就沒人用ChatGPT了。”
在本文寫作過程中,記者請ChatGPT寫一篇介紹生成式人工智能的文章。它生成的文章標題頗能體現人類愛與恐懼交織的情緒——“釋放生成式人工智能的創造力:改變科技并引發對人類的威脅”。
令人興奮也令人困惑
對生成式人工智能的追捧來自它超乎人類預期的強大能力。ChatGPT所基于的大模型GPT-4在各種測試中的表現令人吃驚:順利通過統一律師考試,得分高于90%的人類考生;參加生物奧林匹克競賽,擊敗了99%的人類考生;還在大學藝術史、生物學等課程考試中名列前茅。
對生成式人工智能的恐懼來自人們對它的困惑——它的能力從何而來,連開發者都無法完全明白。這與過去的程序完全不同,傳統上,程序員開始編寫代碼前,在腦中已經設計好了,可以解釋機器要做什么。但人工智能基于的機器學習模型本質上是“黑匣子”,研究人員并不全然知道它如何生成內容。復旦大學大數據研究院教授趙星說:“人們將數據一股腦往模型里面扔,至于出來的是什么,卻沒有明確的預期。”很明顯,在技術層面上,生成式人工智能存在內生不確定性。
不管人們對生成式人工智能的態度如何,它的火熱卻是不爭的事實。ChatGPT推出兩個月后,月活躍用戶就達到了1億,成為有史以來增長最快的應用程序。緊隨ChatGPT,中美主要科技企業接連推出了各自的生成式人工智能產品。PitchBook數據顯示,僅在2022年,生成式人工智能賽道就發生了78筆投資,總融資金額超過13.7億美元,幾乎相當于過去5年的融資總和。自從iPhone出現以來,人們對一項新技術能夠改變行業的信念從未如此之深。云計算公司紛紛跟進,開發、銷售基于大模型的產品;電子商務公司希望借生成式人工智能改變經營模式;社交媒體平臺上充斥著機器人寫的帖子……
面對生成式人工智能可能帶來的風險,監管、規范的呼聲也逐漸增強。歐洲數據保護委員會于4月13日表示,正在成立一個特別工作組,幫助歐盟各國應對ChatGPT,促進歐盟各國之間的合作。4月11日,我國國家互聯網信息辦公室發布了《生成式人工智能服務管理辦法(征求意見稿)》,擬規范生成式人工智能在我國的開發及應用。
被改變的生產邏輯
人們對于人工智能的理解被重塑了。一位國內咨詢行業的從業者告訴記者,2023年業界討論的人工智能和2022年討論的人工智能已經不一樣了,之前人工智能產業更多是基于算法做知識圖譜,而2023年之后人工智能意味著大模型、生成式人工智能、自然語言交互。
實際上,這種定義的變化,意味著人類未來生產模式邏輯的改變。
一方面,生成式人工智能能夠強化人工智能技術對傳統產業融合滲透和改造質效。就如同ChatGPT已經可以提供智能咨詢、文稿編寫、代碼編寫、翻譯等基礎工作,生成式人工智能也可以覆蓋文本、音頻、圖像、視頻等基本內容模態,同時還能進行跨模態生成,從而賦能各類細分行業推動生產力提升。未來,從感知走向認知,人工智能創造能力會不斷增強,走進人類的日常生活,賦予萬物智能。
另一方面,相較于專業生成內容(PGC,Professional Generated Content)和用戶生成內容(UGC,User Generated Content),生成式人工智能成本更低、內容更加豐富,人工智能實現了從甄別、推薦作用到內容創作者的角色轉換,將成為新一代全行業生產力工具。
以OpenAI為代表的新技術路線采用千億參數的大模型訓練,在理解需求時也會更加接近人類的思維方式。舉例來說,過去我們在與智能音箱的對話中,常常會遇到語音助手表示不知道的情況,這是因為其背后的知識圖譜相對靜態。今后,如果有了生成式人工智能技術加持,智能音箱就可以根據外界的信息綜合判斷,以概率方式給出答案,這更加符合人類與世界交互的特點。
此外,生成式人工智能也有望帶動數字內容創作、元宇宙、虛擬人等新興領域加速發展。
已有“百模大戰”之勢
過去半年,國產大模型萬眾矚目。大模型(LLM)是指具有大量參數的機器學習模型,可以在訓練過程中處理大規模的數據集。大模型被用來構建GPT這樣的生成式人工智能模型。
今年3月16日,百度推出搭載文心大模型的文心一言,對標ChatGPT。百度稱文心一言是“新一代知識增強大語言模型”,擁有人類反饋的強化學習、知識增強、檢索增強和對話增強等能力。
百度之后,一大批巨頭企業跟進發布大模型。4月8日,華為更新盤古大模型。4月10日,商湯科技推出商量SenseChat。4月11日,阿里巴巴推出通義千問。再之后,360、字節跳動、科大訊飛、京東、騰訊、美圖……幾乎所有的中國互聯網巨頭都相繼下場。對互聯網巨頭們來說,這場“大模型之戰”不得不打,因為這已直接關系到市場對于企業發展前景的判斷。
放眼全球,中國在大模型數量上絕不落后。據科技部人工智能發展研究中心5月底發布的《中國人工智能大模型地圖研究報告》顯示,當前國內10億參數規模以上的大模型已發布79個,大有“百模大戰”之勢。
不過,與市場熱烈呼聲形成對比的是,國產大模型的使用體驗并未驚艷四座。在訓練數據上,國內大模型距離ChatGPT也有一定差距。業內人士認為,雖然不少企業宣布接入大模型,但通用大模型距離實際應用還有段距離。
跟上突然切換的賽道
這場人工智能賽道的切換是突然的,許多國產大模型訓練得還不夠完備。人們現在看到的ChatGPT實際上也是多年累積的結果。2019年,OpenAI創始人山姆·阿爾特曼完全接手這家公司時,OpenAI資金鏈瀕臨斷裂,業界幾乎都不看好通用大模型這條賽道。
后來的故事世人皆知,微軟用數十億美元成功“喂”出ChatGPT,重新點燃了人們對大模型的興趣和期待。
當前,中國在人工智能應用技術領域發展迅速,如計算機視覺、智能語音、自然語言處理等,但在底層算法理論和開發平臺等基礎技術領域發展節奏緩慢。
6月中旬,中國工程院院士、我國通信領域權威專家鄔賀銓曾公開表示,在中國從事人工智能研究的技術人員不算少,但具有架構設計能力和生成式人工智能數據訓練提示師水平的人才仍然短缺。AIMiner發布的2022年人工智能全球最具影響力學者榜單中,美國在機器學習領域頂尖科研學者數量上占據絕對優勢,位居全球第一,而中國僅居第四。
也許生成式人工智能有多火熱并不那么重要,只有從源頭做起,才能真正抓住人工智能技術浪潮的主動權。
在本次世界人工智能大會上,不僅有30多款國內外大模型亮相展會,還有一系列聚焦大模型基礎問題的論壇。也有企業如華為,宣布將發布大模型訓推一體化解決方案,幫助解決行業痛點。這些努力都將推進國產大模型更好地夯實基礎、協調開發,共建完善的開發生態圈。
(文章來源:解放日報)
關鍵詞: