AI大模型會變傻嗎?
這事或正在發(fā)生!
頂級科學期刊《自然》發(fā)表的最新研究給似乎將變得無所不能的大模型判了“死緩”,將這種糟糕情況描述為“大模型崩潰”。
《自然》雜志最新一期封面,圖源:Nature
除了變傻,大模型還面臨發(fā)展路線分歧。一條傾向于把通用大模型做到盡可能完善,然后自上而下實現(xiàn)產業(yè)、商業(yè)場景全覆蓋;一條則是扎根產業(yè),從實際應用中自下而上催生成熟的產業(yè)大模型,為通用大模型的完善積累“智慧”。
有意思的是,根據《全球數字經濟白皮書(2024)》統(tǒng)計,目前全球的基礎大模型有1328個,美國最多,中國第二。而產業(yè)大模型,中國表現(xiàn)了極大的熱忱。更有意思的是,美國企業(yè)多傾向第一條路線,而中國開發(fā)者則越來越扎堆第二條路線。很難說兩條路線誰更具優(yōu)勢。不過對《自然》的最新警告,很可能不會出現(xiàn)在走第二條路線的中國開發(fā)者身上。
人們期待AI大模型引領人類開啟新紀元的愿望有多熱切,“大模型崩潰”帶來的打擊就有多強烈。
下一次大模型泡沫說不定就是被它引爆的。這種事在互聯(lián)網與資本的蜜月期也屢見不鮮。
如果訓練大模型時,只用AI生成的內容,會導致大模型出現(xiàn)不可逆的缺陷。一些在第一代數據中出現(xiàn)的低頻詞,在以后的迭代中出現(xiàn)的頻率會更低,而一些常見詞匯出現(xiàn)的頻率則逐漸增加。久而久之,模型逐漸無法正確模擬真實世界的復雜性。錯誤被層層累積、逐漸放大,最終導致“模型崩潰”。
很像生物學中“近親繁殖”導致后代缺陷的過程。
如何規(guī)避“模型崩潰”陷阱,讓大模型更好的成長呢?
接地氣是選擇之一。事實上,許多中國大模型開發(fā)者就是這么做的。
比如京東推出的言犀大模型,以及基于大模型產生的京醫(yī)千詢、京點點、小哥智能終端助手等一系列智能體應用。
截至目前,京東大模型落地超過100個場景,支持了23萬+商家,2萬+京東采銷,1萬+研發(fā)人員;不但涵蓋零售、供應鏈等核心領域,還能兼顧辦公自動化、法務、風控、合同審核、數據分析的解決方案,并拓展到了健康領域。
京東大模型開發(fā)最大特色就是從實踐中來到實踐中去,大模型在京東基本實現(xiàn)了祛魅,即使是普通的業(yè)務人員都能自己定制、拿來就用。
能用、好用的大模型,緣于京東對供應鏈的深耕。
回溯歷史,供應鏈可謂歷次產業(yè)革命的集大成者。諸多巨型企業(yè)、經濟學家、管理學家、還有產業(yè)研究者早早就把供應鏈整體協(xié)同優(yōu)化,視為企業(yè)更上層樓的關鍵。
舉個簡單的例子,一輛汽車的零部件通常超過3萬件,核心工廠很難生產全部零部件,會把大部分零部件交給上下游企業(yè)生產。但汽車裝配對零部件供貨時間要求極高,協(xié)同不好就會影響交貨。
所以,最早的產業(yè)互聯(lián)網就是由美國汽車四巨頭聯(lián)手締造。
而京東產業(yè)大模型的橫空出世,似乎有一點歷史宿命的意味。
供應鏈是產業(yè)中數據最集中、協(xié)同最復雜的場景,通過數據實現(xiàn)管理優(yōu)化即可提升供應鏈效率,通過落地大模型能夠快速釋放供應鏈效能,相比其它場景能最快發(fā)揮智能的優(yōu)勢。
京東有一個公式,大模型的價值=算法×算力×數據×產業(yè)厚度的平方。第四個乘數,正好呼應了我們前文中提到的第二條路線的特質,能極大彌補AI生成數據的先天不足,從而為大模型的成長提供了一個更平衡、更全面的路徑。
圖源:數字基礎設施技術趨勢白皮書(2023)
大模型誕生到現(xiàn)在,人們早已不再滿足于其強大的自然語言(含圖形)理解、語言生成和語音識別等能力,在聊天、娛樂等通識屬性較強的場景上的表現(xiàn),更寄希望于實際用起來產業(yè)落地,商業(yè)落地。
正如中國工程院院士鄔賀銓所說的:對話、寫詩、作畫絕不是大模型的全部。我們需要將大模型切實投入到城市發(fā)展、金融科技、生物醫(yī)藥、工業(yè)制造、科學研究等領域,也需要專業(yè)的企業(yè)和組織加速其在實體產業(yè)落地,為產業(yè)剛需帶來實實在在的價值,真正意義大規(guī)模服務社會。
京東就走在這條路上。京東集團技術委員會主席、京東云事業(yè)部總裁曹鵬認為“通用大模型靠算力堆出來,企業(yè)大模型靠業(yè)務跑出來”, 并表示“京東供應鏈是大模型應用的超級孵化器。”
2024京東云峰會上,京東云展示了京東言犀大模型落地行業(yè)的領先技術與最新實踐,并重磅發(fā)布京東云企業(yè)大模型服務、言犀智能體平臺、智能編程助手JoyCoder、言犀數字人3.0等八大產品。
當大模型遇上供應鏈,產業(yè)互聯(lián)網的歷史一幕也許會在京東身上重現(xiàn)?
京東言犀大模型的成長,還能讓我們可以對世界工廠的全面刷新暢想一番。
中國擁有聯(lián)合國工業(yè)名錄門類劃分中的39個大類、191個中類、525個小類的全部門類。構成這個龐大工業(yè)體系的是40萬家企業(yè),其中超過90%的企業(yè)是中小微企業(yè)。
圖源:鈦媒體
都知道數智化是方向,但常規(guī)的研發(fā)者不會去鉆研不同產業(yè)的技術訣竅,以至于基礎大模型讓很多中小企業(yè)覺得高不可攀,彼此之間誰仿佛都覺得對方離自己還遠著呢。
京東云為產業(yè)締造了一個全新的關鍵容易上手的系統(tǒng),還是相對繁雜偏偏還離不開的供應鏈方面。
從生產到流通,從原料供應、倉儲,到運輸、分銷,以及最終的消費者,傳統(tǒng)供應鏈的節(jié)點繁復,交織成的網絡結構復雜,流通環(huán)節(jié)也總是層層障礙。
京東云本身就扎根于供應鏈,加上之前的積淀,在零售、物流、倉儲、金融、健康、工業(yè)等產業(yè)擁有深入實踐,還參與了城市、政務、金融、制造、工業(yè)、航空、交通、園區(qū)、能源等產業(yè)。
京東云很多年前就確定了數智供應鏈的目標。其核心理念是產業(yè)聯(lián)結、數智創(chuàng)新和生態(tài)融合,通過數智供應鏈建設,企業(yè)能夠從產業(yè)鏈全局優(yōu)化效率,以數智技術驅動數實融合,同時聯(lián)結更多生態(tài)伙伴,實現(xiàn)更高效的數字化轉型。
大模型的落地,讓數智供應鏈再次蛻變,線性鏈條連接“孤島”,交織成一個復雜網絡,進而實現(xiàn)有限的自主呼應,有點類似藤曼纏繞的雨林結構,如今這個系統(tǒng)又有了高級統(tǒng)御的智慧。
AI智能體(AI Agent)被視為過往技術發(fā)展的集大成者,在工業(yè)界已得到共識,能夠廣泛適配各類應用場景。AI智能體以大型語言模型(LLM)作為核心控制器構建,可以構建出強大的問題解決器。
言犀智能體平臺
京東云言犀智能體平臺是新一代一站式 AI Agent 開發(fā)平臺,目前已接入數十個大模型,它幾乎就是一個為使用而生的平臺。無論用戶是否有編程基礎,從解決簡單的問答到處理復雜邏輯的業(yè)務問題,都可以在平臺上低成本快速搭建基于 AI 模型的各類快捷應用。
比如外貿供應鏈的報關場景,會產生大量報關碼(HS code),需要人工尋找到每個code,還要手動輸入商品描述。京東云言犀智能體平臺通過workflow反向RAG,描繪商品,找到對應code。另外還有智能體低代碼開發(fā)的應用構件,輸入一段描述的自然語言,就可以基于Agent生成應用。
還有外貿中的訂單履約場景,過去需要通過客服問詢,京東云通過言犀智能體平臺調用API,就能查到訂單履約到哪了;通過Agent調用對應的foundation,就能查到物流訂單到哪了。而且拆單狀態(tài)、履約情況、合同審核等場景在國際貿易時不能只用中文,還需要多種語言,基于AgentAIG就能輕松實現(xiàn)多語言問答。
通用大模型要做到這一步,往往會出現(xiàn)開發(fā)冗余、貨不對板或者成本高企,而針對性強的產業(yè)大模型卻能夠同時對齊了成本、效率、體驗三方面要求。
對業(yè)務場景的理解與觸達,對產業(yè)數據的積淀與運用,是京東言犀大模型保持精度的重要前提。實際上,言犀大模型數據就是由70%的通用數據與30%供應鏈場景生長的原生數據構成。
你能想象京東的小哥都在自如實現(xiàn)與大模型的對接嗎?
多場景智能助手 特定角色提供專業(yè)服務
小哥的崗前培訓,比如具體到服務過程中如何處理異常?哪些違禁品不能郵寄?以及耗材等問題……
過去他們需要記住大量專業(yè)知識,過程長,還容易出錯,現(xiàn)在京東云基于言犀大模型為小哥量身訂制了終端智能助手,這位“助手”能牢記從攬收、派送、站內、輔助、客戶服務等143項標準作業(yè)動作,到貨物處理規(guī)程、安全操作標準、KA客戶等915個服務要求都能回答。
對于物流、派送地址等常規(guī)操作,小哥甚至只需要動動嘴,小哥助手就能優(yōu)化流程,給出優(yōu)化方案。
如今物流的小哥終端智能助手已服務近35萬京東自有配送員。
京東集團副總裁何曉冬將這比作培養(yǎng)一個人,“如果一個人高中畢業(yè)后直接出去打工,似乎也行,但專業(yè)性會差一點。要是能讀完四年本科再出去工作,就既有通識能力又有足夠的專業(yè)知識,這是產業(yè)大模型應該具備的能力”。
至此,京東供應鏈與大模型,形成了一對奇特耦合且螺旋上升關系:一方面,大模型的出現(xiàn)為供應鏈的深化、優(yōu)化、數智化提供了新的增長點;另一方面,京東供應鏈的復雜場景產生的真實數據可以訓練大模型,讓大模型在供應鏈上先跑起來;進而,不斷成長的大模型又將賦能供應鏈,激發(fā)更大的改變。
這種結構像極了DNA,不斷延伸延展,孕育無限可能。也在述說著,更適合企業(yè)的大模型真的可以一邊跑一邊訓出來。
DNA結構,圖源:University of Minnesota Libraries
種一棵樹最好的時間是十年前,其次是現(xiàn)在。
京東云對大模型深耕落地產業(yè)的理解,不是種樹,而是種森林。
這種“森林思維”很契合大模型的養(yǎng)成。
以往我們發(fā)展大模型,尤其是通用大模型,缺芯片導致算力不足,算法也有差距也就罷了,連原本應該最豐富的數據,也因為數據標準化等諸多問題,而變得無法用于大模型的訓練。
甚為可惜。
不過,京東云做產業(yè)大模型的歷程展示了一條因地制宜的發(fā)展國產大模型的新的路徑。
和生產場景無限接近,加上互聯(lián)網企業(yè)的基因,讓京東云在特定的領域積累了大量優(yōu)質的數據,這些數據對于產業(yè)、垂類大模型是再優(yōu)質不過的養(yǎng)料。
多年以前,面對復雜的消費和零售價值鏈,劉強東將每個環(huán)節(jié)總結成“十節(jié)甘蔗”,隨后京東選擇滲透進入更多的甘蔗節(jié)數——將業(yè)務延伸至倉儲、配送、售后、營銷之外的生產、研發(fā)等供應鏈其他環(huán)節(jié)。
如今吃透每個環(huán)節(jié),讓京東的產業(yè)大模型在應對具體的場景時就仿佛含著金鑰匙出生。
中國企業(yè)有望證實大模型第二條商業(yè)路徑的合理性。
如今,全球通用大模型競爭白熱化,對高端GPU的追求,堆爆了英偉達的股價,讓其一度超越蘋果、微軟,登頂全球最大市值企業(yè),也同時讓大多數渴望大模型引發(fā)傳統(tǒng)產業(yè)嬗變的企業(yè)開始望洋興嘆。
因為它們既不好用,更加用不起。
國際通行的評判大模型的標準是算力、算法、數據。以京東云為代表的一部分中國企業(yè)則以自己與產業(yè)的高度融合,提出了大模型產業(yè)落地“新三要素”:場景、產品、算力。
復雜的交互智能場景及其產生的動態(tài)數據、從單一算法競爭到形成可以牽引成體系算法創(chuàng)新與突破的產品和能支撐這樣的場景與系統(tǒng)的新型算力。
基本理念是基座大模型靠堆卡訓練,企業(yè)大模型靠人用出來。
本次2024京東云峰會,京東云發(fā)布三大智能平臺、五大領先技術產品,從基礎設施到Agent應用,構建全場景的大模型服務能力,持續(xù)推動大模型落地產業(yè):
· 京東云企業(yè)大模型服務,支持一站式打造企業(yè)專屬大模型,將垂直領域知識注入到模型的同時,不損失模型的通用能力,且更加經濟適用;
· 言犀AI開發(fā)計算平臺2.0,內置20余種開源模型和豐富的數據集,提供100余種算法和工具鏈,提供低門檻、高性價比的大模型開發(fā)服務;
· 京東云大模型安全可信平臺,涵蓋超過200種特有的紅藍對抗攻擊手法,覆蓋監(jiān)管合規(guī)要求的全部31類風險類型,風險分析準確率高達95%以上;
· 京東云云艦AI算力云,支持多地域分布式算力的統(tǒng)一調度,提供高性價比的算力供給;
· 新一代分布式存儲云海3.0,支持千億級參數AI大模型,4K隨機寫IOPS達到1000萬級,平均延遲在100微秒級,極致性能更好地支持大模型落地應用。
真正適合企業(yè)的越來越多的大模型應用,正在京東供應鏈上生長出來。在內部業(yè)務中根據實際需求找到大模型落地的場景后,京東云已能對外輸出能力。
今年京東618期間,京東云言犀數字人在5000+品牌穩(wěn)定開播,在汽車、跨境美妝、珠寶首飾、3C數碼、家電家居、醫(yī)療健康等多品類播間帶動閑時轉化率提升超30%,直播累計時長超40萬小時,累計觀看人次超1億,互動頻次500萬+次。
京東云言犀數字人依托全新升級的3.0版本,以超100個性化角色、超50行業(yè)特定屬性場景,表現(xiàn)超過行業(yè)80%的主播。除電商直播場景外,言犀數字人還在文旅、金融、智能服務、政務咨詢等更廣泛的場景應用落地,與億級用戶智能交互,帶來下一代交互體驗。
健康大模型京醫(yī)千詢成為基于行業(yè)內首個實物與服務相聯(lián)通、知識與數據相融合的醫(yī)療大模型。免費智能醫(yī)生“康康”結合京東健康億級醫(yī)患會話和豐富的實物、服務、內容等供應鏈資源,提供專業(yè)咨詢服務;專屬個人醫(yī)助支持病情收集、診斷推薦、治療方案推薦、病情解釋、智能病歷等功能,全流程輔助醫(yī)生提升問診效率。如今京東健康皮膚醫(yī)院基于大模型的AI輔診準確率超過95%。
“道生一,一生二,二生三,三生萬物?!薄兜赖陆洝氛J為天地萬物的始基與母源在于“道”。在供應鏈和大模型的“宇宙”中,京東云尋到了“道”。
2017年京東戰(zhàn)略會上,劉強東高喊“技術、技術、技術”的戰(zhàn)略。7年過去了,京東云在大模型產業(yè)應用實踐中,成為這家企業(yè)戰(zhàn)略遠見與定力的力證。
什么是新質生產力?
什么是最優(yōu)的產業(yè)轉型升級路徑?
在新技術激蕩的時代,其實就是用新技術把你熟悉的一切從頭到腳重新做一遍。
當大模型落地離我們越來越近,京東云再次選擇把大模型做實,把供應鏈做透。
其實腳踏實地,與仰望星空并不沖突。京東云能讓大模型與有史以來最龐大的世界工廠的融合得多一點,更順滑一點,那樣的情景都足以令人心潮澎湃。
相關稿件