DeepSeek正在重塑AI產業新格局
2025-02-13 09:37:30 來源:法治日報·法治周末
《法治周末》記者 賀寶利
“僅從現象上來看,其對AI行業乃至國內外科技金融的巨大影響,也堪稱是一項顛覆性的創舉。一方面是DeepSeek的橫空出世,已經讓國外AI行業依靠壟斷資本用海量數據與超強算力堆砌而成的‘高墻小院’瞬間崩塌,另一方面國內外資本市場已經開始重塑中國資產尤其是科創屬性資產的價值重估”。針對近日國內外熱議的“DeepSeek”,中國科技技術發展戰略研究院研究員周代數接受《法治周末》記者采訪時,頗感自豪地說道。
1月20日,來自我國AI領域大模型DeepSeek的橫空出世,如同一顆重磅炸彈,在全球AI領域迅速掀起了驚濤駭浪。
截至1月27日,中國人工智能公司深度求索(DeepSeek)發布的DeepSeek-R1模型轟動業界,雙雙登頂蘋果中、美兩國應用商店免費APP下載排行榜榜首,超越行業老大哥Chat GPT。
二十多天過去了,其新聞熱度持續攀升,成為各領域尤其是科創金融領域共同關注的熱點、焦點。其以獨特的技術優勢和創新理念,深刻影響并改變著AI產業的原有格局,為行業發展注入著全新的活力,同時,也開始影響并改寫著與AI有關的上下游產業鏈。
打破壁壘革新研發新模式
“長期以來,AI大模型研發領域面臨著技術難度高、研發成本巨大的困境。傳統模式依賴巨額資金投入走依靠大量數據、超強算力的研發模式,使得諸多企業和科研機構望而卻步,整體行業發展也在一定程度上受到限制。但DeepSeek卻打破了這一局面,其研發團隊憑借全新的技術創新,在架構設計和訓練算法上另辟蹊徑,成功實現顛覆性突破”。國外某AI行業巨頭中國區一不愿透露姓名的工作人員接受記者采訪時坦言。
DeepSeek目前有兩種版本,即DeepSeek-R1與DeepSeek-V3前者是推理有限的模型,側重于處理復雜的推理任務,為需要深度邏輯分析和問題解決的場景而設計,而后者是通用型大語言模型,重點是為可擴展性和高效處理,目標是在多種自然語言處理任務中實現高效、靈活運用。
記者采訪了解到,DeepSeek采用了無人工干預的強化學習和混合專家模型等創新架構,大幅提升了訓練效率,降低了對算力的要求。在訓練成本上,與國外OpenAI動輒數千萬美元的投入相比,DeepSeek以極低的成本實現了高性能的模型訓練,這讓更多的參與者看到了進入AI研發領域的可能性。
DeepSeek自1月20日發布以來,迅速以其低成本、高性能等特性震撼AI行業。
首先,在技術層面,它采用了先進的架構設計,如混合專家(MoE)架構,能在執行任務時僅激活傳統技術要求有6710億參數(V3總參數)中的一部分,大大提升了效率。預訓練階段加入強化學習這一創新舉措,使得DeepSeek-V3訓練成本僅為Llama3系列的7%,這在傳統追求高投入、高算力的AI大模型研發領域,無疑是一個降本增效的重大突破。
在實際應用表現上,DeepSeek也十分亮眼。其在代碼生成、數學推理、自然語言處理等任務中表現出色,有權威數據顯示其在中文理解方面更是超越OpenAI,準確率達到92.5%,響應速度平均僅0.8秒。這種技術實力與成本優勢的結合的模式,必將吸引大量依賴AI技術應用者的目光。
以DeepSeek-R1模型為例,公開數據顯示其訓練成本僅約557.6萬美元,但其在數學、代碼、自然語言推理等關鍵任務上,性能直逼OpenAI-o1正式版,實現了與GPT-4o性能效果相抗衡的水平。這與美國AI企業動輒投入數億甚至數十億美元訓練模型的傳統模式,形成鮮明對比。在模型推理層面,有數據顯示DeepSeek-R1的價格僅為2.2美元/百萬詞元,而同性能OpenAI-o1的價格高達60美元/百萬詞元,這使得AI應用的推理成本大幅降低,讓推理大模型調用進入平價時代。
DeepSeek通過顯著提高數據質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑。國際投行摩根士丹利的評價耐人尋味:“更大(的模型)不再等于更聰明;DeepSeek的模型現在低成本優勢突出,與國際知名大模型相比,其成本大約低了一個數量級。”
事實上,AI成本的下降是讓DeepSeek能夠從諸多大模型中脫穎而出的重要原因。據DeepSeek官網顯示,API的定價每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元。這個收費相當于OpenAI-o1運行成本的約三十分之一。DeepSeek也因此被迅速冠以“AI界拼多多”。
“這種低成本、高性能的技術突破,打破了人們對美國AI產業長期以來在技術研發路徑上的固有認知,即認為只有通過巨額資金投入、堆砌算力和海量數據投喂,才能訓練出頂尖的AI模型。DeepSeek的成功證明,創新的算法和架構同樣能夠實現卓越的模型性能,為全球AI技術發展開辟了新的道路。”前述國外某AI行業巨頭中國區工作人員如此評價。
開源共享構建產業新生態
開源策略是DeepSeek影響AI產業格局的又一重要舉措。
“為技術構筑高墻壁壘、以知識產權、商密資產保護為由為技術乃至產品甚至行業形成閉源模式,是西方商業領域圖謀壟斷獲利的通行做法。在資本巨鱷云集壟斷的AI領域,中國DeepSeek反其道而行之,將自身核心技術向全球開發者開放,這一行動猶如在平靜的湖面投入了一塊巨石,必然會激起千層浪”。上海金融與發展實驗室特聘專家、科創金融價值評估理論體系創始人楊川接受記者采訪時,如此介紹評價。
記者采訪了解到,開源意味著更多的開發者能夠基于DeepSeek的模型進行二次開發和創新應用。無論是個人開發者,還是初創企業,都可以借助DeepSeek的技術基礎,快速搭建起自己的AI應用場景,無需從頭開始進行復雜的模型訓練。
公開信息顯示,DeepSeek的自信開源,已經對美國部分AI企業乃至行業形成直接沖擊。美國科技巨頭英偉達、微軟、亞馬遜在1月31日幾乎同時宣布接入DeepSeek-R1模型。DeepSeek-R1的洪鐘大呂無疑讓美國AI企業深刻意識到了DeepSeek的強大競爭擠壓。
“我們原來使用LLaMa智能大模型,現在替換成Deepseek,使用成本預估由原來的每月十幾萬美元下降到忽略不計。現在Deepseek已經成為近期美國人熱議的話題。”日前,由知名投資銀行家王世渝策劃組織的“D12數字春秋論壇Deepseek專題討論會”會上,來自美國的劉瑞華博士線上介紹了她使用Deepseek的真實感受。華人劉博士在美國專注于一項攻克皮膚癌科創企業的孵化,Deepseek的使用低成本與開源讓她感受到了巨大的實惠與便利的同時“也感受到了華裔研究人員過去從未有過的尊重與自豪”。
市場調查顯示,在智能客服領域,許多國際企業開始采用DeepSeek的技術,以提升客服效率和客戶滿意度。這使得原本依賴美國AI技術的相關企業紛紛出現轉向,客觀上將導致美國AI企業在該領域市場份額受到擠壓。在內容創作方面,DeepSeek能夠快速生成高質量的文案、圖像等內容,吸引了眾多媒體、廣告公司等客戶,進一步削弱了美國AI企業在內容生成市場的優勢。
與美國企業轉向青睞DeepSeek一致的是,我國國內也掀起了一場積極擁抱DeepSeek的熱潮。最新消息顯示,繼互聯網大廠先后宣布上線DeepSeek后,我國國內多個AI醫療、多家新能源車企也宣布接入DeepSeek。近日,工信部宣布我國聯通、移動、電信三大基礎電信企業均全面接入DeepSeek開源大模型,實現在多場景、多產品中應用,針對熱門的DeepSeek-RI模型提供專屬算力方案和配套環境,助力國產大模型性能的釋放。
楊川認為,“這種顛覆性的開源共享模式,不僅會促進行業技術的快速傳播和迭代,還會構建起一個充滿活力、互利共贏的AI產業新生態,打破了以往少數巨頭壟斷技術的局面”。
沖破格局改寫商業新規則
“DeepSeek的崛起,必將促使美國AI巨頭們對自身產業發展的戰略規劃以及行業商業規則,重新定位與調整。長期以來,美國AI企業在研發過程中給人們的印象是過于依賴高成本的算力投入和大規模的數據收集。而DeepSeek通過優化算法、創新架構,實現了低成本、高性能的發展模式必然是對行業發展的一種創新顛覆”前述中國科技技術發展戰略研究院研究員周代數如此認為。
來自資本市場的消息顯示,其中DeepSeek概念股持續火爆。統計顯示A股在2月5日開市,第一周僅有3個交易日,盡管首個交易日未能“開門紅”,但隨后兩日的上攻表現強勢,2月7日,滬指重回3300點上方,成交額放大到1.99萬億元。從首周表現來看,滬指已累計上漲1.63%,深指上漲4.13%,創業板指漲幅達5.36%,北證50指數漲幅更是超過12%。科技股表現十分搶眼,其中,DeepSeek概念股持續火爆,連續4天位居A股概念板塊漲幅榜前列。
DeepSeek的火爆出圈,也影響著投資者重塑對中國資產的認知,讓中國科技類資產的價值正被重估。
近日,德意志銀行、高盛、美國銀行等多家外資機構紛紛發聲,加入看好中國資產的行列。德意志銀行在一份中國股市策略報告中表示,2025年將是中國企業在全球崛起的一年,中國股票估值折價的現象將消失。該報告認為,A股和港股的牛市周期已于2024年開啟,有望持續下去并超過此前高點。高盛則在研報中預計,今年MSCI中國指數有14%的上漲潛力。在樂觀預期下,漲幅有望達到28%。高盛看好中國的科技股,認為更加光明的增長前景和技術突破將帶來巨大的生產力提升,有助于縮小美國與中國科技股或半導體股票之間高達66%的估值差距。
“一方面,部分投資者擔憂DeepSeek的低成本優勢會使傳統以‘高投入、高算力’為核心的研發路徑受到沖擊,進而影響AI上游算力硬件的投資價值。但另一方面,從長遠來看,成本降低將加速下游AI應用的落地,隨著用戶規模和使用頻次的增加,算力行業的整體需求仍將增長。”楊川站在實體行業整體發展的高度如此分析。
與楊川觀點如出一轍的是,根據Grok創始人的統計分析結論:過去60年,每10年計算成本降低約為原來的千分之一,但人們的總體購買量增加了10萬倍,總支出反而增長了100倍。這意味著AI下游應用的發展將帶來更廣闊的市場空間。
“DeepSeek在美國這邊帶來的沖擊更大的是在金融領域。而且帶來的是投資項目時對項目評估與審視理念發生了根本性的轉變。過去資本與我們接洽時總是關心我們的財務報表,最近DeepSeek的沖擊讓與我們接觸的資本無一例外地更多開始關注我們成長性、科創屬性。”因為恰逢的皮膚癌藥物項目正處融資階段,劉瑞華博士同時注意到近期美國資本市場在DeepSeek的影響下,投資端出現了微妙的變化。
“技術實力和創新的發展模式,對美國AI產業產生了全方位的顛覆式影響。這不僅改變了全球AI產業的競爭格局,也為全球AI技術的發展和應用帶來了新的機遇與挑戰。未來,隨著AI技術的不斷發展,DeepSeek與美國AI企業之間的競爭與合作將成為行業關注的焦點,也將推動全球AI產業邁向新的發展階段。”周代數也分析道。
拓展邊界催生商業新模式
“有了DeepSeek的類似工具,讓數字科技賦能傳統產業將變得更加容易。”作為中國資本市場早期極為活躍的資深投資銀行家,王世渝有著近30多年的市場從業經歷,從信奉格雷厄姆、理查·芒格、巴菲特的價值投資理論,到參與國內大量企業的重組并購,王世渝對數字科技有了更新的系統理念,他認為“數字經濟將是實現中華民族偉大復興的必由經濟路徑”。從《D12-中國產業數字化解決方案》到數字蘗變,王世渝帶領一批追隨者結合國內企業數字化浪潮進行著深度社會實踐與探索。他認為:“DeepSeek的出現將讓數字科技賦能實體產業變得更便捷容易,將會讓身為制造業大國的中國實體產業,實現一次鳳凰涅槃。”
數據顯示,DeepSeek的出現已經為眾多行業帶來了新的發展契機,投資圈也隨之積極布局。在金融領域許多企業正試圖借助DeepSeek的技術優化金融數據分析、風險管理和智能投顧等業務,提升服務效率與客戶體驗,增強市場競爭力。
在企業服務領域,有消息顯示國內多家軟件公司正利用DeepSeek提升企業管理軟件的智能化水平,推動企業數字化轉型,拓展市場份額。同時,不少企業紛紛與DeepSeek展開合作,2月份以來,騰訊云、360、華為云等大廠相繼宣布與其牽手。
“隨著DeepSeek技術的不斷成熟和應用場景的持續拓展,AI技術與各行業的融合也更加深入,必將催生出一系列新的商業模式。”楊川分析道,“相信許多企業在選擇AI技術解決方案時,不再僅局限于傳統巨頭,而是將目光投向DeepSeek。這使得整個AI市場的競爭更加激烈,競爭規則也從單純的技術和品牌競爭,轉變為技術、成本、生態等多維度的綜合競爭。”
“DeepSeek垂直應用可滿足不同行業的特定需求,為行業發展帶來新的機遇。其中有兩個行業將會有快速的商業化。基于DeepSeek技術的垂直領域應用將在醫療領域不斷涌現,如針對醫療行業的智能診斷平臺,通過對大量醫療數據的分析和學習,輔助醫生進行疾病診斷,提高診斷的準確性和效率;而針對教育行業的個性化學習系統,根據學生的學習情況和特點,提供定制化的學習方案和輔導內容。”王世渝分析判斷。
另一方面,王世渝認為:圍繞DeepSeek的運用將會形成新的產業分工和合作模式。一些企業專注于DeepSeek技術的二次開發和應用推廣,為其他企業提供定制化的AI解決方案;一些企業則提供數據標注、模型優化等配套服務,與DeepSeek形成上下游協同發展的產業格局。此外,AIaaS(人工智能即服務)平臺也借助DeepSeek技術不斷發展壯大,通過云端服務的方式,為用戶提供便捷的AI能力調用,進一步降低了AI應用的門檻。
“DeepSeek的出現是AI產業發展歷程中的一個重要里程碑,也是數字科技助力賦能傳統產業的一次顛覆新機遇。預計未來從技術研發、生態構建、市場競爭等多個方面,將全面重塑實體產業格局。未來,隨著類似DeepSeek技術的持續進步和應用的不斷深化,數字科技助推產業升級轉型的作用將日益凸顯,數字科技服務于社會經濟發展、為人類創造更多的價值和可能性將成必然。”周代數認為。
■ 鏈接
視覺中國供圖
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司。DeepSeek是一家創新型科技公司,成立于2023年7月17日,使用數據蒸餾技術,得到更為精煉、有用的數據。由知名私募巨頭幻方量化孕育而生,專注于開發先進的大語言模型(LLM)和相關技術。注冊地址:浙江省杭州市拱墅區環城北路169號匯金國際大廈西1幢1201室。法定代表人為裴湉,經營范圍包括技術服務、技術開發、軟件開發等。
2024年1月5日,發布DeepSeek LLM(深度求索的第一個大模型)。1月25日,發布DeepSeek-Coder。2月5日,發布DeepSeekMath。3月11日,發布DeepSeek-VL。5月7日,發布DeepSeek-V2。6月17日,發布DeepSeek-Coder-V2。9月5日,更新API支持文檔,宣布合并 DeepSeekCoderV2和DeepSeekV2 Chat ,推出DeepSeek V2.5。12月13日,發布DeepSeek-VL2。12月26日晚,正式上線DeepSeek-V3首個版本并同步開源。今年1月31日,英偉達宣布DeepSeek-R1模型登陸NVIDIANIM。同一時段內,亞馬遜和微軟也接入DeepSeek-R1模型。英偉達稱,DeepSeek-R1是最先進的大語言模型。2月5日消息,DeepSeek-R1、V3、Coder等系列模型,已陸續上線國家超算互聯網平臺。2月6日消息,澳大利亞政府以所謂“擔心安全風險”為由,已禁止在所有政府設備中使用DeepSeek。2月8日,DeepSeek正式登陸蘇州,并在蘇州市公共算力服務平臺上完成部署上線,為用戶提供開箱即用的軟硬件一體服務。
據國內AI產品榜統計,DeepSeek應用上線僅20天,日活躍用戶數就突破2000萬大關。2月1日,日活躍用戶數突破3000萬,成為史上最快達成這一里程碑的應用模型。