中國(guó)AI正掀起全球"算力平權(quán)"革命。
當(dāng)中國(guó)AI初創(chuàng)公司DeepSeek以557.6萬(wàn)美元的訓(xùn)練成本,在數(shù)學(xué)推理、代碼生成等核心指標(biāo)上追平硅谷巨頭耗資數(shù)億美元打造的模型時(shí),這場(chǎng)由算法創(chuàng)新與開源生態(tài)共同驅(qū)動(dòng)的技術(shù)革命,正在將科技巨頭壟斷的算力資源轉(zhuǎn)化為普惠化基礎(chǔ)設(shè)施。
在這場(chǎng)由中國(guó)企業(yè)主導(dǎo)的變革中,本土生態(tài)的構(gòu)建正在提速。盡管與國(guó)際先進(jìn)水平仍存差距,但政策支持與市場(chǎng)倒逼的雙重驅(qū)動(dòng)下,從國(guó)產(chǎn)硬件到端側(cè)應(yīng)用的自主化鏈條逐步成型。同時(shí),隨著推理側(cè)算力成本的降低,“算力平權(quán)”將有望加速端側(cè)AI和Agent應(yīng)用的落地,同時(shí)落地應(yīng)用也將帶來(lái)信創(chuàng)建設(shè)需求,相關(guān)板塊將迎來(lái)新的投資布局機(jī)會(huì)。
在這一背景下,AI技術(shù)的普惠化和應(yīng)用場(chǎng)景的拓展成為行業(yè)關(guān)注的焦點(diǎn)。2025年2月23日,以“模塑全球 無(wú)限可能”為主題的全球開發(fā)者先鋒大會(huì)(GDC)圓滿落幕。在這場(chǎng)匯聚全球開發(fā)者與創(chuàng)新者的大會(huì)上,星環(huán)科技(688031.SH)正式發(fā)布"三位一體"的DeepSeek全場(chǎng)景解決方案,涵蓋省力版、高階版和端側(cè)版,全面覆蓋個(gè)人用戶、企業(yè)客戶及行業(yè)場(chǎng)景需求,為用戶提供從個(gè)人到企業(yè)、從云端到本地的全方位AI應(yīng)用支持。
這種覆蓋個(gè)人用戶到企業(yè)級(jí)場(chǎng)景的全棧能力,正在為這場(chǎng)算力平權(quán)運(yùn)動(dòng)提供關(guān)鍵基礎(chǔ)設(shè)施。
一、云端協(xié)同新范式
在AI技術(shù)快速普及的當(dāng)下,星環(huán)科技通過(guò)云端協(xié)同與端側(cè)智能的結(jié)合,為用戶提供了即開即用的高效體驗(yàn)。針對(duì)輕量化需求場(chǎng)景,星環(huán)科技推出了網(wǎng)頁(yè)版及小程序服務(wù),用戶無(wú)需下載或配置,即可直接調(diào)用DeepSeek 671B滿血版模型的AI搜索能力。這種“打開即AI”的模式,讓普通用戶能夠快速體驗(yàn)大模型的語(yǔ)義理解、信息檢索等核心功能。
然而,純?cè)诰€模式存在一些局限性。首先,在線模式需要將用戶數(shù)據(jù)上傳至云端處理,高度依賴網(wǎng)絡(luò)穩(wěn)定性。弱網(wǎng)環(huán)境可能導(dǎo)致響應(yīng)延遲或服務(wù)中斷,影響對(duì)實(shí)時(shí)性要求較高的場(chǎng)景,如實(shí)時(shí)翻譯和AR交互。其次,用戶原始數(shù)據(jù)(如照片、語(yǔ)音)需傳輸至云端,存在被截獲或?yàn)E用的風(fēng)險(xiǎn),尤其在金融、醫(yī)療等敏感領(lǐng)域難以滿足合規(guī)要求。此外,部分場(chǎng)景因政策或物理限制無(wú)法聯(lián)網(wǎng),純?cè)诰€模式無(wú)法提供服務(wù)。
為解決這些問(wèn)題,星環(huán)科技推出了“無(wú)涯問(wèn)知 AI PC”版,并接入DeepSeek,實(shí)現(xiàn)大模型在個(gè)人電腦端的本地化流暢運(yùn)行。通過(guò)分層知識(shí)蒸餾技術(shù),星環(huán)科技將參數(shù)量高達(dá)6710億的原始大模型壓縮至輕量級(jí)版本。這一技術(shù)并非簡(jiǎn)單縮小模型,而是通過(guò)保留核心能力,攻克了終端部署的三大瓶頸——存儲(chǔ)空間、算力消耗與推理延遲,使端側(cè)AI從“能用”進(jìn)階為“好用”。
星環(huán)科技的解決方案不僅讓端側(cè)AI“好用”,更在隱私與效能之間找到了完美的平衡。數(shù)據(jù)全程封閉處理,結(jié)合本地RAG(檢索增強(qiáng)生成)技術(shù),用戶可以離線分析敏感文件。某律所的實(shí)測(cè)結(jié)果顯示,法律案例解析效率提升了50%,且數(shù)據(jù)零出網(wǎng),充分保障了用戶隱私。同時(shí),通過(guò)Intel Ultra處理器的專項(xiàng)優(yōu)化,性能提升了30%,徹底打破了“AI必須依賴高端硬件”的固有認(rèn)知,僅需8GB內(nèi)存即可運(yùn)行大模型。此外,星環(huán)科技還實(shí)現(xiàn)了云端協(xié)同的“雙模智能”。這種動(dòng)態(tài)調(diào)度能力,讓一臺(tái)普通筆記本電腦同時(shí)具備了安全性與高階智能,兼顧了實(shí)時(shí)體驗(yàn)與功能深度。
星環(huán)科技的這一布局,填補(bǔ)了國(guó)產(chǎn)AI本地化部署的空白,并為金融、法律等數(shù)據(jù)敏感行業(yè)提供了安全可控的解決方案。
市場(chǎng)分析人士指出,端側(cè)AI的“iPhone 4時(shí)刻”已經(jīng)到來(lái)。未來(lái),隨著分布式計(jì)算與Agent技術(shù)的深化,終端設(shè)備將逐步具備自主任務(wù)處理能力,推動(dòng)AI從工具向智能化基石的質(zhì)變,背后可能是萬(wàn)億級(jí)的市場(chǎng)空間。
星環(huán)科技正與硬件廠商深度合作,未來(lái)將有更多預(yù)裝AI模型的終端設(shè)備面世。
2025年,星環(huán)科技與宏碁合作開發(fā)了宏碁專屬的AI助手——A星人專業(yè)版,并定制推出了全新的AIPC產(chǎn)品——宏碁優(yōu)躍PRO。該產(chǎn)品預(yù)裝了無(wú)涯問(wèn)知AI系統(tǒng)和單機(jī)版向量數(shù)據(jù)庫(kù)。此前,星環(huán)科技已與惠普合作,推出了預(yù)裝無(wú)涯問(wèn)知AI系統(tǒng)的AI PC套裝,旨在為個(gè)人電腦用戶提供本地化AI服務(wù)。目前,內(nèi)置星環(huán)科技AI PC服務(wù)的AI PC電腦已在各大電商平臺(tái)上線,標(biāo)志著星環(huán)科技在端側(cè)AI領(lǐng)域的布局已初見成效。
二、全棧技術(shù)與場(chǎng)景化服務(wù)融合
AI浪潮席卷全球,企業(yè)智能化轉(zhuǎn)型已成大勢(shì)所趨。在這場(chǎng)變革中,星環(huán)科技憑借“全棧技術(shù)+國(guó)產(chǎn)化生態(tài)”的雙重壁壘,構(gòu)建了企業(yè)級(jí)AI部署的核心競(jìng)爭(zhēng)力。其戰(zhàn)略布局圍繞全棧技術(shù)閉環(huán)與場(chǎng)景化服務(wù)能力兩大支點(diǎn),成功打破傳統(tǒng)AI在企業(yè)級(jí)部署時(shí)的碎片化困局。
1. 技術(shù)壁壘:全鏈路能力構(gòu)建護(hù)城河
星環(huán)科技的核心武器,是其自主研發(fā)的Sophon LLMOps平臺(tái)。與僅聚焦模型訓(xùn)練或推理的競(jìng)品不同,該平臺(tái)覆蓋了從語(yǔ)料處理、提示工程、模型訓(xùn)練調(diào)優(yōu)到應(yīng)用落地的全生命周期管理。例如,在語(yǔ)料處理環(huán)節(jié),平臺(tái)支持多模態(tài)數(shù)據(jù)從多源接入,通過(guò)轉(zhuǎn)換、過(guò)濾、去重及安全隱私處理,解決企業(yè)數(shù)據(jù)分散、質(zhì)量參差的痛點(diǎn)。
國(guó)產(chǎn)化適配能力,則是另一道護(hù)城河。星環(huán)科技的解決方案支持國(guó)內(nèi)外GPU/NPU的混合調(diào)度,為企業(yè)提供了靈活的算力選擇。此外,平臺(tái)針對(duì)國(guó)產(chǎn)GPU(如寒武紀(jì)、海光、昇騰等)進(jìn)行底層優(yōu)化,充分發(fā)揮硬件性能,支持FP8等混合精度計(jì)算。這不僅提升了資源利用效率,還使得企業(yè)能夠在國(guó)產(chǎn)化硬件平臺(tái)上實(shí)現(xiàn)高性能計(jì)算。這一自主可控的算力底座,可以滿足了不同行業(yè)對(duì)數(shù)據(jù)安全與合規(guī)的要求。
憑借這些技術(shù)優(yōu)勢(shì),Sophon LLMOps平臺(tái)實(shí)現(xiàn)了全棧能力覆蓋,支持開源、商業(yè)化及自研模型的統(tǒng)一管理。它已成功幫助客戶搭建大模型管理平臺(tái),納管超過(guò)30種開閉源的生成式大模型及70余個(gè)大模型服務(wù)。平臺(tái)提供基于671B參數(shù)規(guī)模大模型(R1版本)的訓(xùn)練、推理及應(yīng)用開發(fā)服務(wù),支持FP8混合精度計(jì)算,顯著提升訓(xùn)練效率并降低顯存占用,實(shí)現(xiàn)了“滿血”性能釋放。這種從底層硬件到上層應(yīng)用的全方位優(yōu)化,不僅提升了技術(shù)的實(shí)用性,更為企業(yè)級(jí)AI部署提供了高效、安全、可控的解決方案。
2、場(chǎng)景化服務(wù)能力:垂直場(chǎng)景的“外科手術(shù)式”適配
技術(shù)優(yōu)勢(shì)向商業(yè)價(jià)值的轉(zhuǎn)化,則依托于場(chǎng)景化服務(wù)能力的精耕細(xì)作。
然而,下游應(yīng)用場(chǎng)景日益碎片化與縱深化,技術(shù)提供商需要對(duì)垂直場(chǎng)景進(jìn)行深度解構(gòu),以實(shí)現(xiàn)技術(shù)與業(yè)務(wù)的深度融合。這意味著他們不僅要具備通用化的技術(shù)能力,更需要深入理解各行業(yè)的Know-How,從而為客戶提供真正貼合業(yè)務(wù)需求的解決方案。
星環(huán)科技的Sophon LLMOps平臺(tái)正是基于這一理念而構(gòu)建,以打造"技術(shù)解耦+知識(shí)融合"的雙輪驅(qū)動(dòng)模式。
平臺(tái)內(nèi)置高效的分布式訓(xùn)練框架、微調(diào)工具鏈及模型壓縮技術(shù),能夠支持企業(yè)快速適配業(yè)務(wù)數(shù)據(jù),顯著降低大模型的應(yīng)用門檻。這種場(chǎng)景化開發(fā)支持能力,使得企業(yè)能夠在短時(shí)間內(nèi)將AI技術(shù)落地到實(shí)際業(yè)務(wù)中,提升運(yùn)營(yíng)效率。
此外,Sophon LLMOps平臺(tái)還結(jié)合金融、政務(wù)、醫(yī)療等行業(yè)知識(shí)庫(kù),打造領(lǐng)域?qū)俚拇竽P汀_@些模型針對(duì)特定行業(yè)的需求進(jìn)行了優(yōu)化,能夠在業(yè)務(wù)場(chǎng)景中提供更高的準(zhǔn)確性和實(shí)用性。例如,在金融領(lǐng)域,專屬模型可以精準(zhǔn)識(shí)別風(fēng)險(xiǎn)并輔助投資決策;在醫(yī)療領(lǐng)域,模型能夠支持輔助診斷,提高診斷效率和準(zhǔn)確性。
展望未來(lái),Sophon LLMOps平臺(tái)將繼續(xù)拓展其應(yīng)用場(chǎng)景,面向研發(fā)、采購(gòu)、生產(chǎn)、HSE、營(yíng)銷、綜合辦公等多個(gè)領(lǐng)域提供集約化的平臺(tái)服務(wù)。通過(guò)這種一站式的服務(wù)模式,平臺(tái)將助力企業(yè)核心業(yè)務(wù)實(shí)現(xiàn)智能化轉(zhuǎn)型升級(jí),為企業(yè)帶來(lái)更高效、更智能的運(yùn)營(yíng)體驗(yàn)。
在技術(shù)優(yōu)勢(shì)與場(chǎng)景化服務(wù)能力的雙重加持下,企業(yè)智能化轉(zhuǎn)型似乎已步入快車道。然而,當(dāng)AI技術(shù)真正觸及數(shù)據(jù)主權(quán)與成本效益的深水區(qū)時(shí),一個(gè)更為復(fù)雜的挑戰(zhàn)浮出水面——如何破解企業(yè)級(jí)AI部署中的"不可能三角"?
三、破解企業(yè)級(jí)AI部署中的“不可能三角”
在AI技術(shù)加速普及的浪潮中,企業(yè)級(jí)AI部署正面臨一場(chǎng)前所未有的挑戰(zhàn)。政府機(jī)構(gòu)、央國(guó)企以及金融、醫(yī)療等數(shù)據(jù)敏感型行業(yè),需要在保障數(shù)據(jù)主權(quán)安全的同時(shí),實(shí)現(xiàn)AI應(yīng)用的高效落地,并有效控制成本。這一難題被形象地稱為企業(yè)級(jí)AI部署的“不可能三角”。
據(jù)第三方測(cè)試數(shù)據(jù)顯示,傳統(tǒng)云端AI方案的平均響應(yīng)延遲高達(dá)1.2秒,難以滿足實(shí)時(shí)風(fēng)控、智能客服等對(duì)時(shí)效性要求極高的業(yè)務(wù)場(chǎng)景。與此同時(shí),政府、央國(guó)企以及金融、醫(yī)療等行業(yè)涉及大量公民隱私、國(guó)家安全和商業(yè)機(jī)密數(shù)據(jù)。隨著《關(guān)鍵信息基礎(chǔ)設(shè)施安全保護(hù)條例》等法規(guī)的落地,私有化部署的合規(guī)性需求愈發(fā)凸顯。在此背景下,浙商證券預(yù)估,隨著DeepSeek等大模型帶動(dòng)的快速部署需求增長(zhǎng),約80%的央國(guó)企大模型使用場(chǎng)景將轉(zhuǎn)向私有化部署。然而,自建算力中心的高昂顯性成本——?jiǎng)虞m千萬(wàn)級(jí)的投入,以及私有化部署的隱性成本——高筑的技術(shù)門檻與時(shí)間投入,讓眾多中小機(jī)構(gòu)乃至大機(jī)構(gòu)望而卻步。因此,第三方服務(wù)商的支持成為破局的關(guān)鍵。
46萬(wàn)家央國(guó)企的存量需求正在引爆一個(gè)千億級(jí)市場(chǎng),吸引眾多企業(yè)入局。星環(huán)科技就是其中的范例。
星環(huán)科技如何破解這一“不可能三角”?
星環(huán)科技通過(guò)其Sophon LLMOps平臺(tái),為企業(yè)提供了一站式的私有化部署解決方案。企業(yè)可以利用該平臺(tái)快速部署DeepSeek R1模型,實(shí)現(xiàn)具備深度思考能力的服務(wù)和應(yīng)用開發(fā)。通過(guò)將知識(shí)庫(kù)和工具調(diào)用集成到企業(yè)內(nèi)部,星環(huán)科技加速了基于大模型的企業(yè)級(jí)應(yīng)用落地,滿足了數(shù)據(jù)安全與合規(guī)的嚴(yán)格要求。
此外,星環(huán)科技還提供全棧私有化交付服務(wù),支持將R1大模型及其配套工具鏈部署到企業(yè)本地?cái)?shù)據(jù)中心或?qū)僭骗h(huán)境中。這種定制化服務(wù)可根據(jù)企業(yè)需求提供硬件選型指導(dǎo)、性能調(diào)優(yōu)以及模型輕量化適配,確保在私有環(huán)境下實(shí)現(xiàn)高效運(yùn)行。
以某頭部券商為例:通過(guò)應(yīng)用Sophon LLMOps建設(shè)自有大模型管理平臺(tái),該券商成功納管了超過(guò)30種開閉源的生成式大模型及70余個(gè)大模型服務(wù)。平臺(tái)的易用性和系統(tǒng)穩(wěn)定性極高,恢復(fù)時(shí)間目標(biāo)(RTO)不超過(guò)4小時(shí),恢復(fù)點(diǎn)目標(biāo)(RPO)不超過(guò)5分鐘?;诜植际胶腿萜骰牟渴鸺軜?gòu),該平臺(tái)持續(xù)穩(wěn)定地為招商證券創(chuàng)意中心、研報(bào)助手、托管助手和金投客戶智能詢價(jià)等場(chǎng)景提供服務(wù),并通過(guò)建設(shè)國(guó)產(chǎn)算力池,實(shí)現(xiàn)了國(guó)產(chǎn)NPU算力與GPU的統(tǒng)一管理。
據(jù)悉,該項(xiàng)目是國(guó)內(nèi)較早完成國(guó)產(chǎn)化推理引擎、國(guó)產(chǎn)化GPU、國(guó)內(nèi)外GPU混合部署統(tǒng)一管理、卡切分及多級(jí)多卡、大/小模型統(tǒng)一納管監(jiān)控等前沿技術(shù)的案例。
星環(huán)科技在金融場(chǎng)景的深度突破,得益于其在金融、政企等場(chǎng)景的深厚的Know-How積累。
截至2024年6月,星環(huán)科技已擁有約1600家終端用戶,覆蓋金融、政府、能源、交通、制造等眾多國(guó)民經(jīng)濟(jì)支柱領(lǐng)域;其中公司服務(wù)超過(guò)300家金融機(jī)構(gòu)。2024年上半年,金融行業(yè)客戶收入占公司主營(yíng)業(yè)務(wù)收入的39.69%。
而金融領(lǐng)域是企業(yè)私有化部署的先行場(chǎng)景。截至2024年2月12日,已有近20家券商完成DeepSeek的本地化部署,多家券商正積極推進(jìn)部署工作。國(guó)泰君安、國(guó)金證券、廣發(fā)證券等券商均已接入DeepSeek系列模型,加速企業(yè)智能化轉(zhuǎn)型。
隨著大模型技術(shù)的滲透率提升,其應(yīng)用場(chǎng)景將更加廣泛。
券商接入DeepSeek大模型后,可應(yīng)用于智能客服、智能系統(tǒng)運(yùn)維、行業(yè)研究、風(fēng)險(xiǎn)管理、智能辦公和智能投顧等多個(gè)場(chǎng)景。同時(shí),DeepSeek還能深入行業(yè)研究、投資分析和軟件開發(fā)等業(yè)務(wù)部門,助力業(yè)務(wù)部門實(shí)現(xiàn)智能化轉(zhuǎn)型。在銀行領(lǐng)域,本地化部署的DeepSeek大模型,可應(yīng)用于智能合同管理、智能風(fēng)控、資產(chǎn)托管與估值對(duì)賬、客服助手和智庫(kù)等多個(gè)場(chǎng)景。在保險(xiǎn)行業(yè),智能客服、銷售賦能、日程管理、產(chǎn)品培訓(xùn)和智能核保等多個(gè)AI應(yīng)用場(chǎng)景將顯著提升了保險(xiǎn)從業(yè)者的工作效率。
隨著大模型私有化部署需求的增加,星環(huán)科技憑借其技術(shù)優(yōu)勢(shì)和豐富的客戶資源,有望進(jìn)一步擴(kuò)大市場(chǎng)份額。
結(jié)語(yǔ)
星環(huán)科技的實(shí)踐只是冰山一角。
它生動(dòng)地展示了AI技術(shù)如何跨越云端與端側(cè)的界限,深入企業(yè)級(jí)應(yīng)用與個(gè)人生活的每一個(gè)角落。在這場(chǎng)由算法創(chuàng)新與開源生態(tài)共同推動(dòng)的技術(shù)革命中,越來(lái)越多的企業(yè)仿佛智能革命的神經(jīng)元節(jié)點(diǎn),正以前所未有的速度和規(guī)模生長(zhǎng),并推動(dòng)AI的觸角延伸至社會(huì)的各個(gè)層面。
人與智能世界的互動(dòng)模式正經(jīng)歷著翻天覆地的變化,算力平權(quán)的理想正逐步從理想照進(jìn)現(xiàn)實(shí),開啟了一個(gè)全新的智能時(shí)代篇章。