深圳新聞網2026年2月2日訊(深圳特區(qū)報記者 馬小晗)近日,某數(shù)據中心面臨一項典型困境:新采購的國產AI算力設備在運行最新大模型時,實際效率不足硬件理論峰值的10%。超過九成的算力因底層“算子”缺失而被“封印”,昂貴的芯片面臨淪為“算力廢鐵”的風險。這并非孤例,而是當前國產AI算力生態(tài)普遍存在的關鍵瓶頸。
幾乎同時,在深圳星河WORLD園區(qū),初創(chuàng)企業(yè)智子芯元從深創(chuàng)賽龍崗區(qū)預選賽中脫穎而出,其“高性能算子自動發(fā)現(xiàn)與優(yōu)化”技術奪得頭籌,為破解這一困境提供了全新思路。
瓶頸:生態(tài)壁壘與人才浪費
算子,是算法與底層硬件之間的“翻譯官”,決定了數(shù)據如何流動與計算。英偉達憑借CUDA生態(tài),積累了近600萬開發(fā)者與完備算子庫,構筑了巨大優(yōu)勢。相比之下,國產算力生態(tài)的活躍開發(fā)者僅數(shù)千人。
“沒有完善的算子生態(tài),國產芯片就像沒有操作系統(tǒng)的手機?!敝亲有驹?lián)合創(chuàng)始人丁添指出。傳統(tǒng)算子開發(fā)是智力與勞動雙密集的工程:一位頂尖算子工程師需精通軟硬件、計算加速與優(yōu)化,卻常將大量時間耗費在反復調參測試中。
適配一個主流大模型,某國產芯片廠商曾需百人團隊攻關三個月;每更新一代芯片,基礎算子開發(fā)周期可長達兩年。更嚴峻的是,大模型以“周”為單位迭代,芯片硬件每年快速更迭,傳統(tǒng)“人海戰(zhàn)術”動輒數(shù)月的開發(fā)周期,已難以跟上產業(yè)步伐。
破局:“AI+數(shù)學”驅動自動優(yōu)化
智子芯元提出了“AI+數(shù)學”雙輪驅動的解決方案。該系統(tǒng)將大模型的生成能力與運籌優(yōu)化的推演能力結合,實現(xiàn)算子的自動發(fā)現(xiàn)與優(yōu)化。
在2025年華為全聯(lián)接大會上,其發(fā)布的ModelBridge工具展示了驚人效能:將Qwen3-14B大模型在國產芯片上從零適配的時間,從數(shù)天縮短至30分鐘。經2小時自動優(yōu)化后,推理吞吐量比社區(qū)最佳方案提升40%。
“算子優(yōu)化本質是萬億級組合空間的數(shù)學搜索問題,復雜度遠超人類窮舉能力?!倍√斫忉專祟惖膬?yōu)勢在于經驗靈感,AI的優(yōu)勢在于不知疲倦的搜索驗證。
定位:連接算力“島嶼”與應用“海洋”
智子芯元將自身定位為國產算力生態(tài)的“連接器”。橋的一端,是華為昇騰、中科海光、寒武紀等多元發(fā)展但生態(tài)初建的國產算力芯片,如同亟待打通的“算力島嶼”;另一端,則是DeepSeek、Qwen等大模型及自動駕駛、生物醫(yī)藥等“快速迭代且極度饑渴”的AI應用“海洋”。
“目標是讓開發(fā)者不再被硬件定義?!倍√砻枥L未來:開發(fā)者專注算法創(chuàng)新,底層適配由自動化工具完成。
根基:深圳沃土孕育“攻堅隊”
智子芯元的團隊與發(fā)展路徑,體現(xiàn)了深圳產學研融合的強大孵化力。丁添是華為2012實驗室前技術領軍,核心團隊包括前大模型公司CTO、頭部芯片廠商算子專家,近半數(shù)研發(fā)成員擁有國際數(shù)學與計算機競賽金牌背景。
“我們在探索數(shù)學與AI最本質的結合如何轉化為產業(yè)生產力?!倍√肀硎尽_@種頂尖學術與產業(yè)需求的深度融合,正是深圳創(chuàng)新生態(tài)的典型特征。
深圳是全球硬件制造與芯片設計中心,但邁向“智算高地”必須補強軟件生態(tài)短板。龍崗區(qū)將人工智能作為核心戰(zhàn)略,提供了從研發(fā)空間到創(chuàng)新政策的全方位支持。智子芯元從港中大(深圳)的創(chuàng)新土壤萌芽,在龍崗的產業(yè)環(huán)境中成長,成為深圳“基礎研究+技術攻關+成果轉化”創(chuàng)新體系的生動案例。
丁添說,自己已從解決尖端問題的“國家隊隊員”,轉變?yōu)榻夥诺讓有实摹霸鞓蛘摺薄_@座無形的“橋”每延伸一段,國產AI算力生態(tài)的“天塹”就變通途一分。