《連場取勝》港股連升第十日,科技股表現突出,當中,近期倍升的商湯(00020)繼
續受到市場追捧,大家可以繼續關注。
在「日日新5﹒0」發布會上,我們聽到商湯CEO徐立表示,「今年是端側大模型爆發的
一年」。商湯的運算力大幅提升,投放在「雲、邊、端」全棧大模型中,產生了「雲端模型」及
「端邊模型」。
雲端模型,主要是指經過電訊商的網絡,來進行雲上與端機上的接觸。由於商湯千億大模型
SenseChat(商量)已升級到5﹒0,達到6000億參數,支持混合專家架構MoE
大幅提升創意寫作能力、推理能力及總結能力等,在端機輸入相同的中文知識注入後,可獲得更
好的理解總結及問答,達到業內領先水平。在多模態能力上,支持高清長圖的解析和理解以及文
生圖交互式生成,實現複雜的跨文檔知識抽取及總結問答展示,並具備豐富的多模態交互能力。
而隨著大模型技術的快速發展,不同應用場景的需求日益顯現,人工智能(AI)大模型在
智能手機、電腦、VR眼鏡等終端設備領域的應用也成為一大趨勢,因此公司推出1﹒8B
(18億)參數規模的SenseChat-Lite版本端側大模型,是為端邊模型。而商量
端側模型SenseChat-Lite亦成為了此次發布的亮點,不但全面領先所有開源2B
的同級別模型,並在測評上部分超越Llama-2 7B模型的效果。
事實上,自去年以來,端側大模型一直是消費電子行業和AI行業共同關注的熱點。端側大
模型是運行在設備端的大模型,通常比我們熟悉的GPT等大模型參數量更小,只有18億參數
,對比雲端模型的6000億參數,因此可以使用端側算力直接運行。端側大模型有著在任何網
絡條件下都可以生成回答、隱私不必離開設備、無需雲端算力使成本更低等種種優勢。
有著更強的端側AI能力,意味著原本做不到的用戶場景將被進一步打開,如工作文件也可
以直接用手機大模型進行處理,保存最高的私隱權;在沒有網絡的飛機上,亦能流暢聊天;也可
以讓孩子在斷網的情況下學習知識。而端側模型使用的算力和電力是由設備本身提供,用戶不需
要額外付費,就能得到體驗提升,而廠家則能夠省下雲端的成本,是雙贏局面。由於成本更低,
對消費電子產業本身也將產生影響,端側模型將使包括汽車(如小米SU7上的小愛同學設備)
、XR在內的種種終端設備,尤其是平價的電子設備如小愛智能音箱等,能夠有機會接入智能體
驗,而毋須過多考慮算力成本。
商湯從上一個AI時代就為手機提供底層能力,而在大模型時代,再次抓住了相關機遇,不
但推出能力媲美GPT-4的雲端大模型,此次又推出了速度最快的端側模型。公司的端側模型
,目前用戶還無法直接在手機上體驗到,需要智能硬件的廠商與商湯合作,共同部署。但可以想
象到,端側模型市場潛力巨大,每年有數十億部手機及電腦出貨量,手握智能設備市場在過往的
良好合作經驗,在端側未來的廣大市場,商湯大有可為,商業化變現能力將大為提升,為未來一
年內達成收支平衡帶來基礎,大家應繼續留意此股。《香港股票分析師協會理事 連敬涵》
*筆者持有上述股份
*《經濟通》所刊的署名及╱或不署名文章,相關內容屬作者個人意見,並不代表《經濟通》立
場,《經濟通》所扮演的角色是提供一個自由言論平台。
【你點睇】港府本年度已錄逾2千億元赤字,有議員指或難符基本法力求收支平衡之規定。你認為當局應如何解決財政問題?► 立即投票