omniture

移遠(yuǎn)通信邊緣計(jì)算模組成功運(yùn)行DeepSeek模型,以領(lǐng)先的工程能力加速端側(cè)AI落地

2025-02-12 19:00 443

上海2025年2月12日 /美通社/ -- 近日,國產(chǎn)大模型DeepSeek憑借其"開源開放、高效推理、端側(cè)友好"的核心優(yōu)勢,迅速風(fēng)靡全球。移遠(yuǎn)通信基于邊緣計(jì)算模組SG885G,已成功實(shí)現(xiàn)DeepSeek模型的穩(wěn)定運(yùn)行,并完成了針對性微調(diào)。

目前,該模型正在多款智能終端上進(jìn)行深入測試與優(yōu)化。移遠(yuǎn)通信將憑借其卓越的工程化能力,加速端側(cè)AI技術(shù)在各行各業(yè)的規(guī)?;瘧?yīng)用與普及。


DeepSeekAI模型創(chuàng)新先鋒

DeepSeek之所以火爆全球,源于其在模型架構(gòu)、蒸餾技術(shù)以及強(qiáng)化學(xué)習(xí)等方面的突破性創(chuàng)新。

完整版DeepSeek-V3模型采用創(chuàng)新的MoE(混合專家)架構(gòu),擁有6,710億參數(shù),每秒可處理60個Token,擅長處理長文檔分析、多模態(tài)推理等復(fù)雜任務(wù)和高精度場景。其每層包含256個路由專家和1個共享專家,每個Token僅激活8個專家,極大地提升了學(xué)習(xí)效率和靈活性,顯著降低了訓(xùn)練和推理成本,同時加速了Tokens生成。

為解決小推理模型Self-play學(xué)習(xí)的不足,DeepSeek-R1通過高效蒸餾技術(shù),將大模型的推理能力遷移到更小、更高效的版本中。這一突破使其小尺寸版本在保持卓越性能的同時,顯著降低了模型體積和計(jì)算資源需求,成為端側(cè)部署的理想選擇。

同時,DeepSeek-R1-Zero實(shí)驗(yàn)性版本證明了僅通過強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)、無需監(jiān)督式微調(diào),大模型也能具備強(qiáng)大的推理能力,為AI模型的訓(xùn)練開辟了新思路。

DeepSeek小尺寸版本:端側(cè)部署的理想選擇

DeepSeek-R1版本專注于強(qiáng)化學(xué)習(xí)技術(shù)路線,推理能力強(qiáng)、性價比突出,基于該版本開發(fā)的系列小尺寸蒸餾模型,參數(shù)范圍覆蓋1.5B至70B,為開發(fā)者提供了高性能、低成本的大模型部署與開發(fā)解決方案,將有力推動端側(cè)AI的商業(yè)化應(yīng)用。

簡化后的小模型從大模型中繼承了強(qiáng)大的AI能力,盡管參數(shù)量減少,但性能依然出色。由于計(jì)算量大幅降低,減少了內(nèi)存和計(jì)算資源的消耗,因此特別適合資源有限的端側(cè)設(shè)備。同時,推理速度顯著提升,能夠滿足端側(cè)設(shè)備對實(shí)時性的需求。此外,小模型體積更小,適配性更強(qiáng),更容易在各種行業(yè)終端和邊緣計(jì)算設(shè)備上集成和運(yùn)行。盡管模型壓縮,但通過蒸餾技術(shù),小模型仍能保持較高的精度,確保任務(wù)效果不受影響。

移遠(yuǎn)通信:以領(lǐng)先的工程能力加速端側(cè)AI落地

在眾多廠商仍在探索如何支持DeepSeek模型之際,移遠(yuǎn)通信已率先取得突破,其搭載高通QCS8550平臺的邊緣計(jì)算模組SG885G,成功實(shí)現(xiàn)了DeepSeek-R1蒸餾小模型的穩(wěn)定運(yùn)行。實(shí)測數(shù)據(jù)顯示,其生成Tokens的速度超過每秒40個Tokens,且未來隨著性能的不斷優(yōu)化,速度還將進(jìn)一步提升,為智能終端設(shè)備帶來更強(qiáng)大的AI能力。

同時,移遠(yuǎn)通信還與行業(yè)合作伙伴緊密合作,在機(jī)器人、智能座艙、智能工業(yè)等客戶應(yīng)用上開展深入測試與優(yōu)化,為用戶提供更為流暢的AI體驗(yàn)。


搭載DeepSeek模型的移遠(yuǎn)邊緣計(jì)算模組和解決方案,不僅適用于消費(fèi)類和工業(yè)類機(jī)器人領(lǐng)域,還可廣泛應(yīng)用于智能座艙、機(jī)器視覺、個性化虛擬助理、平板電腦、老人監(jiān)護(hù)、智能家居、AI玩具及可穿戴設(shè)備等多元化場景,為各行業(yè)提供強(qiáng)大的AI賦能,例如更自然的語音交互、更精準(zhǔn)的圖像識別以及更加個性化的服務(wù)體驗(yàn)。

此外,在成功實(shí)現(xiàn)DeepSeek模型端側(cè)運(yùn)行的基礎(chǔ)上,移遠(yuǎn)通信還完成了該模型的針對性微調(diào),并應(yīng)用于自身的大模型解決方案中,為客戶提供更精準(zhǔn)、更高效的端側(cè)AI服務(wù)。這一成果不僅彰顯了移遠(yuǎn)通信在端側(cè)AI領(lǐng)域的技術(shù)實(shí)力,更體現(xiàn)了其領(lǐng)先的工程化能力,將有力推動AIoT應(yīng)用的快速發(fā)展與落地。

面向亟待接入AI能力的廣泛垂直領(lǐng)域,移遠(yuǎn)通信將持續(xù)投入資源,推動更多高、中、入門級邊緣計(jì)算模組,以及智能座艙、5G、LTE模組和解決方案全面接入DeepSeek等先進(jìn)模型以及云端大模型,助力物聯(lián)網(wǎng)設(shè)備實(shí)現(xiàn)智能化升級,開啟萬物智聯(lián)新時代。

消息來源:移遠(yuǎn)通信
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection