移遠通信邊緣計算模組成功運行DeepSeek模型，以領先的工程能力加速端側AI落地

移遠通信

2025-02-12 19:00 6089

上海2025年2月12日 /美通社/ -- 近日，國產(chǎn)大模型DeepSeek憑借其"開源開放、高效推理、端側友好"的核心優(yōu)勢，迅速風靡全球。移遠通信基于邊緣計算模組SG885G，已成功實現(xiàn)DeepSeek模型的穩(wěn)定運行，并完成了針對性微調。

目前，該模型正在多款智能終端上進行深入測試與優(yōu)化。移遠通信將憑借其卓越的工程化能力，加速端側AI技術在各行各業(yè)的規(guī)?；瘧门c普及。

DeepSeek：AI模型創(chuàng)新先鋒

DeepSeek之所以火爆全球，源于其在模型架構、蒸餾技術以及強化學習等方面的突破性創(chuàng)新。

完整版DeepSeek-V3模型采用創(chuàng)新的MoE（混合專家）架構，擁有6,710億參數(shù)，每秒可處理60個Token，擅長處理長文檔分析、多模態(tài)推理等復雜任務和高精度場景。其每層包含256個路由專家和1個共享專家，每個Token僅激活8個專家，極大地提升了學習效率和靈活性，顯著降低了訓練和推理成本，同時加速了Tokens生成。

為解決小推理模型Self-play學習的不足，DeepSeek-R1通過高效蒸餾技術，將大模型的推理能力遷移到更小、更高效的版本中。這一突破使其小尺寸版本在保持卓越性能的同時，顯著降低了模型體積和計算資源需求，成為端側部署的理想選擇。

同時，DeepSeek-R1-Zero實驗性版本證明了僅通過強化學習（Reinforcement Learning，RL）、無需監(jiān)督式微調，大模型也能具備強大的推理能力，為AI模型的訓練開辟了新思路。

DeepSeek小尺寸版本：端側部署的理想選擇

DeepSeek-R1版本專注于強化學習技術路線，推理能力強、性價比突出，基于該版本開發(fā)的系列小尺寸蒸餾模型，參數(shù)范圍覆蓋1.5B至70B，為開發(fā)者提供了高性能、低成本的大模型部署與開發(fā)解決方案，將有力推動端側AI的商業(yè)化應用。

簡化后的小模型從大模型中繼承了強大的AI能力，盡管參數(shù)量減少，但性能依然出色。由于計算量大幅降低，減少了內(nèi)存和計算資源的消耗，因此特別適合資源有限的端側設備。同時，推理速度顯著提升，能夠滿足端側設備對實時性的需求。此外，小模型體積更小，適配性更強，更容易在各種行業(yè)終端和邊緣計算設備上集成和運行。盡管模型壓縮，但通過蒸餾技術，小模型仍能保持較高的精度，確保任務效果不受影響。

移遠通信：以領先的工程能力加速端側AI落地

在眾多廠商仍在探索如何支持DeepSeek模型之際，移遠通信已率先取得突破，其搭載高通QCS8550平臺的邊緣計算模組SG885G，成功實現(xiàn)了DeepSeek-R1蒸餾小模型的穩(wěn)定運行。實測數(shù)據(jù)顯示，其生成Tokens的速度超過每秒40個Tokens，且未來隨著性能的不斷優(yōu)化，速度還將進一步提升，為智能終端設備帶來更強大的AI能力。

同時，移遠通信還與行業(yè)合作伙伴緊密合作，在機器人、智能座艙、智能工業(yè)等客戶應用上開展深入測試與優(yōu)化，為用戶提供更為流暢的AI體驗。

搭載DeepSeek模型的移遠邊緣計算模組和解決方案，不僅適用于消費類和工業(yè)類機器人領域，還可廣泛應用于智能座艙、機器視覺、個性化虛擬助理、平板電腦、老人監(jiān)護、智能家居、AI玩具及可穿戴設備等多元化場景，為各行業(yè)提供強大的AI賦能，例如更自然的語音交互、更精準的圖像識別以及更加個性化的服務體驗。

此外，在成功實現(xiàn)DeepSeek模型端側運行的基礎上，移遠通信還完成了該模型的針對性微調，并應用于自身的大模型解決方案中，為客戶提供更精準、更高效的端側AI服務。這一成果不僅彰顯了移遠通信在端側AI領域的技術實力，更體現(xiàn)了其領先的工程化能力，將有力推動AIoT應用的快速發(fā)展與落地。

面向亟待接入AI能力的廣泛垂直領域，移遠通信將持續(xù)投入資源，推動更多高、中、入門級邊緣計算模組，以及智能座艙、5G、LTE模組和解決方案全面接入DeepSeek等先進模型以及云端大模型，助力物聯(lián)網(wǎng)設備實現(xiàn)智能化升級，開啟萬物智聯(lián)新時代。

消息來源：移遠通信