MediaTek
生成式 AI
引領生成式 AI 技術革命
生成式 AI 正在推動半導體領域的下一波創新。
領先的 AI 解決方案
作為開發高性能且高能效系統單晶片產品的行業領導者,MediaTek 已經將其強大的自研 AI 處理器的優勢引入到多樣化的產品生態系統中。
我們每年向連接設備出貨超過 20 億顆晶片,其中許多都內建 AI 處理器,使我們成為全球領先的 AI 供應商之一。憑藉我們廣泛的市場覆蓋,您可以在家中、教育、商業、移動設備和車輛中找到我們的 AI 技術。
完整的 MediaTek AI 生態系統
MediaTek 的 AI 生態系統包括硬體、開發工具和軟體開發套件 (SDK)。
軟體開發人員可以使用全面的工具和算法,而 MediaTek NeuroPilot 提供了一種「一次編寫,隨處部署」的策略,簡化了在 MediaTek 全產品線上的應用程式開發。
MediaTek AI 處理單元
MediaTek 的 NPU,或專門處理 AI 任務的處理器,與我們的系統單晶片中的 CPU 和 GPU 一樣重要。
MediaTek NPU 提供了非常高效的架構,用於在邊緣設備中實現 AI 加速,例如智慧型手機、平板電腦、AI+IoT、智慧電視、網絡 SoC 等等。
以五種常見的神經網絡作為基準,平均功率/性能曲線顯示,MediaTek 的深度學習加速器(DLA)相比典型的 CPU 提供了高達 27 倍的功率效率,與典型的 GPU 相比則提供了高達 15 倍的功率效率。
MediaTek NPU 技術
MediaTek 的 NPU 是一款高度可擴展的多核心處理器,可以根據應用需求包含不同數量的 MDLA 和 MVPU 核心。
在 2023 年,MediaTek 推出了第七代 NPU,專門設計用於加速基於變壓器模型的生成式 AI。其高度靈活的設計可以根據應用需求調整性能,包括計算單元、功耗、記憶體帶寬和記憶體容量,無論是在智慧型手機 SoC 還是數據中心級的超級芯片中。
- 基於硬體的多核心排程器
- 專用 DMA 引擎,執行深層融合和數據壓縮,以減少對 DRAM 帶寬的需求
- 功率智能和共享記憶體感知
- MediaTek 設計的片上網絡(NoC)以實現低延遲的核心間通信
- 高性能、可編程且多功能,擁有能效高的 MAC 架構,能在各種神經網絡應用中進行數據重用。
- 設計用於處理不同類型的網絡,包括:
- (a) 卷積神經網絡
- (b) 循環神經網絡
- (c) 長短期記憶模型
- (d) 行動雙向編碼器表示變壓器 (BERT)
- 支持 INT4/INT8/INT16、FP16、BF16 及混合精度,以進一步降低功耗。
- 與 ISP 和 DPU(顯示)的子系統方向通信可減少延遲和功耗。
- 通用 DSP,針對計算機視覺 (CV) 和神經網絡 (NN) 應用進行優化。
- 為視覺處理應用(如攝影、錄影和視頻串流播放)提供最佳的功率和性能平衡。
MediaTek NeuroPilot SDK
MediaTek NeuroPilot 是一套軟體工具和 API,旨在幫助客戶和開發人員優化其基於 AI 的應用程式,以便在 MediaTek SoC 上使用。
這些工具有本地版和雲端版,包括可以進一步加速開發的預訓練深度學習模型。NeuroPilot 支援多種主流 AI 框架,包括 TensorFlow、Caffe、ONNX 和變壓器,並且與 Linux 和 Android 作業系統兼容。在後矽階段,開發人員可以在其平台上部署訓練好的 AI 模型,以直接測量性能。
效率至上
NeuroPilot 還提供平台感知優化。使用 NeuroPilot 的應用程式將能了解其運行的 SoC 硬體,並將 AI 任務分配到最適合的處理單元,不論是 CPU、GPU、APU 還是 DSP。
此外,必要時,NeuroPilot 甚至會採用異質計算,結合多個處理單元的優勢以提供最佳結果——例如,在 3D 圖形渲染 AI-VRS、AI-HDR 或超解析度升頻中,同時使用 GPU 和 APU。
MediaTek 研究
聯發科技研究院致力於發展和提升日常設備中的人工智慧生態系統。
這包括具有極高解析度的感測器、專門用於散景捕捉等流行功能的感測器、用於增強光靈敏度的單聲道感測器或用於獨特應用的專業感測器。隨附的鏡頭可以適應多種拍攝風格,包括變焦、廣角、微距或日常攝影。
Mar 8, 2023
Extending the Pre-Training of BLOOM for Improved Support of Traditional Chinese: Models, Methods and Results
In this paper we present the multilingual language model BLOOM-zh that features enhanced support for Traditional Chinese. BLOOM-zh has its origins in the open-source BLOOM models presented by BigScience in 2022.
Feb 02, 2023
Fisher-Legendre (FishLeg) optimization of deep neural networks
We introduce a new approach to estimate the natural gradient via Legendre-Fenchel duality, provide a convergence proof, and show competitive performance on a number of benchmarks.
Dec 19, 2022
A Learning-Based Algorithm for Early Floorplan With Flexible Blocks
This paper presents a learning-based algorithm using graph neural network (GNN) and deconvolution network to predict the placement of the locations and the aspect ratios for the design blocks with flexible rectangles.
Oct 31, 2022
Near-Optimal Collaborative Learning in Bandits
A near-optimal algorithm is proposed for pure exploration in a new framework for collaborative bandit learning that encompasses recent prior works.
Nov 24, 2022
Gradient Descent: Robustness to Adversarial Corruption
We provide performance guarantees for gradient descent under a general adversarial framework
Improved Convergence Rates for Sparse Approximation Methods in Kernel-Based Learning
Kernel-based models such as kernel ridge regression and Gaussian processes are ubiquitous in machine learning applications for regression and optimization.
Feb 20, 2022
Regret Bounds for Noise-Free Kernel-Based Bandits
Kernel-based bandit is an extensively studied black-box optimization problem, in which the objective function is assumed to live in a known reproducing kernel Hilbert space.
LPI: Learned Positional Invariances for Transfer of Task Structure and Zero-shot Planning
Real-world tasks often include interactions with the environment where our actions can drastically change the available or desirable long-term outcomes.
Jun 1, 2022
Adaptive erasure of spurious sequences in sensory cortical circuits
Sequential activity reflecting previously experienced temporal sequences is considered a hallmark of learning across cortical areas.
Apr 13, 2022
Flexible Multiple-Objective Reinforcement Learning for Chip Placement
Recently, successful applications of reinforcement learning to chip placement have emerged. Pretrained models are necessary to improve efficiency and effectiveness.