简体中文

    生成式人工智慧正在推動半導體領域的下一波創新浪潮。

    Leading Edge AI

    領先的人工智慧解決方案

    作為開發高效能、高能效片上系統產品的產業領導者,聯發科已經將我們強大的、內部設計的人工智慧處理器的優勢帶入我們多樣化的產品生態系統中。

    現在,我們每年在互聯設備中出貨超過 20 億顆晶片,其中許多都包含我們的 AI 處理器,這使我們成為世界領先的 AI 供應商之一。憑藉我們廣泛的市場覆蓋範圍,您將在家庭設備、教育、企業、行動裝置和車輛中發現我們的人工智慧技術。

    联发科混合 AI - 边缘与云端

    联发科具备独特优势,能够推动并支持生成式 AI 应用和技术的采用,无论是部署在云端、设备的边缘,还是结合云端与边缘的混合方式,均能充分利用两者的优势。

    Hybrid AI

    全面的联发科 AI 生态系统

    联发科 AI 生态系统包括硬件、开发工具和软件开发工具包 (SDK)。

    软件开发人员可以使用全面的工具和算法,联发科 NeuroPilot 提供“一次编写、随处部署”的策略,简化了在联发科全系列产品上的应用开发。

    Ai-Ecoystem

    联发科 AI 处理单元

    联发科 NPU(专用于 AI 任务的处理器)在我们的系统级芯片中与 CPU 和 GPU 同样重要。

    联发科 NPU 提供了一个非常高效的架构,用于在边缘设备(如智能手机、平板电脑、AI+物联网、智能电视、网络 SoC 等)中实现 AI 加速。

    使用五种常见神经网络作为基准,平均功耗/性能曲线显示,联发科的深度学习加速器(DLA)相比于典型 CPU 提供了 27 倍的功耗效率,相比于典型 GPU 提供了 15 倍的功耗效率。

    CPU-chips-new

    联发科 NPU 技术

    联发科 NPU 是一个高度可扩展的多核处理器,根据应用需求,可能包含不同数量的 MDLA 和 MVPU 核心。

    2023 年,联发科推出了第七代 NPU,专门设计用于加速基于变压器模型的生成式 AI。其高度灵活的设计可以根据应用需求调整计算单元、功耗、内存带宽和内存容量,无论是在智能手机 SoC 还是数据中心级超级芯片中。

    • 硬件基础的多核调度器。
    • 专用 DMA 引擎执行深层融合和数据压缩,以减少对 DRAM 带宽的需求。
    • 功耗智能和共享内存感知。
    • 联发科设计了网络芯片(NoC),以实现低延迟的核心间通信。
    APU_Tech
    • 高性能、可编程且多功能,具有节能的 MAC 架构,可在广泛的神经网络应用中执行数据重用。
    • 设计用于处理不同类型的网络,包括:
      • (a) 卷积神经网络(CNN)
      • (b) 循环神经网络(RNN)
      • (c) 长短期记忆模型(LSTM)
      • (d) 移动双向编码器表示(BERT)
    • 支持 INT4/INT8/INT16、FP16、BF16 和混合精度,以进一步降低功耗。
    • 与 ISP 和 DPU(显示)之间的子系统间方向通信最小化延迟和功耗。
    MDLA-Desktop-updated
    • 通用DSP,针对计算机视觉(CV)和神经网络(NN)应用进行优化。
    • 在摄影、摄像和视频流播放等视觉处理应用中提供最佳的功耗与性能平衡。
    MVPU-Desktop

    MediaTek NeuroPilot SDK

    MediaTek NeuroPilot 是一套软件工具和API,旨在帮助客户和开发者优化基于AI的应用程序,以便在MediaTek SoC上使用。

    这些工具包括本地版本和云端版本,提供了预训练的深度学习模型,以加速开发进程。NeuroPilot 支持多种主流AI框架,包括 TensorFlow、Caffe、ONNX 和 transformers,并且兼容 Linux 和 Android 操作系统。在后硅阶段,开发者可以将训练好的AI模型部署到平台上,直接测量性能。

    效率为核心

    NeuroPilot 还提供平台感知优化。通过 NeuroPilot,应用程序可以识别其运行的 SoC 硬件,将 AI 任务发送到最适合的处理单元,无论是 CPU、GPU、APU 还是 DSP。

    此外,在必要时,NeuroPilot 甚至会采用异构计算,结合多个处理单元的优势,以提供最佳结果 — 例如,在 3D 图形渲染 AI-VRS、AI-HDR 或超级分辨率放大中同时使用 GPU 和 APU。

    MediaTek 研究

    聯發科技研究院致力於發展和提升日常設備中的人工智慧生態系統。

    這包括具有極高解析度的感測器、專門用於散景捕捉等流行功能的感測器、用於增強光靈敏度的單聲道感測器或用於獨特應用的專業感測器。隨附的鏡頭可以適應多種拍攝風格,包括變焦、廣角、微距或日常攝影。

    Mar 8, 2023

    Extending the Pre-Training of BLOOM for Improved Support of Traditional Chinese: Models, Methods and Results

    In this paper we present the multilingual language model BLOOM-zh that features enhanced support for Traditional Chinese. BLOOM-zh has its origins in the open-source BLOOM models presented by BigScience in 2022.

    New

    Feb 02, 2023

    Fisher-Legendre (FishLeg) optimization of deep neural networks

    We introduce a new approach to estimate the natural gradient via Legendre-Fenchel duality, provide a convergence proof, and show competitive performance on a number of benchmarks.

    New

    Dec 19, 2022

    A Learning-Based Algorithm for Early Floorplan With Flexible Blocks

    This paper presents a learning-based algorithm using graph neural network (GNN) and deconvolution network to predict the placement of the locations and the aspect ratios for the design blocks with flexible rectangles.

    Oct 31, 2022

    Near-Optimal Collaborative Learning in Bandits

    A near-optimal algorithm is proposed for pure exploration in a new framework for collaborative bandit learning that encompasses recent prior works.

    Nov 24, 2022

    Gradient Descent: Robustness to Adversarial Corruption

    We provide performance guarantees for gradient descent under a general adversarial framework

    Improved Convergence Rates for Sparse Approximation Methods in Kernel-Based Learning

    Kernel-based models such as kernel ridge regression and Gaussian processes are ubiquitous in machine learning applications for regression and optimization.

    Feb 20, 2022

    Regret Bounds for Noise-Free Kernel-Based Bandits

    Kernel-based bandit is an extensively studied black-box optimization problem, in which the objective function is assumed to live in a known reproducing kernel Hilbert space.

    LPI: Learned Positional Invariances for Transfer of Task Structure and Zero-shot Planning

    Real-world tasks often include interactions with the environment where our actions can drastically change the available or desirable long-term outcomes.

    Jun 1, 2022

    Adaptive erasure of spurious sequences in sensory cortical circuits

    Sequential activity reflecting previously experienced temporal sequences is considered a hallmark of learning across cortical areas.

    Apr 13, 2022

    Flexible Multiple-Objective Reinforcement Learning for Chip Placement

    Recently, successful applications of reinforcement learning to chip placement have emerged. Pretrained models are necessary to improve efficiency and effectiveness.