微软最近在 Build 大会上公布最新的小型语言模型 Phi Silica,这款模型专为微软最新公布的 Copilot+ PC 中的神经处理单元(NPU)而设计,并会搭载于 Copilot+ PC 上。

Phi Silica 是 Phi 系列中最小的模型,拥有 33 亿个参数,每秒能够处理 650 个 token,功耗只为 1.5 瓦。 Phi Silica 的处理能力可让 CPU 与 GPU 有更多资源处理其他工作。 Phi Silica 的 token 生成精妙地重用 NPU 的 KV 快取,并在 CPU 上运行,每秒生成约 27 个 token。 预料每部 Copilot+PC 将会搭载 Phi Silica。
开发者可以通过 Windows App SDK 使用 Phi Silica API,还包括其他 AI 驱动功能,如 OCR、Studio Effects、Live Captions 和 Recall User Activity API。 微软计划在未来发布更多API,包括Vector Embedding、RAG API及Text Summarization。