注:横轴为帮助性,纵轴为安全性。Falcon-40b-instruct在Hugging Face的开源大型语言模型排行榜上排名1,资料来源:《Llama 2: Open Foundation and Fine-Tuned Chat Models》(Hugo Touvron, Louis Martin, Kevin Stone, et al. 2023),中金公司研究部
大模型压缩技术亦逐渐成熟
为适配PC端侧运行需求,通过蒸馏及剪枝等方案将大模型压缩后的轻量化模型陆续发布。联想基于大模型压缩技术,将LLM压缩至轻量化模型进行本地部署,目前Lenvo AI Now助手的大模型来自阿里云的通义千问(原始参数量7B,大小14.4GB),大模型压缩到4GB,电脑配置5-6GB的内存即可运行。此外,宏碁与英特尔合作通过OpenVINO工具开发宏碁AI库;Meta Llama 2开源模型也可借助MLC Chat工具,实现在手机、PC上本地部署。
硬件侧:关注Arm架构、异构计算和存储升级,AIPC带动散热、电池及结构件等变化
微软或引领AIPC硬件定义,40TOPS算力,16G内存成为门槛
在讨论芯片端变化之前,值得关注的,端侧模型的运行对PC芯片的算力和存储性能等提出了挑战,但同时作为移动设备,功耗续航等问题又需要满足消费者在移动场景下的使用需求。根据Trendforce,微软计划在Windows12为AIPC设置最低门槛,需要至少40TOPS算力和16GB内存。单从当前PC芯片的算力看,跨越40TOPS门槛将成为首要目标。因此AIPC在芯片端硬件升级主要目标是:提升算力,提高内存,同时要降低功耗,基于这一目标,我们关注到了芯片侧的三大变化:架构变化、异构计算和内存升级。
此外,为了适配AIPC的计算及功耗需求,AIPC在散热、电池等环节亦或将带来升级变化。由于这里的变化目前还处于早期,整体方案设计并未完全确定,但从发展的思路上,主要会围绕降低功耗、增加续航、减少整体机身重量等方向去演进,因此在电池(硅碳负极)、结构件(碳纤维)、散热(热管等)方面或将出现新的变化。
图表8:PC芯片算力持续提升
资料来源:Counterpoint,中金公司研究部
Windows on Arm最大挑战是软件兼容性问题。理想情况下,Windows on Arm既能享受Arm架构处理器带来的低功耗和长续航优势,又能延续x86 PC用户的软件使用习惯。但是由于缺乏苹果的软硬件一体化生态环境,无法在硬件上实现高转译效率。2021年,微软发布Windows 11 on Arm,引入x86-64位仿真技术,极大地扩展了在Arm平台上运行的应用程序范围。2022年微软推出Arm64版本的IDE工具Visual Studio2022正式版,方便直接编译可在Windows 11中运行的Arm程序,进一步加速Windows生态向Arm迁移。
图表12:Windows on Arm发展历程