大吉研报

科技行业AI专题·从模型视角看端侧AI:模型技术持续演进交互体验有望升级-240730(56页)

行业研究
科技传媒
2024-08-2856

新用户首篇研报专享优惠价

VIP会员可免费获取全部研报,开通VIP

报告摘要

模型模型技术持续演进,交互体验有望升级技术持续演进,交互体验有望升级西南证券研究发展中心海外研究团队2024年7月AI专题专题从从模型视角看端侧模型视角看端侧AI核心观点基础的构建:模型实现高效压缩是端侧AI的第一步。模型尺寸变小、同时具备较好性能,是端侧AI的前提。目前,在10B参数规模以下的模型中,7B尺寸占据主流,3B及以下小模型仍在探索,部分小模型性能正逐步接近更大参数模型,如谷歌Gemini-Nano模型在部分测试基准上接近Gemini-Pro、MetaLlama-3-8B模型表现可与Llama-2-70B匹敌。模型厂商为兼顾模型尺寸与性能,在算法优化上进行积极探索,在模型压缩技术、稀疏注意力机制、多头注意力变体等领域取得持续进展,帮助模型减少参数、降低存算需求,同时保持较好的性能,为端侧AI奠定小模型的基础。落地的关键:模型适配终端硬件是端侧AI的第二步。小语言模型(SLM)不完全等于端侧模型,在模型实现高效压缩后,需要进一步与手机硬件进行适配,帮助小模型装进终端。从众多小模型论文中可以发现,当前主要存在内存、功耗、算力三大硬件瓶颈。

科技行业AI专题·从模型视角看端侧AI:模型技术持续演进交互体验有望升级-240730(56页)

购买后查看完整研报

浏览 1下载 0