大吉研报

计算机设备行业:国产大模型进展快速Deepseek~V2和通义千问2.5均展现强大性能-240513(15页)

行业研究
科技传媒
2024-08-2715

新用户首篇研报专享优惠价

VIP会员可免费获取全部研报,开通VIP

报告摘要

本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。证券研究报告证券研究报告行业动态行业动态国产大模型进展快速,国产大模型进展快速,DeepseekDeepseek-V2V2和通义千和通义千问问2.52.5均展现强大性能均展现强大性能核心观点核心观点1.幻方子公司DeepSeek发布了新的MoE(混合专家网络)大模型DeepSeek-V2,模型表现优秀,相比V1的稠密模型,Deepseek-V2节约了42.5%的训练成本,减少了推理时93.3%的KV-cache显存占用,将生成的吞吐量也提升到了原来的5.76倍。同时API调用定价低至每百万输入Tokens仅1元,具有极高的性价比。2.阿里云正式发布通义千问2.5大模型,模型在中文语境下的性能超越了GPT-4Turbo。相比上一代通义千问2.1版本,通义千问2.5在理解能力、逻辑推理、指令遵循、代码能力上全方位提升。

DJ
大吉研报
专业研究报告平台
·科技传媒

计算机设备行业:国产大模型进展快速Deepseek~V2和通义千问2.5均展现强大性能-240513(15页)

行业研究152024-08-27
www.djyanbao.cc

购买后查看完整研报

浏览 3下载 0