国泰君安:2024基于大模型驱动的云网全景可观测系统建设实践报告
新用户首篇研报专享优惠价
VIP会员可免费获取全部研报,开通VIP
报告摘要
基于大模型驱动的云网全景可观测系统建设实践高坤国泰君安证券股份有限公司IOE技术体系(集中式架构)集中式平台快速软、硬故障定界定位(一般问题闭环30min)(java/C)业务系统平滑迁移、应用多活、高性能、超大规模KXCP/KCBP/REDIS/Ngnix强一致性(交易批量计算)SQLserver/Oracle分钟级备切换,最低99.99%可靠性OS、x86硬件平台云化技术体系(云原生、分布式架构)云化、分布式架构中间件(消息、事务、缓存、调用链等)IaaS云底座证券新核心业务微服务框架云原生容器融合分析大数据平台分布式交易数据库DC1DC2DCn3类云化,6大技术点云原生技术体系IaaS云底座分布式交易数据库云原生容器基础设施融合分析大数据平台微服务框架中间件(消息、事务、缓存、调用链等)业务应用重构业务系统云原生化传统数据库分布化基础设施全面云化业务系统中间件分布式云原生架构基础设施全面云化传统数据库分布化业务系统云原生化承载各类业务系统生产、同城及异地灾备环境基于CloudStack上线开发测试云,实现计算和分布式存储统一管控金融云发展时间轴完成国家云平台课题验收,发布CMP1.0,实现IAAS资源自服务基于Openstack上线开发测试云2.0,发布CMP2.0,实现对异构资源的统一纳管上线生产云、开发测试容器云平台上线开发测试信创云,并发布基础资源服务平台1.0上线生产信创云,托管云,发布基础资源服务平台2.0,实现一云多芯管理建设开发测试云、生产云、集团协作云、开放生态云四朵云努力打造全行业领先的自主开发、自主掌控的国泰君安金融全栈云云总体布局2013年2014年2015年2017年2019年2020年规划路线加速云原生建设,完成“一云多芯”信创、非信创多元算力,资源统一管理,实现云边协同,资源敏捷交付2023年加速云原生基础设施建设夯实数字基础设施升级,扩大云资源规模,推进高效敏捷开发向以应用为中心的架构演进,实现应用敏捷开发,提升应用迭代速度2024年云原生应用敏捷开发实现两地多中心全栈云原生服务能力全覆盖,完成存量系统整体迁移到全栈云。2025年全栈能力全覆盖承载各类业务系统开发测试环境承载资产管理、期货、创投等各子公司的业务系统承载量化私募、PB等外部客户的业务系统生产云开发测试云集团协作云开放生态云聚焦云原生底座资源部署,加速云原生体系与平台建设,完善和提升云原生服务能力,以科技服务云平台为载体,面向集团提供全面、易用、自主可控的云原生服务,提升资源交付质效,高效支撑业务敏捷创新。云平台通过标准的接入规范和部署规划,最大程度的减少其他云应用开发周期和难度,能够实现快速SaaS应用的上线交付。依托于此,国泰君安云计算团队,自研开发了云监控系统、云网流量分析、弹性文件系统、对象文件系统、文档中心、镜像站等云应用,为用户提供了更加便捷的云资源交付与服务。结合公司基础架构特点,为每个云服务设立独立的业务资源模型,通过该抽象模型,能够实现多区域、异构资源池的统一纳管,从而满足鲲鹏、飞腾、海光等国产信创芯片的云资源,实现了“一云多芯”的统一管理。正是借助此架构的优越性,使用户在无感知的情况下自助申请、创建云资源。作为云平台核心的组件,该应用集权限管理、配额管理、计费和事务管理于一体,通过权限校验与配额分配,确保云资源的合理分配,实现了整个云平台内部统一、协调运转。智慧中台一云多芯、多云部署自研云应用,提升云服务质量随着越来越多的核心业务系统迁移上云,云上业务的稳定直接影响着用户体验与服务质量,从应用服务可视化、应用调用追踪、故障诊断、业务保障、安全、审计、运营分析、调度等维度,针对云资源池业务分析及消费的需求越发突出。缺少云资源池上的应用服务可视化能力核心设备南北向的流量镜像采集点无法覆盖资源池内流量采集,缺乏资源池内应用服务流量数据包的全量采集手段,使得业务运行处在黑盒状态,缺少资源池内的应用服务可视化能力0101现有监控手段不能满足复杂环境中的业务运维排障要求0202缺乏零侵扰的全链路分布式追踪针对关键业务嵌入SDK或者插码打桩的方式,对业务开发语言、框架有着严格的要求,需要消耗大量时间维护嵌入式SDK代码,对于边缘组件疲于应对,使得精准的业务保障成为难题。0303缺乏历史故障问题回溯分析能力关键业务系统访问出现某一时刻或单次请求故障时,因无法记录单次请求或瞬时的网络及应用请求状态及性能指标,所以不能对故障问题提供责任举证,使得业务网络依旧带病运行,存在隐患0404资源池内业务动态性高,覆盖范围广,业务覆盖的资源范围可能实时动态伸缩,目前监控手段无法动态获知复杂的业务访问调用关系,无法自动呈现业务的端到端全链路流量拓扑图解决云网络的“黑盒在一云多芯环境建立云网络内的流量全景视图和运维、运营、安全管理机制,具备网
国泰君安:2024基于大模型驱动的云网全景可观测系统建设实践报告
购买后查看完整研报