智算时代的基础设施如何实现可继承可演进?浪潮云海发布 InCloud OS V8 新一代架构平台

从 2023 年开始持续火爆的 AIGC 正在加速落地应用,为全行业带来生产生活效率的变革与升级。面对数字化转型与智能化转型,对于技术团队来说,既要根据业务与 AI 应用去部署以云为基础的 AI 算力,又要与已有数据和系统(甚至是遗留的虚拟机环境)协同去发挥和实现 AI 价值,这其中的异构算力、复杂的工程化工作,可能反而会造成新的烟囱式系统,以及 AI 算力资源的浪费。此外,运维团队面临“新旧相融”的难题,即新旧应用无法平滑衔接、统一管理,新旧IT资产无法无缝相容、统一调度。

更加灵活的智算时代,云基础设施需要可继承、可演进

当前很多企业的云平台采用IaaS、PaaS和SaaS紧耦合的架构,各模块之间难以解耦,设备微调就必须从上至下重新适配,牵一发而动全身,无法快速响应新技术的演进升级。

针对时下 AI 大模型爆发,对基础设施算力性能、灵活性以及成本的需求,浪潮云海提出了“可继承、可演进”的私有云理念。其中可继承即私有云建设要能够继承过去的IT资产和运维能力,包括客户数据中心的硬件、软件等大量基础设施,长年累月的信息化和数字化投资等资产,还包括知识经验、人员组织和流程体系等IT运维能力。

而可演进即面向日趋增强的技术不确定性,私有云要具备持续进化的能力,以满足日益增长的创新应用需求。架构可演进,指云平台整体框架具备升级、演进的能力。从提供基础的虚拟机、存储、网络服务到全栈服务(数据库、中间件、大数据、AI 等);从最小 3 节点小规模平滑扩容到大规模;从单中心扩大到多中心统一管理(多分支统一管理、云边协同);从单一 CPU 架构扩展到多 CPU 架构,从通用算力扩展到 AI 算力等。能力可演进,指人和组织能力的演进。业务应用层面,从传统架构到微服务、云原生架构演进;运维能力从传统的人肉运维,到半自动、全自动 AIops 运维;业务可靠性从单点单中心可靠,到多中心高可靠。

具体从存储、计算、服务、应用四层来说,具备可演进能力的私有云需要具备三大特征:分层解耦、开放标准和一云多芯,可以实现在异构算力需求下各层可形成共识标准,并独立演进迭代。具体来说:

一、在存储层,实现多协议融合,广泛兼容 ISCSI、iSER、NVME over RoCE、FC、FC-NVMe 等主流存储协议,实现各主流品牌存储的兼容利旧;业务创新,支持同品牌或不同品牌、集中式存储或分布式存储间的跨站点容灾。

二、在计算层的一云多芯,充分考虑底层算力设施框架的灵活性,同时支持多类型计算资源,不同的应用匹配不同的计算资源。另外跨算力共享的存储池和网络池,减少网络转发路径,降低建设成本与维护成本。

三、在服务层,浪潮数据云计算方案总监刘健表示,在实际数据中心部署中,行业云中 IaaS 层已分层解耦,但 PaaS 层仍有被云厂商或应用提供商锁定的情况。浪潮云海提出服务层分层共建,其中 PaaS 层通用能力下沉,以容器技术为核心构建敏捷的云原生 iPaaS 底座,满足服务标准化、多样性需求。另外联合共建个性化的能力,个性化能力可以上移,强行业属性的应用交给专业公司共建,实现一云多库、一云多服。

四、在应用层则是开放生态的技术框架和理念,从规划、到方案、集成、交付、售后,全面联合各类生态伙伴,实现行业数字化转型。

浪潮云海 InCloud OS V8 新一代架构平台,实现 IT 资源可继承、可演进

基于可继承可演进的核心理念,浪潮云海发布了新一代架构平台——InCloud OS V8,其产品能力与四层可参考架构一一对应,支撑可演进需求:

  • 存储层:文件系统,存储多协议,支持 NVMe-OF,支持 ISCSI,支持私有协议、容灾、备份、安全等,屏蔽底层存储;
  • 计算层:一云多芯管理、等价算力调度、AI 智算能力、算力标准化、资源可扩展性;
  • 服务层:1、对底层资源的便捷供给,2、工具化能力,在云平台上基于标准模板发布 PaaS 服务,快速嵌入云平台,3、上层管理平台,对日志、监控、运维、用户统一管理;
  • 应用层:则是以第三方伙伴服务为主。

浪潮云海根据服务客户的实践经验,总结形成了分布式云、容灾备份、安全云、云替换、智算中心、云原生六大场景解决方案,基本满足了各类应用场景对底层基础设施的需求。具体来看,

  1. 分布式云解决方案:面向多分支机构场景,满足多级云(省市多级云、集团分支多级云)、异构云、多厂商云、云边(中心云、边缘云)统一管理需求。
  2. 容灾备份解决方案:面向两地三中心场景,满足客户业务对高可靠的要求,可提供本地备份、同城双活、异地灾备等服务。
  3. 安全云解决方案:面向安全合规场景,提供满足各类安全测评标准的服务套餐。
  4. 云替换解决方案:为 VMware 替换、公有云下云等场景提供跨云迁移方案。
  5. 智算中心解决方案:面向智算中心场景,提供 GPU 整机租赁、AI 开发、AI 训练、大数据等服务,支撑智算中心算力运营。打造从基础设施、算法工具、智能平台到模型服务的 AI 赋能产业生态
  6. 云原生解决方案:面向以容器技术为支撑的云原生创新应用场景提供开发测试、微服务治理、DevOps 解决方案,方便业务云原生转型,是推动企业数字化转型的最佳工具。

从大模型落地带来实效,到多元算力需求下智算基础设施的发展,智算时代正在真实到来。灵活、高效的算力资源,将是一切智能化发展的基础,CSDN 将持续关注智算技术领域的最新资讯。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-13 05:34:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-13 05:34:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-13 05:34:01       82 阅读
  4. Python语言-面向对象

    2024-04-13 05:34:01       91 阅读

热门阅读

  1. CentOS版本不同大小的各个版本区别

    2024-04-13 05:34:01       39 阅读
  2. Igh related:Small Bug And Notes Record.

    2024-04-13 05:34:01       44 阅读
  3. OpenCV C++ 学习笔记(一)

    2024-04-13 05:34:01       40 阅读
  4. C 共用体

    2024-04-13 05:34:01       35 阅读
  5. 常见的分类算法及其应用场景

    2024-04-13 05:34:01       29 阅读
  6. 数据仓库—ETL工具与技术:数据仓库的坚实基石

    2024-04-13 05:34:01       36 阅读
  7. 8266 Ubuntu下 arduino开发

    2024-04-13 05:34:01       35 阅读
  8. Promise学习笔记

    2024-04-13 05:34:01       37 阅读
  9. 数据仓库—ETL技术全景解读:概念、流程与实践

    2024-04-13 05:34:01       35 阅读