你的位置:开云「中国」kaiyun网页版登录入口 > 新闻 > 开yun体育网海潮信息对 AI 筹办架构的握续改造-开云「中国」kaiyun网页版登录入口

开yun体育网海潮信息对 AI 筹办架构的握续改造-开云「中国」kaiyun网页版登录入口

时间:2025-11-01 10:46 点击:98 次

开yun体育网海潮信息对 AI 筹办架构的握续改造-开云「中国」kaiyun网页版登录入口

9 月 26 日,在 2025 东说念主工智能筹办大会上,海潮信息公布,基于元脑 SD200 超节点 AI 就业器,DeepSeek R1 大模子 token 生成速率仅需 8.9 毫秒,创造国内大模子最快 token 生成速率;而最新发布的元脑 HC1000 超膨胀 AI 就业器,扫尾每百万 token 本钱初次击破 1 元。海潮信息对 AI 筹办架构的握续改造,旨在搞定智能体产业化濒临的交互速率和 token 本钱两大瓶颈,为多智能体协同与复杂任务推理的领域化落地开yun体育网,提供高速率、低本钱的算力基础模式。

跟着 Scaling Law 握续激动模子智商跃升,以 DeepSeek 为代表的开源模子极大的裁减了改造门槛,加快智能体产业化的到来。智能体产业化的中枢三身分是智商、速率和本钱。其中模子智商决定了智能体的应用上限,交互速率决定了智能体的买卖价值,token 本钱决定了智能体的盈利智商。

仅需 8.9 毫秒!元脑 SD200 引颈 token 生成速率开头参加“10 毫秒时期”

海潮信息最新公布,基于元脑 SD200 超节点 AI 就业器运转 DeepSeek R1 大模子,单 token 生成速率低至 8.9 毫秒,带动国内 AI 就业器 token 生成速率开头参加“10 毫秒时期”。

元脑 SD200 基于改造研发的多主机低蔓延内存语义通讯架构,在单机内扫尾了 64 路原土 AI 芯片的高速和解互连,单机可承载 4 万亿参数单体模子,或部署多个万亿参数模子构成的智能体应用,扫尾多模子协同扩充复杂任务。为扫尾极低的通讯蔓延,元脑 SD200 采纳精简高效的三层合同栈,原生扶持多种内存语义操作,幸免冗尾数据拷贝,将基础通讯蔓延降至百纳秒级,硬件化链路层重传与散播式良好式流控进一步适配高蒙眬、低蔓延的 AI 推理场景。

元脑 HC1000,推理本钱初次击破 1 元 / 每百万 token

海潮信息重磅发布元脑 HC1000 超膨胀 AI 就业器,基于全新拓荒的全对称 DirectCom 极速架构,无损超膨胀遐想团员海量原土 AI 芯片、扶持极大推理蒙眬量,推理本钱初次击破 1 元 / 每百万 token,为智能体冲突 token 本钱瓶颈提供极致性能的改造算力系统。

元脑 HC1000 通过全面优化降本和软硬协同增效,改造 16 卡筹办模组遐想、单卡“筹办-显存-互连”平衡遐想,大幅裁减单卡本钱和每卡系统分担本钱。同期,全对称的系统拓扑遐想扶持超大领域无损膨胀。据测算,元脑 HC1000 通过算网深度协同、全域无损时期,扫尾推感性能比拟传统 RoCE 升迁 1.75 倍,单卡模子算力运用率最高升迁 5.7 倍。

昔时,智能体带来的推理算力需求将呈现出指数级的爆发式增长。海潮信息将通过软硬件协同遐想与深度优化,握续激动 AI 筹办架构的改造与冲突开yun体育网,接续扫尾 token 生成“提速降本”,积极促进大模子、智能体等东说念主工智能时期与实体经济的深度交融,让东说念主工智能成为千行百业的坐褥力和改造力。

海量资讯、精确解读,尽在新浪财经APP

地址:新闻科技园4302号

网站:www.jxncbq.com

Powered by 开云「中国」kaiyun网页版登录入口 RSS地图 HTML地图


开云「中国」kaiyun网页版登录入口-开yun体育网海潮信息对 AI 筹办架构的握续改造-开云「中国」kaiyun网页版登录入口