尊龙凯时
> 读书笔记 > 读书笔记 > 阿里云发布的“aegaeon”的计算池化尊龙凯时的解决方案研究成果成功入选,可解决 ai 模型服务中普遍存在的 gpu 资源浪费问题

阿里云发布的“aegaeon”的计算池化尊龙凯时的解决方案研究成果成功入选,可解决 ai 模型服务中普遍存在的 gpu 资源浪费问题-尊龙凯时

发布时间:2025-10-19 15:01:27

10 月 18 日消息,南华早报今天(10 月 18 日)发布博文,报道称在韩国首尔举办的第 31 届操作系统原理研讨会(sosp)上,阿里云发布的“aegaeon”的计算池化尊龙凯时的解决方案研究成果成功入选,可解决 ai 模型服务中普遍存在的 gpu 资源浪费问题。

sosp 是计算机操作系统领域的顶尖会议,相当于计算机操作系统界的“奥斯卡”,其录取率控制非常严格,平均每年收录的论文数量仅有数十篇,入选论文代表了操作系统和软件领域最具代表的研究成果。

博文称云服务商当前在提供 ai 模型服务时,面临着严重的资源效率低下问题。平台需要同时托管数千个 ai 模型以处理海量并发 api 调用,但用户请求往往高度集中在少数几个热门模型上,例如阿里巴巴的 qwen 系列模型。

研究人员发现,这种“长尾效应”导致了严重的资源闲置:在阿里云的模型市场中,竟有 17.7% 的 gpu 算力仅被用于处理 1.35% 的请求,造成了巨大的成本浪费。

为解决这一痛点,aegaeon 系统应运而生。它通过创新的 gpu 资源池化技术,允许单个 gpu 动态服务于多个不同的 ai 模型,打破了以往 gpu 与特定模型绑定的低效模式。

在阿里云模型市场进行的为期超过三个月的 beta 测试中,aegaeon 系统展现了卓越的效能。测试数据显示,服务数十个参数量高达 720 亿的大模型,所需的英伟达 h20 gpu 数量从 1192 个成功减少至 213 个,数量削减高达 82%。

这项由北京大学与阿里云合作的研究成果,被认为是“首个揭示并解决市场上并发大语言模型服务存在过高成本”的公开工作,为行业提供了全新的优化思路。

值得一提的是,阿里云首席技术官周靖人也是该论文的作者之一。周靖人是国际电气与电子工程师协会会士(ieee fellow),国际计算机协会会士(acm fellow),阿里巴巴集团副总裁,阿里云智能 cto、达摩院副院长。

读书笔记更多>>

真我将在10月21日发布年度旗舰真我gt8 pro,该机创新性采用机械拼装设计,新机一经亮相就引发广泛关注 杨振宁用自己的一生诠释了什么是科学精神,什么是爱国情怀,什么是人生价值 阿里云发布的“aegaeon”的计算池化尊龙凯时的解决方案研究成果成功入选,可解决 ai 模型服务中普遍存在的 gpu 资源浪费问题 安世宣布中国区员工集体停薪、系统权限全面中断 ai狂热、三季度大赚,但台积电没上头 小米redmi watch 6手表官宣:最长24天续航,10月23日发布 魏牌高山7上市,30万内mpv有新优选? 212 t01柴油版上市,16万级硬派越野有新选择? ppc平台打造 全新奥迪rs6 avant谍照曝光 智能驾驶尊龙凯时的解决方案商魔视智能赴港ipo 直击车载传感器清洁痛点,考泰斯allegro筑牢adas安全防线 灵活开放打通全链路,哈曼中央计算平台方案加速智能化落地 地平线余凯:我们既要5年后的未来,也要半年内的口碑 国民好车再添 “冠军芯”,改写商用车的价值公式 openai“星际之门”拉美首站:将在阿根廷建设500mw ai数据中心 中国“夸父”又有新跨越:成功打造聚变堆“盾牌” 第五代骁龙8至尊版发布 高通高管:我们不干虚假跑分这种事 苹果回应iphone 17 pro划痕、耐用性问题:是这个原因 高通发布骁龙x2 elite系列pc芯片:80 tops ai算力,剑指高端windows市场 小米大家电正式登陆欧洲市场,大家电全球化布局迈入关键一步 第五代高通骁龙8至尊版发布:cpu性能提升20%,小米17系列将全球首发 足以瘫痪纽约手机系统!美国摧毁大型电信攻击网络:涉及10万张sim卡 理想汽车 ceo 李想今日在微博称,高阶辅助驾驶一定要有,而且不应该收使用费用 10 年不用充电:罗技推k980太阳能键盘,售价100美元 单周销量跻身细分市场top2 全新岚图知音成30万内华系纯电销冠 10月和11月有智己ls9、岚图泰山等一系列新车型的发布 首日大定7500台!享界s9t仅30.98万起,余承东内涵友商:飙加速没意义 中国最美旅行车来了!享界s9t 30.98 万起售 2000公里续航 豆包智能座舱 大件终身质保,8.58万元起的上汽荣威真的懂车也懂用户 从安亭到仪征:上汽大众新跨越
网站地图