支持 Kubernetes 原生负载及主流计算框架(如 TensorFlow、Spark、PyTorch、Ray、Flink等)的一体化作业调度。
提供多层级队列管理能力,实现精细化资源配额控制和任务优先级调度。
高效调度GPU、NPU等异构设备,充分释放硬件算力潜力。
支持网络拓扑感知调度,显著降低跨节点间的应用通信开销,在AI分布式训练场景中大幅提升模型训练效率。
支持跨集群作业调度,提升资源池管理能力,实现大规模负载均衡。
实现在线与离线任务混合部署,提升集群资源利用率。
支持负载感知重调度,优化集群负载分布,提升系统稳定性。
支持 Gang、Fair-Share、Binpack、DeviceShare、Capacity、Proportion、NUMA aware、Task Topology等多种调度策略,优化资源利用效率。