赖耶科技作为专注于人工智能领域的创新企业,基于NVIDIA AI Enterprise平台打造了超级AI工厂,致力于加速大模型场景应用的深化拓展及落地。赖耶超级AI工厂从架构上分为三层:基础架构层由万卡集群管理系统KAA和集群堆叠全栈优化方案MONA组成,基于NVIDIA AI Enterprise的BCME组件对万卡集群进行部署和管理;大模型生产框架层的MANAS框架依托NVIDIA NeMo Framework提供数据处理、模型训练、对齐微调和安全护栏等全套功能;智能体应用层的LIM微服务基于NVIDIA NIM核心能力,提供可快速部署的大模型微服务。
赖耶超级AI工厂提供企业大模型生产和场景应用两大核心功能,已在多家千P级算力中心完成落地应用。在一个实际案例中,赖耶助力气象大模型采用多模块混合架构,结合深度学习与图神经网络,在国际测试中预报精度超越传统数值模型,7-15天中期预报精度提高近20%,计算效率提升近万倍。在另一个算力中心部署案例中,赖耶超级AI工厂将集群模型算力利用率(MFU)提升了2倍,并实现了从算力运营到Token运营的转变。赖耶科技CEO Lucas Dai表示,通过与NVIDIA团队合作,赖耶将企业从模型开发到应用落地的周期从几个月缩短至几天或几周,大幅提高了业务响应速度,降低了运营成本。
