赖耶科技依托NVIDIA AI Enterprise构建的超级AI工厂,致力于为企业提供"开箱即用"的生成式AI解决方案。该超级AI工厂从架构上分为三层:基础架构层由万卡集群管理系统KAA和集群堆叠全栈优化方案MONA组成,基于NVIDIA AI Enterprise的BCME组件实现IO通讯优化、资源虚拟化、高性能多租户隔离等功能;大模型生产框架层的MANAS框架基于NVIDIA NeMo Framework提供从数据处理到模型训练的全套功能;智能体应用层的LIM微服务基于NVIDIA NIM核心能力,提供多模态知识库、模型微调定制、多模态智能对话等企业级定制化服务。
赖耶超级AI工厂提供企业大模型生产和场景应用两大核心功能。在大模型生产方面,它包括大规模GPU集群组网调优、模型稳定性训练和企业垂类大模型定制;在场景应用方面,它提供OpenAI兼容的大模型API微服务和加速推理镜像服务。目前,赖耶超级AI工厂已在多家千P级算力中心完成落地应用,在某算力中心部署案例中,集群模型算力利用率(MFU)提升了2倍,实现了从算力运营到Token运营的转变。赖耶科技CEO Lucas Dai表示,赖耶超级AI工厂专注于为企业提供开箱即用的解决方案,将企业从模型开发到应用落地的周期从几个月缩短至几天或几周,推动企业在复杂的业务环境中取得更高效的成果。未来,赖耶科技将继续与NVIDIA技术团队合作,为企业实现大模型Token赋能,加速大模型场景应用落地。
