京东于6月3日推出并开源JoyAI-Echo长音视频生成框架。框架引入智能模块Director Agent,模拟导演助理角色,辅助视频生成过程。内置专门记忆库实现角色外观和说话人音色的持久化存储与调用。该机制在多镜头生成场景中保持角色一致性。JoyAI-Echo的代码与模型权重已全部开源,供开发者和研究者使用。框架开源旨在推动长音视频生成技术发展,降低行业应用门槛。