DeepSeek在元旦发布新论文提出mHC架构。mHC全称为流形约束超连接旨在解决传统超连接的不稳定性问题。该技术可保持大规模模型训练的性能增益。论文作者包括解振达、韦毅轩、曹焕琪等研究人员。DeepSeek创始人梁文锋也出现在作者名单中。