一、腾讯混元模型发布 1.1 版本HunyuanDiT-v1.1 是一个先进的多分辨率扩散变换器模型,擅长处理中英文文本,实现精细的语言理解与图像生成。该模型采用预训练的 VAE 压缩图像,结合 CLIP 和 T5 编码器处理文本,支持多轮对话式图像创作。在 Hugging Face 平台上开源,提供了包括 TensorRT 和知识蒸馏在内的多种加速方案,以及在 ComfyUI 和 Diffusers 中的集成使用指南。详情:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT-v1.1二、人工智能已经在美国宇航局和神经外科领域得到证明,可以改变儿童教育前 NASA 人工智能研究员兼 Age of Learning 首席执行官 Alex Galvagni 表示,人工智能技术的进步使得教育领域能够提供个性化、适应性强的学习体验。AI 在 1950 年代就已经开始研究,后来在太空航天和医学领域取得了突破,如协助模拟航天器对接程序和大脑手术。Galvagni 认为,AI 技术的最新应用将极大地提升教育质量,为每个孩子量身定制课程内容,并提供具体有效的反馈。Age of Learning 的产品旨在协助教师,而非替代他们,通过数据分析帮助教师更好地满足每个学生的个性化需求。详情:https://www.foxnews.com/lifestyle/artificial-intelligence-proven-nasa-neurosurgery-remake-childhood-education三、AI 大模型价格战:40 天颠覆市场格局在 AI 领域,大模型厂商们展开了一场前所未有的价格战,40 天内,DeepSeek、智谱、字节跳动等大厂纷纷宣布模型价格大幅降低,甚至有免费提供。这场战役旨在推动 API 调用量增长,促进云服务销售,同时也反映了技术成熟和市场格局的清晰。然而,价格战也引发了一些大模型创企的资金链断裂,业界竞争加剧,创企需寻找新的商业模式以适应市场变化。详情:https://mp.weixin.qq.com/s?__biz=MjM5MjEyODE4MA==&mid=2653314125&idx=2&sn=376128427d49cfc468516ea6da6349fb[1]四、让 AI 像人类一样通过试错法学习决策和推理复旦大学人工智能实验室和上海人工智能实验室的研究人员开发了一种名为MCT Self-Refine (MCTSr)的算法,将大语言模型与蒙特卡洛树(MCTS)搜索结合起来,以增强模型在数学推理任务上的性能,尤其是奥林匹克级别的数学问题。 MCTS在AlphaGo中的应用展示了其强大性能 这种算法让智能体可以像人类一样通过试错法学习决策和推理。 人类在学习新技能或解决复杂问题时,通常会使用试错法。例如,学习骑自行车时,人们会反复尝试保持平衡,摔倒后总结经验,直到能够熟练骑车。同样,智能体通过试错法逐渐改进其决策和推理能力。 通过反复尝试不同的方法和策略,智能体能够不断改进其性能,最终达到解决复杂问题的目标。 具体来说,在论文中提到的MCTS算法中,智能体通过不断探索不同的解答路径、模拟结果、反向传播反馈信息,逐步优化其决策和推理能力,从而在复杂数学问题上取得更好的表现。五、复旦发布了一个开源版本的 EMO通过输入音频让面部照片开始说话,并且有对于的表情。看起来效果很自然。 采用端到端的扩散范式,引入了分层的音频驱动视觉合成模块,以提高音频输入与视觉输出之间的