全球AI动态精选(2026年1月29日)
今日AI行业呈现多点开花态势,多款大型模型更新迭代,开源生态持续繁荣,音乐与视觉生成领域取得突破性进展。从MiniMax Music 2.5的格莱美级创作能力,到蚂蚁灵波开源世界模型LingBot-World,再到腾讯混元图像3.0的全面开源,AI技术正加速向专业化、垂直化方向发展。同时,Kimi K2.5、阿里Qwen3-Max-Thinking等模型的发布,展现了国内企业在AI基础模型领域的强劲竞争力,预示着全球AI技术竞赛进入新阶段。
MiniMax发布Music 2.5模型,实现格莱美级音乐创作
MiniMax于今日正式发布Music 2.5模型,该模型能够生成达到格莱美级别的音乐作品,无需专业录音棚设备即可完成高质量音乐创作。Music 2.5在音质、编曲复杂度和情感表达方面均有显著提升,支持多种音乐风格和乐器组合,可满足从个人创作到商业制作的全场景需求。
此次发布标志着AI音乐创作技术迈入新纪元,MiniMax表示将进一步优化模型,计划在未来六个月内推出实时协作功能,使音乐创作者能够与AI进行互动式创作。这一突破有望降低音乐创作门槛,同时为音乐产业带来新的商业模式和创作可能性。
蚂蚁灵波开源世界模型LingBot-World
蚂蚁集团旗下灵波团队今日宣布开源其世界模型LingBot-World,该模型具备强大的多模态理解和生成能力,能够处理文本、图像、音频等多种信息形式。LingBot-World采用了创新的架构设计,在保持高效推理能力的同时,显著降低了计算资源需求。
此次开源将加速AI世界模型的研究与应用落地,灵波团队表示将持续优化模型性能,并计划构建开发者社区,推动模型在智能助手、虚拟世界等领域的创新应用。这一举措有望促进AI技术在更多垂直场景的突破,为全球开发者提供强大的技术支持。
谷歌Gemini 3.5模型技术参数泄露引发行业关注
据内部消息人士透露,谷歌Gemini 3.5模型的部分技术参数和架构细节被意外泄露,该模型在多模态理解、长文本处理和逻辑推理方面均有显著提升。Gemini 3.5采用了创新的混合注意力机制,在保持高性能的同时降低了计算复杂度。
此次泄露事件虽引发争议,但也加速了行业对下一代AI模型架构的探索。谷歌已确认相关参数的真实性,并表示将在适当时候发布官方技术报告。分析师认为,Gemini 3.5的推出将进一步加剧全球AI基础模型竞争,推动整个行业向更高性能、更低能耗方向发展。
腾讯混元图像3.0正式开源,推动AI视觉技术普及
腾讯今日正式开源混元图像3.0模型,该模型在图像生成、编辑和理解方面达到业界领先水平。混元图像3.0支持高分辨率图像生成,细节表现力和艺术风格控制能力大幅提升,同时优化了推理速度,可满足实时应用需求。
此次开源是腾讯推动AI技术民主化的重要举措,公司表示将提供完善的开发工具和技术支持,帮助企业和开发者快速集成混元图像3.0的能力。业内专家认为,这一开源将加速AI视觉技术在各行业的落地,特别是在创意设计、数字娱乐和工业质检等领域。
Clawdbot迫于压力更名为Moltbot,开源AI助手引发争议
一夜爆火的开源AI助手Clawdbot今日宣布更名为Moltbot,更名原因是原名称引发部分用户不适。Moltbot作为开源项目,在过去24小时内获得超过10,000颗GitHub星,其自然对话能力和插件系统受到开发者广泛好评。
此次更名事件反映了AI产品在设计和命名方面需要更加注重文化敏感性。Moltbot团队表示,将继续优化产品功能,计划在未来两个月内推出企业版,并加强与主流开发平台的集成。这一事件也为AI行业提供了关于产品伦理和文化适应性的重要启示。
月之暗面发布Kimi Code,提升AI编程能力
月之暗面今日发布Kimi Code,专为编程场景优化的AI助手。Kimi Code具备代码理解、生成、调试和优化等全流程能力,支持多种编程语言和框架,能够理解复杂的业务逻辑和技术需求。
Kimi Code的推出标志着AI编程助手进入新阶段,月之暗面表示将持续深耕垂直领域,计划与多家主流代码托管平台合作,打造更完整的开发体验。业内分析师认为,AI编程助手将成为开发者的标配工具,显著提升软件开发效率和质量。
阿里发布推理模型Qwen3-Max-Thinking,强化逻辑推理能力
阿里巴巴今日发布推理模型Qwen3-Max-Thinking,专注于复杂逻辑推理和问题解决能力。该模型在数学推理、科学分析和决策支持等任务上表现优异,能够处理多步骤复杂问题,提供结构化解决方案。
阿里云表示,Qwen3-Max-Thinking将逐步集成到阿里云的各类AI服务中,为企业提供更强大的智能决策支持。该模型的推出将进一步推动AI在金融、医疗、制造等关键行业的应用,助力企业数字化转型和智能化升级。
Claude深度集成Slack,提升办公协作效率
Anthropic今日宣布Claude与Slack实现深度集成,用户可直接在Slack平台使用Claude的AI助手功能。此次集成包括智能邮件处理、会议记录总结、任务提醒等多项功能,显著提升团队协作效率。
此次合作是AI办公助手领域的重要里程碑,Anthropic计划在未来几个月内扩展与更多办公平台的集成,打造统一的AI办公生态。业内专家认为,AI与办公工具的深度融合将重塑工作方式,提高知识工作者生产力。
京东JoyGlance登陆乐奇AI眼镜,开启AR新体验
京东今日宣布其AR应用JoyGlance正式登陆乐奇AI眼镜,为用户提供沉浸式购物体验。JoyGlance结合计算机视觉和AI推荐技术,能够识别现实世界中的商品,并提供个性化推荐和比价服务。
此次合作标志着AR技术与电商场景的深度融合,京东计划在未来一年内扩展更多AR购物功能,包括虚拟试衣、家居预览等。这一创新有望改变传统购物方式,为消费者提供更直观、便捷的购物体验。
ChatGPT Atlas浏览器重大更新,强化AI搜索能力
OpenAI今日宣布ChatGPT Atlas浏览器迎来重大更新,新增多模态搜索功能和实时数据整合能力。新版浏览器能够理解用户复杂查询,整合网络信息、文档内容和AI生成内容,提供更全面的搜索结果。
此次更新反映了AI搜索技术的快速发展,OpenAI表示将持续优化算法,计划在未来版本中加入更多个性化功能。业内分析师认为,AI搜索将逐步取代传统搜索引擎,成为用户获取信息的主要方式。
通义开源Qwen3-TTS,推动语音合成技术进步
阿里巴巴旗下通义团队今日开源Qwen3-TTS文本转语音模型,该模型在自然度、情感表达和语音多样性方面达到业界领先水平。Qwen3-TTS支持多语言和多种声音风格,可应用于虚拟助手、有声读物和内容创作等领域。
此次开源将加速语音合成技术的普及和应用,通义团队表示将持续优化模型性能,并计划推出更多定制化解决方案。专家认为,高质量的语音合成技术将为人机交互带来革命性变化,特别是在无障碍服务和内容创作领域。




