导航首页 » 资源中心 » 全球AI动态精选(2026年1月16日)
全球AI动态精选(2026年1月16日)

全球AI动态精选(2026年1月16日)

今日AI行业呈现出技术与应用深度融合的发展态势,多款大模型迎来重要升级,AI应用场景持续拓展。从电商到医疗,从内容创作到工具调用,人工智能正加速赋能各垂直领域。同时,开源生态与商业化进程并行推进,国产AI技术在国际舞台上崭露头角,显示出中国在全球AI竞争中的日益增强的影响力。

谷歌Veo 3.1重磅升级,视频生成能力再突破

谷歌于今日正式发布Veo 3.1视频生成模型,新版本在视频质量、生成速度和创意控制方面均有显著提升。Veo 3.1能够理解更复杂的文本提示,生成长达5分钟的高清视频,并支持多种艺术风格和镜头语言。此次升级还引入了"视频编辑"功能,允许用户对生成内容进行精细调整。

此次升级将进一步巩固谷歌在AI视频生成领域的领先地位,预计将对影视制作、广告创意等行业产生深远影响。谷歌表示,Veo 3.1将在未来几个月内通过YouTube Shorts和Google Workspace向企业用户开放,推动AI技术在内容创作领域的广泛应用。

百度文心ERNIE-5.0-0110正式发布,多模态能力全面增强

百度今日正式发布文心大模型最新版本ERNIE-5.0-0110,该版本在多模态理解与生成能力上实现重大突破。新模型支持图文、音视频等多种输入方式,能够处理更复杂的跨模态任务,在理解长文本、生成高质量内容方面表现尤为突出。官方测试显示,ERNIE-5.0-0110在多项基准测试中刷新了行业记录。

此次升级标志着百度大模型技术栈的进一步完善,将为百度搜索、智能云等业务注入新动力。百度计划在未来三个月内将ERNIE-5.0-0110逐步开放给企业客户,同时推出针对教育、医疗、金融等垂直行业的定制化解决方案,加速AI技术在千行百业的落地应用。

千问全面接入阿里生态,AI助手能力边界拓展

阿里巴巴今日宣布,其自研大模型千问已全面接入阿里生态,包括淘宝、天猫、钉钉、高德等核心应用。用户现在可以在这些平台直接使用千问的AI助手功能,获得购物建议、行程规划、工作协助等全方位服务。此次整合实现了大模型与电商、本地生活、企业服务等场景的无缝衔接。

这一战略布局将显著提升阿里各平台的用户体验和粘性,同时也为千问模型提供了更丰富的应用场景和数据反馈。阿里表示,未来将继续深化千问与生态系统的融合,探索更多创新应用模式,打造全球领先的AI商业应用生态。

支付宝首发ACT协议,开启AI金融服务新范式

支付宝今日正式发布AI交互技术协议(ACT),这是全球首个专为AI金融服务设计的开放协议。ACT协议定义了AI与用户、金融机构之间的交互标准,包括身份认证、数据安全、交易处理等关键环节。首批已有20家金融机构接入该协议,包括多家国有大行和头部券商。

ACT协议的推出将大幅提升AI金融服务的安全性和效率,降低金融机构的AI应用门槛。支付宝计划在未来一年内推动ACT协议成为行业标准,并开放更多API接口,吸引更多合作伙伴加入,共同构建开放、安全、高效的AI金融服务生态。

实时世界模型PixVerse R1发布,AI理解物理世界迈出重要一步

AI研究团队今日发布了实时世界模型PixVerse R1,该模型能够实时理解和预测物理世界的变化。PixVerse R1通过多传感器融合技术,结合视觉、声音和物理数据,构建出动态的三维世界模型,并能在没有实际观察的情况下预测物体运动和环境变化。测试显示,该模型在复杂场景下的预测准确率达到87%。

PixVerse R1的发布标志着AI在理解物理世界方面取得了重要突破,将为自动驾驶、机器人、虚拟现实等领域提供关键技术支撑。研究团队表示,下一步将优化模型的计算效率,降低硬件要求,并探索在消费级设备上的应用可能性,让更多人能够体验到实时世界模型带来的便利。

机器人租赁平台擎天租完成B轮融资,AI+机器人服务获资本青睐

专业机器人租赁平台擎天租今日宣布完成B轮融资,金额达5亿元人民币,由红杉资本领投,多家知名跟投。本轮融资将主要用于扩大机器人租赁规模、优化AI调度系统以及拓展行业解决方案。目前,擎天租已在全国30个城市部署超过5000台服务机器人和工业机器人,客户覆盖餐饮、零售、制造等多个领域。

此次融资反映了资本市场对AI+机器人服务模式的看好。擎天租表示,将利用新资金进一步深耕垂直行业,开发更专业的机器人应用场景,并通过AI技术提升机器人调度效率和智能化水平,打造全球领先的机器人即服务平台(RaaS)。

美团发布LongCat-Flash-Thinking-2601,工具调用能力登顶开源SOTA

美团今日开源了其最新研发的大模型LongCat-Flash-Thinking-2601,该模型在工具调用能力方面取得了突破性进展。官方测试显示,LongCat-Flash-Thinking-2601在复杂任务规划、多步骤工具组合使用等方面表现优异,在Hugging Face开源模型排行榜上登顶。该模型采用了创新的"思考链"架构,能够更好地理解任务目标并选择合适的工具。

这一成果展示了美团在AI基础研究方面的实力,也为开源社区贡献了重要价值。美团表示,将继续优化LongCat模型,并计划在未来发布更多针对特定场景的微调版本,推动AI技术在餐饮、出行等生活服务领域的深度应用。

混元3D Studio 1.2全面开放公测,支持笔刷交互与八视图输入

腾讯混元团队今日宣布,其3D内容创作平台混元3D Studio 1.2版本全面开放公测。新版本引入了革命性的笔刷交互功能,用户可以直接在3D模型上进行绘画和雕刻,同时支持八视图输入,大幅提升了3D创作的直观性和效率。平台还内置了丰富的AI辅助工具,包括自动拓扑、智能UV展开等功能。

混元3D Studio的开放标志着腾讯在AIGC领域的重要布局,将为游戏、影视、设计等行业提供强大的创作工具。腾讯表示,未来将持续优化平台功能,降低3D创作门槛,让更多创作者能够轻松实现创意构想,推动3D内容生态的繁荣发展。

国产芯片全程训练,GLM-Image登顶Hugging Face Trending

国产AI团队今日宣布,其多模态大模型GLM-Image完全采用国产芯片完成训练,并在Hugging Face平台登顶Trending榜单。GLM-Image在图像理解、生成和跨模态任务方面表现出色,特别是在中文场景下的理解能力尤为突出。这一成果证明了国产AI基础设施在支持大模型训练方面的成熟度。

GLM-Image的成功训练标志着国产AI技术链的进一步完善,减少了对国外技术的依赖。团队表示,下一步将优化模型效率,开发更多针对中文场景的专用功能,并探索在医疗、教育等领域的应用落地,推动国产AI技术的产业化进程。

阶跃星辰Step-Audio-R1.1语音模型登顶榜首,原生推理能力领先

阶跃星辰今日发布其最新语音模型Step-Audio-R1.1,该模型在语音识别、合成和理解等任务上均取得行业领先成绩。官方测试显示,Step-Audio-R1.1在嘈杂环境下的识别准确率达到95.3%,语音自然度评分(MOS)达到4.7,均刷新了行业记录。该模型采用创新的架构设计,实现了高效的端到端语音处理。

Step-Audio-R1.1的发布将进一步推动语音交互技术在各行业的应用落地。阶跃星辰表示,将基于该模型开发更多语音交互解决方案,包括智能客服、语音助手、实时翻译等场景,并计划在未来半年内推出面向开发者的API服务,降低语音AI技术的应用门槛。

千问App上线AI购物功能,实现智能购物决策

阿里巴巴今日宣布,其AI助手应用千问正式上线AI购物功能。该功能能够根据用户需求自动搜索商品、比较价格、分析评价,并提供个性化购买建议。千问App的AI购物助手支持多轮对话,能够理解复杂的购物需求,如"适合25岁女性上班穿的舒适高跟鞋"等,并给出精准推荐。

这一功能将彻底改变用户的购物体验,从传统的"搜索-筛选-比较"模式转变为"需求-推荐-决策"的高效模式。阿里巴巴表示,未来将持续优化千问的AI购物能力,引入更多个性化推荐算法,并探索与AR试穿、虚拟穿搭等技术的结合,打造全方位的智能购物生态系统。

阅文、中文在线推AI全栈工具,内容创作进入智能化时代

网络文学平台阅文和中文在线今日联合推出AI全栈创作工具,包括智能大纲生成、角色设定、情节设计、文本润色等功能。该工具基于双方自研的大语言模型,专为内容创作者设计,能够大幅提高创作效率。测试显示,使用该工具的创作者平均创作速度提升60%,作品质量也有明显提高。

这一工具的发布标志着AI技术在内容创作领域的深度应用,将为网络文学、影视剧本等行业带来革命性变化。两家平台表示,未来将进一步丰富工具功能,增加更多垂直场景的专用模块,并建立创作者社区,促进AI创作经验的分享与交流,共同推动内容创作进入智能化时代。

留言评论
本站统计

已开设分类:10

已收录站点:748

最高日览站:讯飞星火

最高月览站:高清影视

最高总览站:Jasper

最高点赞站:Designify

正申请站点:0

已拒绝站点:1

文章的分类:13

已发布文章:279

已发布公告:1

已交换友链:1

本站已稳定运行了 天。

❤️ 感谢您的支持