导航首页 » 资源中心 » AI行业速览|2026年1月17日焦点观察
AI行业速览|2026年1月17日焦点观察

AI行业速览|2026年1月17日焦点观察

今日AI行业呈现多线并进发展态势,大模型应用持续深化,多领域技术突破与商业落地并行。电商、金融、内容创作等传统行业加速AI融合,开源模型生态日益丰富,国产AI技术在国际舞台崭露头角。资本层面,AI基础设施与垂直应用领域持续获得青睐,行业监管与技术创新的平衡成为焦点议题。整体来看,AI正从技术探索阶段迈向规模化应用新阶段。

京东上线AI年货地图,购物体验智能化升级

京东于1月17日正式推出AI年货地图功能,通过人工智能技术为消费者提供个性化购物路线规划与商品推荐。该功能整合了地理位置、用户偏好及实时库存数据,能够智能规划最优购物路径,并预测热门商品需求,帮助用户高效完成年货采购。

此举标志着电商平台在AI应用场景上的又一次突破,不仅提升了用户购物体验,也为零售行业提供了线上线下融合的新思路。未来,京东计划将AI年货地图扩展至更多节日场景,并深化与供应链系统的联动,实现从需求预测到物流配送的全链路智能化。

支付宝首发ACT协议,开启AI可信协作新纪元

支付宝于今日正式发布ACT(AI Collaborative Trust)协议,这是全球首个面向AI系统间协作的信任框架协议。该协议通过分布式账本技术实现AI模型训练与推理过程中的可信数据交换,确保多方参与AI协作时的数据安全与隐私保护。

ACT协议的推出将加速AI产业生态的协同创新,降低企业间AI技术合作的信任成本。支付宝表示,该协议将向行业开放,并计划在未来一年内吸引至少100家AI企业加入,共同构建可信AI协作网络,为金融、医疗等高敏感度领域的AI应用提供基础设施支持。

谷歌Veo 3.1重磅升级,视频生成能力再创新高

谷歌于1月17日宣布其AI视频生成模型Veo迎来3.1版本重大升级,新版本在视频连贯性、细节表现和多镜头一致性方面取得显著突破。Veo 3.1支持更长时长的视频生成,能够理解更复杂的场景描述,并首次实现了跨镜头的视觉一致性保持。

此次升级将进一步推动AI在影视制作、广告创意等领域的应用落地。谷歌透露,Veo 3.1已向部分创意工作室和企业客户提供测试服务,并计划于2026年第二季度向更广泛的创作者群体开放,预计将重塑视频内容生产流程,降低专业视频制作的门槛。

千问全面接入阿里生态,企业服务能力整合提速

阿里巴巴于今日宣布其大语言模型千问已完成与阿里云、钉钉、淘宝等核心业务系统的全面对接,实现了跨平台的知识共享与服务协同。此次整合使千问能够直接调用阿里生态内的各类服务API,为企业用户提供从咨询到业务办理的一站式AI解决方案。

这一整合标志着阿里AI战略从单点技术突破向全场景服务能力转变的重要里程碑。阿里计划在未来半年内,将千问的AI服务能力扩展至其全球业务网络,覆盖超过1000万企业用户,构建全球最大的企业级AI服务生态。

百度文心ERNIE-5.0-0110正式发布,多模态能力全面增强

百度于1月17日发布文心大模型最新版本ERNIE-5.0-0110,该版本在多模态理解与生成能力上实现质的飞跃,特别是在图像理解、视频内容分析和跨模态推理方面达到业界领先水平。新模型参数规模较上一代提升40%,推理效率提升30%。

此次升级将进一步巩固百度在AI基础模型领域的领先地位,并为百度智能云、自动驾驶等核心业务提供更强的技术支撑。百度表示,ERNIE-5.0-0110将逐步向企业客户开放API服务,并计划在2026年上半年推出面向开发者的轻量级版本,加速AI技术在各行业的普及应用。

实时世界模型PixVerse R1发布,虚拟与现实边界再模糊

AI研究团队于今日发布实时世界模型PixVerse R1,该模型能够以每秒30帧的速度生成高保真度的动态世界模拟,支持物理规律准确模拟和长期一致性保持。PixVerse R1在复杂场景下的表现超越了现有同类模型,特别是在模拟多物体交互和环境变化方面展现出卓越能力。

PixVerse R1的发布将为游戏开发、虚拟现实训练和城市规划等领域带来革命性变化。研究团队已与多家游戏公司达成合作,将该技术应用于游戏场景生成,预计将显著缩短游戏内容开发周期,降低制作成本。未来六个月内,团队计划推出面向开发者的API服务,让更多行业能够受益于这一突破性技术。

Vidu发布AI一键生成MV功能,内容创作门槛大幅降低

视频创作平台Vidu于今日推出AI一键生成音乐视频(MV)功能,用户只需输入歌曲链接或上传音频文件,AI即可在几分钟内完成包含场景匹配、人物动作和特效的完整MV制作。该功能整合了先进的音频分析和视频生成技术,能够根据音乐节奏和情感变化自动调整视觉效果。

这一功能将极大降低专业MV制作的门槛,使普通用户也能轻松创作高质量视频内容。Vidu数据显示,自功能上线测试以来,用户创作量增长了300%。平台计划在未来版本中加入更多个性化定制选项,并拓展至短视频广告、社交媒体内容等更多应用场景,打造AI驱动的视频内容创作生态。

可灵AI ARR达2.4亿美元,企业级AI服务市场持续升温

企业AI解决方案提供商可灵AI于今日公布其年度经常性收入(ARR)达到2.4亿美元,较去年同期增长180%,创下企业级AI服务领域增长新纪录。可灵AI专注于为金融、医疗和制造业提供定制化AI解决方案,其客户包括多家全球500强企业。

这一业绩增长反映了市场对企业级AI解决方案的强劲需求,也表明AI技术正加速从实验室走向实际商业应用。可灵AI宣布将利用新一轮融资扩大研发团队,并计划在2026年拓展至欧洲和东南亚市场,进一步巩固其在企业AI服务领域的全球领先地位。

美团LongCat-Flash-Thinking-2601发布,工具调用能力登顶开源SOTA

美团于1月17日发布其自主研发的大模型LongCat-Flash-Thinking-2601,该模型在工具调用能力评测中超越所有开源模型,达到业界领先水平。LongCat-Flash-Thinking-2601采用创新的思考链架构,能够更高效地规划复杂任务并调用外部工具,特别适合需要多步骤推理的应用场景。

此次发布展示了美团在AI基础模型领域的研发实力,也将推动开源AI生态的发展。美团表示,将向社区开放该模型的部分核心组件,并计划成立专门的AI开源联盟,促进产学研合作,共同推动AI技术的创新与应用落地。

谷歌最强AI开放翻译模型TranslateGemma登场,打破语言壁垒

谷歌于今日推出其最新AI开放翻译模型TranslateGemma,该模型支持超过100种语言之间的互译,在低资源语言翻译任务上的表现超越现有开源模型。TranslateGemma基于Gemma架构优化,专为翻译任务设计,具有轻量级和高效率的特点,适合在资源受限的环境中部署。

TranslateGemma的发布将促进全球信息交流,特别是帮助小语种用户跨越语言障碍。谷歌宣布将向开发者社区开放该模型,并提供针对移动设备和边缘设备的优化版本,让AI翻译技术能够惠及更多用户,特别是在网络连接有限的地区。

混元3D Studio 1.2全面开放公测,支持笔刷交互与八视图输入

腾讯于今日宣布其3D内容创作平台混元3D Studio 1.2版本全面开放公测,新版本引入革命性的笔刷交互功能和八视图输入系统,使创作者能够以更直观的方式创建和编辑3D模型。该平台整合了腾讯最新的AI生成技术,可自动生成高精度纹理和细节,大幅提升3D内容创作效率。

混元3D Studio的开放标志着腾讯在AI赋能创意产业领域的战略布局。腾讯表示,该平台将免费提供给教育机构和非商业用户,并计划在未来推出面向专业创作者的高级功能,构建完整的3D内容创作生态,推动元宇宙相关产业的发展。

千问App上线AI购物功能,实现从咨询到购买闭环

阿里巴巴旗下千问App于今日正式上线AI购物功能,该功能能够理解用户购物需求,提供个性化商品推荐,并直接引导至购买页面。千问App整合了阿里电商生态的商品数据和用户行为分析,实现从需求识别、商品匹配到购买决策的全流程AI辅助。

这一功能将重新定义移动购物体验,提升用户购物效率。数据显示,测试期间使用AI购物的用户转化率较传统搜索提高45%。千问团队表示,未来将进一步强化该功能的个性化能力,并计划接入AR试穿、虚拟试用等新技术,打造沉浸式AI购物体验。

阶跃星辰原生语音推理模型Step-Audio-R1.1登顶榜首

AI语音技术公司阶跃星辰于今日发布其原生语音推理模型Step-Audio-R1.1,该模型在多项语音识别和合成评测中超越现有所有模型,登顶行业榜首。Step-Audio-R1.1采用创新的端到端架构,在保持高精度的同时大幅降低了计算资源需求,实现了实时低延迟处理。

这一技术突破将推动语音交互在更多场景的应用落地,特别是在智能设备、车载系统和实时翻译等领域。阶跃星辰已与多家消费电子和汽车制造商达成合作,将该技术集成到下一代产品中。公司计划在未来六个月内推出面向开发者的API服务,让更多行业能够受益于这一先进语音技术。

留言评论
本站统计

已开设分类:10

已收录站点:748

最高日览站:新华网

最高月览站:高清影视

最高总览站:Jasper

最高点赞站:Designify

正申请站点:0

已拒绝站点:1

文章的分类:13

已发布文章:279

已发布公告:1

已交换友链:1

本站已稳定运行了 天。

❤️ 感谢您的支持