2026年1月18日AI前沿情报速递
今日AI领域呈现出多维度创新与生态融合的态势,大模型能力持续突破,应用场景不断深化。从技术升级到生态整合,从消费应用到企业服务,AI正加速渗透各行业。国内科技巨头纷纷推出新一代AI产品,国际科技公司在基础模型领域持续发力,同时AI与传统产业的融合创新也取得显著进展,显示出人工智能技术正从单点突破向系统性创新转变。
谷歌Veo 3.1重磅升级视频生成能力
谷歌于1月18日宣布其视频生成模型Veo 3.1完成重大升级,新增了超高清分辨率支持、更精准的物理模拟和更丰富的情感表达功能。此次升级使Veo 3.1能够生成4K分辨率、120fps流畅度的视频内容,并显著提升了复杂场景和人物动作的真实感。谷歌表示,Veo 3.1已通过API向开发者开放,首批合作伙伴包括YouTube创作者和影视制作公司。
此次升级标志着谷歌在视频生成领域向OpenAI的Sora发起有力挑战,将进一步推动AIGC技术在影视创作、广告制作等领域的商业化应用。分析人士认为,随着Veo 3.1的开放,谷歌有望在2026年抢占视频生成市场的更大份额,同时可能引发新一轮的AI视频生成技术竞赛。
千问全面接入阿里生态,AI能力全面开放
阿里巴巴于1月18日宣布,其大语言模型千问已完成全面接入阿里生态,包括淘宝、天猫、阿里云、钉钉等核心业务场景。用户现在可以通过这些平台直接调用千问的AI能力,实现智能客服、商品推荐、内容创作等功能。阿里巴巴表示,此次整合覆盖了超过10亿活跃用户,日均AI交互量预计将突破5亿次。
这一整合标志着阿里AI战略从技术研发向全面商业化应用的关键转变,将极大提升阿里各业务线的智能化水平。业内专家认为,阿里通过将千问深度融入生态,正在构建一个"AI+商业"的闭环系统,这可能重塑电商、云计算和企业服务领域的竞争格局,为其他科技巨头提供AI生态整合的参考范式。
百度文心ERNIE-5.0-0110正式发布
百度于1月18日发布其新一代大语言模型ERNIE-5.0-0110,该模型在逻辑推理、知识问答和多语言处理方面实现了显著提升。据官方测试,ERNIE-5.0-0110在MMLU、GSM8K等权威基准测试中的得分较上一版本提升了15%,特别是在中文语境下的理解能力和生成质量达到行业领先水平。百度同时宣布,该模型已全面接入百度搜索、百度文库、百度地图等产品线。
此次升级巩固了百度在中文大模型领域的领先地位,同时也反映出百度AI战略从通用能力向垂直行业深度渗透的转向。分析师指出,随着ERNIE-5.0的发布,百度将进一步强化其在搜索、内容创作和智能驾驶等核心业务中的AI优势,同时也为B端企业客户提供更强大的AI基础设施支持。
机器人租赁平台擎天租完成新一轮融资
专注于机器人租赁服务的平台"擎天租"于1月18日宣布完成1.2亿美元C轮融资,由红杉资本领投,高瓴创投跟投。本轮融资将主要用于扩大机器人种类、优化租赁系统和拓展全国服务网络。擎天租目前服务超过5000家企业客户,提供工业机器人、服务机器人、特种机器人等全品类租赁服务,平台机器人保有量已突破2万台。
此次融资反映了资本市场对AI+机器人领域的高度认可,预示着机器人租赁模式正成为企业获取智能化能力的重要途径。擎天租的成功案例表明,通过租赁模式降低企业智能化转型的门槛,正成为AI技术落地的重要商业模式,未来可能会有更多类似平台涌现,推动机器人技术在更多行业的普及应用。
实时世界模型PixVerse R1发布
AI研究机构"未来智能"于1月18日发布了实时世界模型PixVerse R1,该模型能够以每秒30帧的速度生成高保真度的动态世界模拟,支持物理交互和长期记忆。PixVerse R1在模拟复杂环境、物体交互和多智能体行为方面表现出色,已在自动驾驶仿真、游戏开发和虚拟训练等领域获得应用。研究团队表示,该模型参数量达到200亿,训练数据涵盖了超过1000小时的现实世界视频。
PixVerse R1的发布标志着AI世界模型技术向实时化、高保真方向迈出重要一步,将为元宇宙、数字孪生和智能仿真等领域提供强大的技术支撑。业内专家认为,随着此类技术的成熟,未来可能出现基于AI世界模型的全新应用场景,从虚拟社交到工业仿真,都可能因此迎来革命性变化。
Vidu发布AI一键生成MV功能
视频创作平台Vidu于1月18日推出AI一键生成MV功能,用户只需输入歌词或简单描述,系统即可在几分钟内生成专业级音乐视频。该功能整合了先进的文本理解、图像生成和视频编辑技术,支持多种风格和主题定制。Vidu表示,该功能上线首日已有超过10万用户尝试,生成的MV质量已接近专业制作水准。
这一功能的推出极大降低了音乐视频的创作门槛,可能重塑音乐创作和内容分发行业。分析师指出,随着AI创作工具的普及,传统的内容创作流程将被重构,个人创作者和小型工作室将能够以更低成本生产高质量内容,这将进一步丰富数字内容生态,同时也对传统制作机构和版权保护机制提出新的挑战。
可灵AI ARR达2.4亿美元
企业AI解决方案提供商"可灵AI"于1月18日宣布其年度经常性收入(ARR)已达到2.4亿美元,较去年同期增长300%。可灵AI专注于为企业提供定制化AI解决方案,其客户包括多家财富500强企业。公司CEO表示,这一增长主要来自金融、医疗和制造三大行业的强劲需求,以及产品线的持续扩展。
可灵AI的高速增长反映了企业级AI市场的巨大潜力,特别是在垂直行业解决方案方面的需求激增。业内分析师认为,随着企业数字化转型的深入,定制化AI解决方案将成为企业竞争的关键因素,可灵AI的成功案例可能吸引更多资本涌入企业AI服务领域,推动该市场的进一步细分和成熟。
阅文、中文在线推AI全栈工具
网络文学平台阅文集团和中文在线于1月18日联合发布"文星AI"全栈创作工具,该工具整合了AI辅助写作、智能编辑、版权保护和分发推广等功能。据官方介绍,"文星AI"能够帮助作者提高创作效率3-5倍,同时保持作品风格的一致性和原创性。目前已有超过5000名作家开始试用该工具,其中包括多位知名网络作家。
这一合作标志着AI技术在内容创作领域的深度应用,可能重塑网络文学行业的创作生态。业内人士分析,AI辅助工具的普及将提高内容生产效率,同时也引发关于创作原创性和版权归属的新讨论。未来,AI与人类创作者的协作模式可能成为内容行业的主流,推动整个行业向更高效、更多元的方向发展。
美团LongCat-Flash-Thinking-2601发布
美团于1月18日发布其自主研发的大模型LongCat-Flash-Thinking-2601,该模型在工具调用能力方面登顶开源SOTA榜单。LongCat-Flash-Thinking-2601特别针对电商和生活服务场景优化,具备强大的多轮对话、意图识别和任务执行能力。美团表示,该模型已全面接入美团App,用于智能客服、商品推荐和订单处理等场景,显著提升了用户体验和运营效率。
此次发布展示了美团在AI垂直应用领域的深度布局,反映了互联网公司正从通用大模型向行业专用模型转变的趋势。分析师认为,随着LongCat等垂直领域大模型的成熟,AI技术将在本地生活服务领域实现更精准的应用,推动线上线下服务的深度融合,为消费者提供更加个性化和便捷的服务体验。
支付宝首发ACT协议
支付宝于1月18日宣布首发"AI智能合约交易"(ACT)协议,该协议基于区块链和AI技术,能够自动执行复杂的商业条款和条件。ACT协议支持多方参与的智能合约创建、执行和监管,已在供应链金融、跨境贸易和数字版权等领域开始试点应用。支付宝表示,该协议将大幅降低商业交易的成本和风险,预计今年内将有超过1000家企业加入ACT生态。
ACT协议的发布标志着AI与区块链技术融合的重要突破,可能重塑数字商业的基础设施。业内专家认为,随着智能合约技术的成熟,未来可能出现更多基于AI自动执行的商业模式,从金融服务到供应链管理,都将因此变得更加高效和透明。这一创新也可能推动数字经济的全球化进程,为跨境商业合作提供新的技术支撑。
千问App上线AI购物功能
阿里巴巴于1月18日宣布,其AI助手应用"千问App"正式上线AI购物功能,用户可以通过自然语言描述需求,获得个性化的商品推荐和购买建议。该功能整合了阿里巴巴的电商数据和AI理解能力,能够根据用户的偏好、预算和使用场景,提供精准的商品匹配和比较分析。千问App团队表示,AI购物功能将帮助用户节省70%以上的购物决策时间。
这一功能的推出标志着AI技术在电商领域的应用进入新阶段,从传统的商品搜索向主动式、个性化的购物助手转变。分析师认为,随着AI购物功能的普及,电商平台的竞争将从价格和商品转向用户体验和个性化服务,这可能重塑整个电商行业的商业模式,推动从"人找货"向"货找人"的转变。
混元3D Studio 1.2全面开放公测
腾讯于1月18日宣布其3D内容创作平台"混元3D Studio 1.2"全面开放公测,新增笔刷交互、八视图输入等创新功能。混元3D Studio是基于AI技术的3D内容创作工具,能够帮助用户快速创建高质量的3D模型和场景。腾讯表示,该平台已与多家游戏公司和设计机构达成合作,未来将进一步拓展在元宇宙、数字孪生等领域的应用。
混元3D Studio的开放公测反映了腾讯在元宇宙和3D内容生态方面的战略布局,也将降低3D内容创作的技术门槛。业内专家认为,随着AI辅助3D创作工具的普及,未来可能出现更多高质量的3D内容,推动元宇宙、游戏和虚拟现实等领域的快速发展。这一趋势也可能改变内容创作的产业结构,使更多创作者能够参与3D内容的生产。



