导航首页 » 资源中心 » AI行业速览|2025年11月28日焦点观察
AI行业速览|2025年11月28日焦点观察

AI行业速览|2025年11月28日焦点观察

今日AI行业呈现多领域突破性进展,开源模型与商业化产品并行发展。阿里、字节跳动等科技巨头持续开源创新模型,同时腾讯、百度等加速大模型应用落地;投融资市场活跃,清华AI黑马企业获近5亿元融资;多模态AI应用场景不断拓展,从图像生成到空间重建技术取得新突破。行业呈现开源与闭源并存、技术普惠与商业价值并重的双轨发展态势。

阿里开源Z-Image图像生成模型

阿里巴巴于11月28日正式开源Z-Image图像生成模型,该模型参数规模达6B,专注于高效图像生成与编辑。Z-Image采用创新的注意力机制设计,在保持高质量输出的同时显著降低了计算资源需求,使开发者能够在消费级硬件上部署应用。该模型支持多种图像风格转换和细节增强功能,已在阿里云平台提供API服务。

Z-Image的开源将进一步降低AI图像生成技术的使用门槛,预计将推动中小开发者和创业公司基于此模型开发创新应用。阿里表示将持续优化模型性能,并计划在未来版本中加入多模态理解能力,拓展其在电商设计、内容创作等领域的应用场景,加速AI技术在创意产业中的普及。

字节跳动发布视觉空间重建模型Depth Anything 3

字节跳动于11月28日推出视觉空间重建模型Depth Anything 3,该模型在单张图像深度估计精度上较前代提升40%,能够生成高精度3D空间结构。该模型结合了自监督学习和多尺度特征融合技术,在复杂场景下表现尤为突出,已应用于字节跳动旗下PICO VR设备的空间定位功能。

Depth Anything 3的发布标志着空间AI技术的重要突破,将为AR/VR、自动驾驶、机器人导航等领域提供关键技术支持。字节跳动计划将该技术开源,并已与多家汽车制造商达成合作,探索其在自动驾驶环境感知中的应用。这一技术有望加速元宇宙基础设施建设,推动虚拟与现实融合应用的普及。

清华AI黑马企业无问芯穹完成近5亿元A+轮融资

清华大学孵化的AI芯片企业无问芯穹于11月28日宣布完成近5亿元A+轮融资,由多家头部投资机构联合领投。本轮融资将主要用于新一代AI芯片的研发和量产,以及研发团队的扩充。无问芯穹专注于边缘计算AI芯片,其最新一代芯片在能效比上较市场领先产品提升3倍,已在智能安防、工业质检等领域实现商业化落地。

此次融资反映了资本市场对AI硬科技企业的持续看好,也表明中国在AI芯片领域的自主创新获得认可。无问芯穹计划利用新资金加速产品迭代,并拓展海外市场。随着大模型向边缘设备部署的趋势加强,高性能低功耗AI芯片需求激增,无问芯穹有望在这一蓝海市场中占据先机,推动AI技术从云端向终端的全面渗透。

黑森林开源FLUX.2图像生成模型

AI研究机构黑森林于11月28日开源图像生成模型FLUX.2,该模型在多个图像生成基准测试中表现优异,尤其在细节还原和一致性方面取得突破。FLUX.2采用扩散模型与transformer的混合架构,支持高分辨率图像生成(最高可达2048×2048),并引入了可控生成功能,允许用户精确调整图像风格和内容细节。

FLUX.2的开源将极大丰富开源AI图像生成生态,为开发者和研究人员提供强大的工具。黑森林表示,该模型已在多个创意产业场景中测试应用,包括游戏资产生成、广告设计和虚拟人创建等。未来计划通过社区反馈持续优化模型,并探索与其他AI工具的集成,构建完整的AI创意工作流,进一步降低数字内容创作的技术门槛。

LiblibAI上线基础算法F.2平台

AI算法平台LiblibAI于11月28日推出"基础算法F.2"新功能,该平台支持多图参考和图像编辑,为开发者提供一站式AI算法解决方案。基础算法F.2整合了最新的图像生成、分割和识别算法,用户可通过简单操作实现复杂AI功能,无需深入了解底层技术细节。平台已接入超过50种基础算法,覆盖计算机视觉、自然语言处理等多个领域。

基础算法F.2的上线将大幅降低AI技术的应用门槛,使中小企业和开发者能够快速将AI能力集成到自身产品中。LiblibAI计划在未来三个月内将算法数量扩展至200种,并增加视频处理和多模态交互功能。这一平台化趋势反映了AI产业正在从技术竞争转向生态竞争,通过构建开放平台加速AI技术的普惠化进程。

TRAE SOLO登陆中国版市场

AI设计工具TRAE SOLO于11月28日正式登陆中国版市场,向中国用户提供免费使用权限。该工具基于AI驱动的3D建模技术,能够将2D草图快速转换为3D模型,支持实时编辑和材质调整。TRAE SOLO特别针对中国市场进行了本地化优化,增加了中国传统建筑元素和现代设计风格的模型库,满足国内设计师的多样化需求。

TRAE SOLO免费进入中国将进一步加剧AI设计工具市场的竞争,推动行业整体技术进步和服务升级。其母公司表示,将在中国设立研发中心,针对本地市场需求持续优化产品功能。随着中国创意产业数字化转型加速,AI设计工具的市场潜力巨大,TRAE SOLO的入局将为国内设计师提供更多选择,同时也将促进全球AI设计技术的交流与融合。

腾讯元宝推出视频模型HunyuanVideo1.5

腾讯于11月28日发布视频生成模型HunyuanVideo1.5,该模型在视频连贯性和细节表现上较前代显著提升。HunyuanVideo1.5支持4K分辨率视频生成,能够处理长达2分钟的高质量视频内容,并新增了多镜头切换和场景过渡功能。该模型已集成到腾讯云AI服务平台,企业客户可通过API接入视频生成能力。

HunyuanVideo1.5的推出标志着腾讯在AIGC领域的重要布局,将进一步推动视频内容的智能化生产。腾讯计划将该技术应用于短视频平台、广告营销和影视制作等领域,探索人机协作的创作新模式。随着视频内容需求的持续增长,AI视频生成技术有望成为内容产业的新引擎,HunyuanVideo1.5的商用化将加速这一进程,重塑视频内容的创作方式和商业模式。

夸克AI眼镜与高德地图达成战略合作

11月28日,夸克宣布其AI眼镜产品与高德地图达成战略合作,双方将共同开发基于空间计算的导航体验。夸克AI眼镜将集成高德地图的室内外无缝导航能力,结合AR技术实现实时路径指引和兴趣点信息叠加。用户只需通过眼镜即可获取步行导航、公交换乘和周边服务等信息,无需查看手机屏幕。

此次合作是AI眼镜与地图服务深度融合的重要尝试,将推动AR导航技术的实用化进程。夸克和高德计划在未来六个月内推出多项联合功能,包括基于用户位置的兴趣推荐和社交分享等。随着AI眼镜硬件技术的成熟和生态的完善,这类跨界合作将成为常态,加速AR技术从概念走向日常应用,为用户带来更智能、更便捷的空间交互体验。

Meta开源可交互3D模型SAM 3D

Meta于11月28日开源可交互3D模型SAM 3D,该模型能够从2D图像中提取3D结构并支持用户交互式编辑。SAM 3D结合了计算机视觉和3D重建技术,可自动识别图像中的物体并生成可操作的3D模型,用户可直接在3D空间中调整物体位置、大小和形状。该模型已在Meta的Reality Labs项目中应用,用于虚拟场景构建。

SAM 3D的开源将推动3D内容创作工具的民主化,使非专业用户也能轻松创建3D内容。Meta表示,该技术有望应用于电商产品展示、游戏开发和建筑设计等领域,大幅降低3D内容制作成本。随着元宇宙概念的兴起,高效易用的3D创作工具变得尤为重要,SAM 3D的发布将进一步加速3D互联网的发展,为虚拟世界建设提供关键技术支撑。

豆包输入法正式上线

字节跳动于11月28日正式推出豆包输入法,该输入法深度融合AI技术,提供智能预测、个性化表达和跨语言翻译等功能。豆包输入法采用自研的上下文理解引擎,能够根据对话场景智能调整输入建议,支持语音、手写和多种输入方式的无缝切换。该输入法已支持中、英、日、韩等12种语言,覆盖全球主要语种。

豆包输入法的上线标志着字节跳动在AI应用层面的重要布局,将进一步扩大其在AI工具生态中的影响力。字节跳动计划通过豆包输入法收集用户语言使用数据,持续优化大模型的语言理解能力。随着AI技术的普及,输入法作为人机交互的关键入口,正从简单的文字输入工具转变为智能助手,豆包输入法的推出将推动这一趋势发展,重塑用户的数字沟通体验。

百度新设立两个大模型研发部门

百度于11月28日宣布新设立两个大模型研发部门,分别专注于多模态大模型和行业大模型研发。多模态大模型部门将整合文本、图像、音频和视频等多种模态的AI能力,目标是构建统一的认知智能框架;行业大模型部门则聚焦金融、医疗、制造等垂直领域的模型定制化开发,推动大技术在产业场景中的深度应用。

百度此次组织架构调整反映了其对大模型技术路线的战略规划,表明百度将从通用大模型向多模态和行业化两个方向并行发展。随着大模型技术进入深水区,百度通过专业化分工加速技术突破和落地应用。这一举措也将强化百度在AI基础设施和行业解决方案方面的竞争力,为其云业务和智能生态建设提供更强技术支撑,推动AI技术在千行百业的规模化应用。

留言评论
本站统计

已开设分类:10

已收录站点:747

最高日览站:高清影视

最高月览站:高清影视

最高总览站:Jasper

最高点赞站:Designify

正申请站点:0

已拒绝站点:1

文章的分类:13

已发布文章:84

已发布公告:1

已交换友链:1

本站已稳定运行了 天。

❤️ 感谢您的支持