Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models
方向是物体的一个关键属性,对于理解它们在图像中的空间姿势和排列至关重要。然而,从单个图像进行精确方向估计的实用解决方案仍未得到充分探索。在这项工作中,我们介绍了 Orient Anything,这是第一个旨在估计单视图和自由视图图像中物体方向的专家和基础模型。由于标记数据的稀缺性,我们建议从 3D 世界中提取知识。通过开发一个管道来注释 3D 物体的正面并从随机视图渲染图像,我们收集了 200 万张带有精确方向注释的图像。为了充分利用数据集,我们设计了一个强大的训练目标,将 3D 方向建模为三个角度的概率分布,并通过拟合这些分布来预测物体方向。此外,我们采用了几种策略来改进从合成到真实的迁移。我们的模型在渲染图像和真实图像中都实现了最先进的方向估计精度,并在各种场景中表现出令人印象深刻的零样本能力。更重要的是,我们的模型增强了许多应用,例如复杂空间概念的理解和生成以及 3D 物体姿势调整。原文链接:https://arxiv.org/abs/2412.18605ResearchFlow链接:https://rflow.ai/flow/0b8f3612-efe3-4bac-b12b-d09624fcb14904
VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models
Vertex AI 是一个完全托管的统一 AI 开发平台,专为构建和使用生成式 AI 设计,旨在简化和加速 AI 项目的开发与部署。无论您是刚刚接触 Vertex AI 的新手,还是已经拥有丰富经验的机器学习从业者,您都可以通过这个存储库找到丰富的资源和实用的示例,帮助您快速上手并提升开发效率。此外,如果您需要更多关于 Vertex AI Generative AI 的笔记本示例,欢迎访问 Vertex AI Generative AI GitHub 存储库,其中包含了更多实用案例和代码,助您更深入地了解和使用生成式 AI 技术。https://github.com/GoogleCloudPlatform/vertex-ai-samples 推荐阅读 — END —1. The theory of LLMs|朱泽园ICML演讲整理