李飞飞「世界模型」正式开放,人人可用! Pro 版首月仅 7 元

作者:新智元日期:2025/11/13

「【新智元导读】只用一张图,一句话,就能创造出随便乱逛的 3D 世界——李飞飞这次不是在讲故事,而是真的给你「造梦神器」。今天起,全球上线,人人可用。」

李飞飞的「创世神器」今天终于正式上线了!人人可用。

这个由 WorldLabs 推出,名为 Marble 的网站,用世界模型可以生成瑰丽梦幻的「想象世界」~

体验网址:marble.worldlabs.ai/

这波属实是李飞飞自己联动自己了,前两天她的一篇万字长文火爆硅谷,定义 AI 的下一个十年是「空间智能」。

文章中,她为真正具备空间智能的「世界模型」所需达成的目标勾勒了一个框架。

而今天这个「世界」正式面向全世界发布。

看一下官方视频的效果。

视频详情

World Labs 最新官方宣传视频

「Marble:世界模型」

人类对世界的感知本质上是多模态的:我们调动所有感官来理解周遭环境。

通过整合视觉、听觉、触觉与语言,我们构建起对外部世界的心理模型;这些不同表征方式相互协作、彼此增强,使我们能够理解世界并在其中采取行动。

世界模型应当以类似方式运作。它们需要具备大规模多模态能力,能够将各种可用输入信号提升为完整的三维世界,并随着新信息的出现持续迭代更新对世界的认知。

Marble 是开创先河的新一代世界模型,正朝着这一愿景大步迈进。

「文本与图像世界」

首先,Marble 能够仅凭一张图片或简短文字提示创建完整的 3D 世界。这是最简单便捷的造物方式。

Marble 可生成涵盖多种场景类型与艺术风格的世界。

图像提示使得将 Marble 与其他 AI 工具结合变得轻而易举。可以使用喜爱的图像生成模型创建图像,随后将其导入 Marble,即可将其提升为完整的 3D 世界。

文本和图像提示直观且强大,但在创意控制方面存在局限:Marble 必须自行构建输入文本或图像提示中未包含的世界细节。

「多图像和视频到世界模型」

实现更具创意控制的世界构建,一种简便方法是采用多图像提示技术。

Marble 能够接收针对世界不同部分的多样化提示图像,并将它们无缝融合成统一的 3D 世界。

多图像提示能以更高精度创造世界。

这带来了一种全新的世界生成工作流程。可以使用喜爱的图像生成工具分别迭代输入视角,而 Marble 会将其提升为完整的三维世界,同时为输入视角之间添加无缝过渡效果。

Marble 可以输入几张照片或一段从不同角度描绘现实世界位置的短视频,它会将这些素材组合起来,生成包含现实空间元素的 3D 世界。

「世界编辑」

对许多用户而言,创作过程具有高度迭代性。生成世界往往只是创意旅程的起点。当看到生成的 3D 世界时,通常会激发更多修改或完善它的灵感。

Marble 内置了 AI 原生世界编辑工具。编辑可以细微而局部:移除物体、修饰区域;也可以更加彻底:替换

物体、改变视觉风格,或重构世界的大部分结构。这为世界创建过程带来了全新层次的精细控制。

「Chisel:在三维世界中雕琢天地」

Chisel 和世界编辑还不太一样,有点像一根魔法棒。

Marble 的多模态输入与编辑功能赋予对生成世界的强大掌控力。

但有时,要将脑海中的构想精确呈现,仍需对场景布局或物体的精确尺寸位置进行更精细的调控。

针对这些场景,推出 Chisel——一款原生 AI 工具,可直接在三维空间中雕琢 Marble 世界。

「将世界导出为 3D 或者视频格式」

使用 Marble 创建世界后,有多种导出选项以便将其整合到下游项目中。

高斯溅射点是 Marble 世界最高保真度的呈现方式。它将 3D 场景表示为大量半透明粒子集合。

可以通过与 THREE.js 集成的开源跨平台渲染器 Spark,在浏览器中实时渲染高斯溅射点。

Marble 世界亦可导出为三角网格模型。

系统能够同时生成用于粗略物理模拟的低精度碰撞体网格,以及尽可能匹配高斯溅射点视觉精度的高质量网格。

通过网格格式导出世界,可使其与众多行业标准工具实现无缝协作。

Marble 世界以完整 3D 形式存在,但有时视频才是分享世界的最佳方式。

可以使用 Marble 将生成的世界渲染成视频,通过像素级精准的相机控制,让每个镜头都如您想象般完美构图。

Marble 是一款先进的生成式世界模型。

但只是我们迈向空间智能征途中的一步。

未来,交互性将成为一个关键机遇。

未来的世界模型将让人类与智能体都能以全新方式与生成世界互动,从而在仿真、机器人技术及其他领域解锁更多应用场景。

「空间智能是 AI 的下一个前沿」

李飞飞在她的万字长文中结尾写下的感慨是对这波 AI 浪潮、智能、人类和机器命运最好的总结:

过去十年见证了 AI 成为一种全球现象,以及技术、经济乃至地缘政治的转折点。

但作为一名研究者、教育者,如今又是一名创业者,最能激励我的,仍然是图灵 75 年前提出的那个问题背后的精神。

我依然怀有他那份好奇与惊叹。

正是这种感觉,每天都激励着我迎接空间智能的挑战。

历史上第一次,我们有望构建出与物理世界如此协调的机器,以至于在我们面临的最严峻挑战中,可以将它们视为真正的伙伴。

无论是加速我们对实验室中疾病的理解,彻底改变我们讲述故事的方式,还是在我们因疾病、受伤或年老而最脆弱的时刻给予支持,我们都正处在一项新技术的风口浪尖,这项技术将提升我们最珍视的生活的方方面面。

这是一个更深刻、更丰富、更强大的生活愿景。

在大自然与远古动物身上释放出第一缕空间智能的近五亿年后,我们有幸成为可能很快就能赋予机器同样能力的这一代技术专家中的一员——并有幸利用这些能力为世界各地的人们谋福祉。

我们关于真正智能机器的梦想,没有空间智能是不完整的。

这项探索,就是指引我的北极星。

我邀请你与我同行。

「One More Thing」

Marble 定价方面,目前共有 3 个档位,最高一个月 95 美元,可以最多生成 75 个世界。

免费版本只能上传图片,可以生成 4 个世界。

现在 Pro 版本,首月只需 1 美元!标准版本依然还是业界最普遍的一个月 20 美元。

你认为这个价格合理吗?

参考资料:

www.worldlabs.ai/blog/marble…


李飞飞「世界模型」正式开放,人人可用! Pro 版首月仅 7 元》 是转载文章,点击查看原文


相关推荐


进入职场第四课—产出
Mapbarfront2025/11/12

新入职一家公司观察、融入、立足之后,要做的第四件事就是产出。 观察和融入帮你顺利度过新手期,立足则让你在团队中站稳脚跟,被大家真正接受,接下来你要做的是保持稳定,持续不断的产出,让团队感受到你究竟有多大能量。 易经乾卦中的终日乾乾,说的就是这个意思,终日指的是持续不断,意味着不能三天打鱼两天晒网,有了开头没有结尾,乾乾代表着产出,要有价值、有思考、有进阶,不能只做重复工作,毕竟在易经中,乾代表天,想完成立足到产出的关键跃升,以下这4个动作一定要做好。 1、产出有价值的成果。 立足期是你独立承担任


SpringBoot实现隐式参数注入
风象南2025/11/10

前言:一个痛点 想象一下这样的场景:用户请求带着 JWT Token 进入你的系统,Filter 层面解析 Token 得到用户 ID,接下来需要: 在 Controller 层获取用户信息 在 Service 层进行权限验证 在某些业务逻辑中记录操作日志 每一个环节都需要知道"当前用户是谁",看看目前常用的解决方案。 传统方案的"缺陷" 方案一:ThreadLocal // 看起来很"Hack" private static final ThreadLocal<Long> currentU


Python实战:用高德地图API批量获取地址所属街道并写回Excel
程序员爱钓鱼2025/11/8

在日常的数据处理工作中,我们经常需要根据公司、事件或门店的注册地址,批量获取其所在的街道信息,例如“浦东新区张江镇”“徐汇区龙华街道”等。 手动查询显然低效,而借助 Python + 高德地图API,我们可以轻松实现自动化批量查询并将结果写入 Excel 文件中。 本文将完整展示一个从 Excel 读取地址 → 调用高德API → 获取街道 → 写回Excel的实用脚本,并讲解实现细节与优化思路。 一、功能概述 这段脚本的功能可以总结为四步: 从 Excel 文件中读取地址数据; 调用高德


HTML中JS监听输入框值的即时变化
雨过天晴而后无语2025/11/5

一、说明         上一篇文章中提到了需要监听页面的一些组件内容变化,以便于更好的判断页面是否有更改,而控制“确定”按钮。         本里以JS监听输入框值的即时变化为引子,对这样的需求进行一个示例。 二、示例代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmln


pdf文件上传下载记录
家有两宝,感恩遇见2025/10/31

一:上传单个pdf文件并用hash重命名及判断文件是不是已经上传过,可以参考hash图片 @PostMapping("/uploadPdfFileSingle")     public String uploadPdfFileSingle(@RequestPart("file") MultipartFile file) {         System.err.println("开始文件上传");         if (file.isEmpty()) {             System


Redis(91)Redis的访问控制列表(ACL)是如何工作的?
Victor3562025/10/29

Redis 6.0及以上版本支持访问控制列表(ACL),这允许更细粒度地控制不同用户的权限。ACL使得可以定义多个用户,每个用户有自己的一组权限,这些权限可以控制哪些命令可以执行,哪些键可以访问等。以下是Redis ACL的详细工作原理和示例代码。 1. 基本概念 用户:Redis的每一个用户都有一个唯一的名字。 权限:每个用户可以被授予一组权限,这些权限定义了用户可以执行哪些命令和访问哪些键。 认证:用户在连接Redis时需要提供用户名和密码进行认证。 2. 配置ACL 可以在Redis配


Java Stream流两大实战陷阱:并行流Parallel误用、List转Map时重复键异常
IT橘子皮2025/10/26

在Java 8引入的Stream API极大地简化了集合操作,让函数式编程在Java世界中大放异彩。然而,在实践中发现的,Stream API并非银弹,其中隐藏着一些容易踩坑的陷阱。本文将深入分析Stream流中最常见的两大问题:并行流的误用和List转Map时的重复键异常,并提供相应的解决方案。 一、并行流(parallel)的陷阱与优化方案 1.1 问题本质分析 并行流看似是性能优化的"神器",但实践表明,盲目使用parallel()可能适得其反: // 看似高效的并行处理,实则是性能陷阱


C 语言标准库头文件 locale.h
hubenchang05152025/10/23

#C 语言标准库头文件 locale.h 请查看 C 语言标准库头文件列表 了解更多相关 API。 这个头文件提供 本地化 的相关功能,例如设置数字和货币的格式。 设置语言环境需要操作系统支持,通常需要安装语言包。 例如: sudo apt install language-pack-zh-hans # 安装中文语言包 #类型 类型标准说明lconvC89格式化详细信息 #宏 宏标准说明NULLC89空指针常量 本地化类别宏标准说明LC_ALLC89整个 C 语言环境LC_COLLATE


火狐浏览器替换js脚本
绘梨衣の沉默2025/10/22

一、概述 本教程使用火狐浏览器演示替换前端js脚本的操作步骤。 为了方便演示,教程中使用此页面作为案例进行讲解: https://www.leavescn.com/files/demos/1-snow/snow.html 这是一个使用js代码实现的展示下雪特效的页面,如下图所示: 本教程主要演示js代码的替换过程,对于功能复杂的网站,前端包含诸多js文件,需要具备一定的js基础,能够读懂源码后才能找到你需要替换的那个js文件。 二、步骤 使用火狐浏览器打开此网页,然后按下F12键打


Redis(75)Redis分布式锁的性能如何优化?
Victor3562025/10/21

优化Redis分布式锁的性能可以从多个方面入手,包括减少锁的粒度、使用Lua脚本来确保原子操作、优化网络通信、提高Redis服务器的性能,以及优化锁的实现逻辑等。以下是一些常见的性能优化方法,并结合代码进行详细解释。 1. 减少锁的粒度 锁的粒度越小,竞争的机会就越少,从而提高系统的并发性能。比如,将全局锁拆分为多个局部锁。 // 假设我们有多个资源需要加锁,可以为每个资源设置不同的锁 public class FineGrainedRedisLock { private Jedis j

首页编辑器站点地图

Copyright © 2025 聚合阅读

License: CC BY-SA 4.0