Show HN:一颗用高斯泼溅做出来的草莓
文章摘要
这是一个让 HN 当天炸锅的小作品——SuperSplat 上由用户 danylyon 上传的一颗草莓的 3D 高斯泼溅(Gaussian Splat)模型。点开链接,你可以在浏览器里 360 度旋转、缩放、近距离观察这颗草莓——表面的颗粒、果肉的透光、籽窝周围那一圈微微泛白的红,全部以一种近乎”湿润”的真实感呈现。文件大小只有 22.94 MB,含 56.6K 个 splats(高斯椭球体)。
拍摄过程透着工业级的耐心。作者用 Nikon Z8 全画幅相机、Laowa 180mm 微距镜头、LED 灯加蓝幕,从 90 个不同角度对草莓进行拍摄,每个角度还做 88 张焦点堆叠(focus stacking)——也就是说总共约 7920 张原始照片。处理流程用 COLMAP 做 SfM 和数据集构建,再用开源训练框架 slang-splat 训练得到最终模型。作者甚至在 Patreon 上免费开放了原始 COLMAP 数据集,允许任何人重新训练或在此之上继续加工。
为什么这件事让人惊叹?高斯泼溅是 2023 年由 INRIA 团队提出的实时渲染新范式,用大量 3D 高斯椭球代替三角网格来表达场景。它在静态场景重建上已经把 NeRF 类方案的渲染速度从”分钟级”压到”60+ FPS 实时”,但绝大多数公开案例展示的都是大场景——街景、房间、雕塑。把它用在一颗直径 2 厘米的小物体上、还要展现微距级的细节,是相对少见的方向,也意味着对采集精度和重建质量的考验完全不同。
整篇 Show HN 没有长篇说明,但一颗草莓本身就是论据。
HN 评论精华
-
ovenchips:一句感慨成了高赞——”我 2011 年做 PlayCanvas 是为了驱动电子游戏的。结果到了 2026 年它在驱动草莓。”WebGL 引擎被高斯泼溅的浪潮带到了完全没料到的应用方向。
-
Tade0:道出了高斯泼溅最让人着迷的特质——降级方式。“不像传统 LoD 那样从球变成立方体、有一道硬切换,splats 会变得越来越’梦幻’——基本轮廓还在,只是细节越来越少。”他贴了一个森林场景:往树近处走的时候,画面会像现实的织物被一点点拆开一样模糊化。
-
Vinnl:替很多人问出了那个问题——”我看了 Wikipedia 但还是没搞清楚我在看什么。是从大量照片重建出来的 3D 模型吗?”答案大致是——是,但比传统摄影测量精细得多,每个高斯椭球还带颜色、透明度和方向性。
-
sovok:推荐 Apple 开源的 ml-sharp——可以从单张图片直接生成高斯泼溅,M1 Pro 上约 30 秒一次。代价是权重 2.6GB 太大、移动幅度大就崩,但用来做”轻微摇头”或者 VR 中给第二只眼睛补一个视差视角,效果远超传统的”深度图 + 顶点着色器”路线。
-
ArekDymalski(外行问出关键问题):”高斯泼溅可能支持动态光照吗?”这是当前研究热点之一——纯几何 + 颜色 baked 的 splats 很难重打光,但可分解材质属性的”PBR splats”方向正在快速进展。
-
Centigonal(许可证警察):指出页面的措辞有法律隐患——作者写”以 CC BY 发布,但署名是 appreciated 而非 required”。Centigonal 提醒:CC BY 的 BY 是不可弃权的,想让署名变可选,应该用 CC0 然后请求署名,而不是”CC BY 但忽略 BY”。
-
painted-now(眼尖派):观察到外层”红色区域围着籽窝”在视觉上有点不对劲——好像最外层表面是半透明的,让里层颜色透了出来。evrimoztamur 接力提问:这究竟是 splatting 过程的伪影,还是草莓表皮真实的次表面散射光学?无人定论,但讨论本身就揭示了 splats 在亚毫米级细节上的极限。
-
ImJasonH:把话题带向动态高斯泼溅——文件体积惊人地小、FPS 任意调,但目前采集要一整套高造价多相机阵列。他畅想以后可以这样看演唱会——任意位置自由穿梭于舞台和观众之间。
-
chimpanzee2 / ivolimmen:在 SuperSplat 平台一头扎进了别人的作品里出不来——”这是个时间杀手……”几条评论变成了互相安利其他 splat 场景。这也侧面证明了一个有趣的现象:高斯泼溅正在把”3D 模型分享”做成一个可消遣的内容社区,而不只是工程师专用工具。