← #789

AI 帮助 OldNYC 新增一万张历史照片

文章摘要

这篇来自 Dan Vanderkam 博客的文章详细介绍了 OldNYC 项目的最新进展——如何利用 AI 技术为这个纽约历史照片地图网站新增了约一万张照片。OldNYC（oldnyc.org）是一个将纽约公共图书馆（NYPL）数字化收藏的历史照片与其拍摄地点在地图上进行关联展示的项目，让用户可以通过交互式地图浏览纽约市各个角落的历史影像。

文章的核心亮点在于 AI 技术的应用方式。与许多人最初担心的不同，作者并没有使用 AI 来生成或修改照片，而是将 AI 用于一个更加务实和有价值的目的：更好地确定照片的拍摄位置。纽约公共图书馆的历史照片档案中，很多照片的元数据（包括位置信息和描述文字）是手写的，字迹潦草且年代久远，人工转录极为困难。作者利用 AI 的 OCR（光学字符识别）能力来识别这些难以辨认的手写文字，从而提取出照片的地理位置信息，将原本无法在地图上定位的照片成功关联到了具体的街道和位置。

这种 AI 应用代表了一种非常务实且负责任的技术使用方式——不是用 AI 来创造虚假内容，而是用它来处理和组织已有的真实历史资料。通过 AI 辅助的批量处理流水线，项目能够高效地处理大量历史档案，将原本需要大量人工才能完成的转录和位置标注工作自动化。这使得 OldNYC 的覆盖范围大幅扩展，为历史爱好者和研究者提供了更丰富的资源。

项目还提供了创新的可视化方式，让用户可以在现代地图上浏览一个世纪前的纽约街景，感受城市的沧桑巨变。该帖在 HN 上获得了 147 分和 50 条评论，引发了关于 AI 在历史档案处理中应用的热烈讨论。

HN 评论精华

TrackerFF：作为多个历史社群的活跃成员，他支持这种 AI 应用方式，但同时表达了对 AI 篡改历史照片的强烈担忧。他分享了一个亲身经历：一周前他和其他成员花了几个小时试图找到一栋 20 世纪初的建筑，因为有人上传了一张照片询问。他们翻阅了旧地图和报纸却一无所获，最后发现那张照片被 AI 放大处理过，AI 在过程中凭空添加了一些建筑。他指出 AI 放大和上色技术会从根本上改变照片内容，放大后细看简直是”噩梦般的画面”。
crazygringo：坦言看到标题时的第一反应是”天哪不要，照片大概都是 AI 幻觉生成的吧…“但实际读完文章后发现非常酷——他们是用 AI 来更好地确定照片的拍摄位置，而非篡改照片本身。这条评论反映了当前公众对 AI 的普遍警惕心态。
thadt：分享了 AI 在处理历史数据方面的另一个成功案例。他上个月采访了德国日记档案馆的一位志愿者，该档案馆正在使用有监督的 AI 进行日记转录。将古老的个性化手写体转换为文本是一项艰巨的工作，即使对经验丰富的转录员也是如此。能够自动化处理初稿（第一遍）极大地提升了处理效率。
AIorNot：指出了一个有趣的现象——作者发布了一个非常酷的 AI 应用来过滤、组织和 OCR 识别大量照片集的难读文字，但评论区的大多数讨论（包括最高票评论）却都在谈论 AI 图像有多糟糕、AI 如何篡改历史等话题，而作者根本没有做这些事情。他认为这更多反映了当前社区对 AI 的心态，而非技术本身。
brrrrrm：通过实际验证发现，他熟悉的 3 个地点中有 1 个标注是错误的，并提供了具体的错误案例。他同时推荐了另一个类似项目 1940s.nyc，供对纽约历史影像感兴趣的人参考。