AI 帮助 OldNYC 新增一万张历史照片

查看原文 HN 讨论

文章摘要

这篇来自 Dan Vanderkam 博客的文章详细介绍了 OldNYC 项目的最新进展——如何利用 AI 技术为这个纽约历史照片地图网站新增了约一万张照片。OldNYC(oldnyc.org)是一个将纽约公共图书馆(NYPL)数字化收藏的历史照片与其拍摄地点在地图上进行关联展示的项目,让用户可以通过交互式地图浏览纽约市各个角落的历史影像。

文章的核心亮点在于 AI 技术的应用方式。与许多人最初担心的不同,作者并没有使用 AI 来生成或修改照片,而是将 AI 用于一个更加务实和有价值的目的:更好地确定照片的拍摄位置。纽约公共图书馆的历史照片档案中,很多照片的元数据(包括位置信息和描述文字)是手写的,字迹潦草且年代久远,人工转录极为困难。作者利用 AI 的 OCR(光学字符识别)能力来识别这些难以辨认的手写文字,从而提取出照片的地理位置信息,将原本无法在地图上定位的照片成功关联到了具体的街道和位置。

这种 AI 应用代表了一种非常务实且负责任的技术使用方式——不是用 AI 来创造虚假内容,而是用它来处理和组织已有的真实历史资料。通过 AI 辅助的批量处理流水线,项目能够高效地处理大量历史档案,将原本需要大量人工才能完成的转录和位置标注工作自动化。这使得 OldNYC 的覆盖范围大幅扩展,为历史爱好者和研究者提供了更丰富的资源。

项目还提供了创新的可视化方式,让用户可以在现代地图上浏览一个世纪前的纽约街景,感受城市的沧桑巨变。该帖在 HN 上获得了 147 分和 50 条评论,引发了关于 AI 在历史档案处理中应用的热烈讨论。

HN 评论精华

  1. TrackerFF:作为多个历史社群的活跃成员,他支持这种 AI 应用方式,但同时表达了对 AI 篡改历史照片的强烈担忧。他分享了一个亲身经历:一周前他和其他成员花了几个小时试图找到一栋 20 世纪初的建筑,因为有人上传了一张照片询问。他们翻阅了旧地图和报纸却一无所获,最后发现那张照片被 AI 放大处理过,AI 在过程中凭空添加了一些建筑。他指出 AI 放大和上色技术会从根本上改变照片内容,放大后细看简直是”噩梦般的画面”。

  2. crazygringo:坦言看到标题时的第一反应是”天哪不要,照片大概都是 AI 幻觉生成的吧…“但实际读完文章后发现非常酷——他们是用 AI 来更好地确定照片的拍摄位置,而非篡改照片本身。这条评论反映了当前公众对 AI 的普遍警惕心态。

  3. thadt:分享了 AI 在处理历史数据方面的另一个成功案例。他上个月采访了德国日记档案馆的一位志愿者,该档案馆正在使用有监督的 AI 进行日记转录。将古老的个性化手写体转换为文本是一项艰巨的工作,即使对经验丰富的转录员也是如此。能够自动化处理初稿(第一遍)极大地提升了处理效率。

  4. AIorNot:指出了一个有趣的现象——作者发布了一个非常酷的 AI 应用来过滤、组织和 OCR 识别大量照片集的难读文字,但评论区的大多数讨论(包括最高票评论)却都在谈论 AI 图像有多糟糕、AI 如何篡改历史等话题,而作者根本没有做这些事情。他认为这更多反映了当前社区对 AI 的心态,而非技术本身。

  5. brrrrrm:通过实际验证发现,他熟悉的 3 个地点中有 1 个标注是错误的,并提供了具体的错误案例。他同时推荐了另一个类似项目 1940s.nyc,供对纽约历史影像感兴趣的人参考。