ISBN 可视化

原文 HN 讨论

文章摘要

Anna’s Archive(安娜档案馆)推出了一个 ISBN 可视化项目,旨在将全球已知的 ISBN(国际标准书号)数据以视觉化的方式呈现出来。这个项目的核心问题是:世界上到底存在多少书?有多少已经被数字化存档?接下来应该优先存档哪些书?

该可视化将每个像素对应约 2500 个 ISBN 号码,通过颜色编码和空间布局展示了整个 ISBN 空间的分布情况。由于 ISBN 号码本身具有空间相关性——它的编码结构包含了国家/地区信息、出版商信息和出版时间信息——因此可视化后可以清晰地看到不同国家和出版商的出版密度差异。

Anna’s Archive 为这个项目设立了 10,000 美元的悬赏,征集最佳可视化方案。最终获奖的方案提供了极为灵活的可视化选项,甚至支持自定义着色器(shader),拥有丰富的预设选项,并且性能流畅,配有巧妙的小地图导航功能。当用户将视图放大到最大倍率时,整个可视化看起来就像一个书架,每一个小格子代表一本书。

该项目目前已收录了约 1.01 亿本书的 ISBN 信息,涵盖了从传统纸质书到电子书的广泛范围。可视化还展示了哪些 ISBN 已经被 Anna’s Archive 收录了数字副本,哪些尚未被存档,从而帮助确定未来的存档优先级。项目还提供了一个数据集,描述了各 ISBN 被多少图书馆馆藏,以此衡量稀有程度。

HN 评论精华

关于可视化的实用价值:用户 krick 质疑该可视化除了展示语言分布外还有什么实际用途。项目创建者 phiresky 解释说,ISBN 的空间相关性使得可视化能够同时揭示国家、出版商和出版时间的分布模式,具有分析价值。

语言分布的意外发现:用户 kace91 发现西班牙语在可视化中的占比远低于其全球使用者人数所暗示的比例,这引发了关于出版产业不平等的讨论。

书籍总量的感叹:用户 rosstex 观察后认为全球书籍总量似乎比预期的少。但 squigz 反驳说,能够将 1.01 亿本书编目并可视化本身就是一项”不可思议的成就”。

设计细节的赞赏:FrustratedMonky 赞叹了一个精妙的设计细节——当视图放大到最大时,整个可视化呈现出书架的样子。

关于非英语内容的覆盖:shevy-java 指出 Anna’s Archive 对非英语技术书籍的覆盖存在偏差,特别是较新的作品。flexagoon 解释这取决于志愿者的贡献,而非平台本身的偏向,建议用户购买书籍后使用扫描服务来贡献内容。

替代资源:cdrini 推荐了 OpenLibrary 作为另一个有价值的参考资源。comrade1234 分享了自己通过 Anna’s Archive 试读后再购买实体书的使用模式。