Ask an Astronaut:333 小时宇航员问答的可搜索数据库

查看原文 HN 讨论

文章摘要

Ask an Astronaut 是开发者 Ben Feist(同时是 ISS in Real Time 项目作者)的新作品。他把 NASA、ESA 和 Roscosmos 多年来公开发布的宇航员”问答片段”——也就是地面学校、媒体、公众活动里向在轨宇航员提问的视频——总共约 333 小时素材做了语音识别、转录、按问题语义切片,再用嵌入(embedding)做语义搜索,最终变成一个可搜索的”宇航员问答数据库”:你打一个问题,比如”在太空打喷嚏会怎样”,网站会列出所有相关的视频片段,配上字幕、跳到那一秒。

技术栈上,作者用 WhisperX 做了音素对齐(phoneme alignment)——这是 WhisperX 比普通 Whisper 多出的能力,能精确到单词级别的时间戳,从而让”跳到回答开始的那一秒”成为可能。再用嵌入向量给每段切片打索引,前端是一个轻量的浏览界面,移动端也能用。整个 pipeline 在 GitHub 上开源(github.com/bfeist/ask-an-astronaut),但视频本体接近 1TB,所以网站只是索引器,作者建议感兴趣的人自己跑 pipeline 重建一份。

典型的使用场景:教师课前花 5 分钟找到 NASA 宇航员真人讲”水在零重力下怎样运动”,比看 NASA 官方剪辑高效得多;记者要写一篇关于太空辐射的文章,可以直接搜出 8 位不同宇航员的回答做交叉验证;爱好者想知道”国际空间站的厕所怎么用”,会发现这是被问过数百次的问题,答案出自不同年代的不同人,对比起来颇有趣味。视频内容来自十几年的素材,目前只支持英语搜索,多语种支持因为字幕配音的复杂性被作者暂时搁置。

HN 评论精华