是否有一个 API 可以检索特定集合(即子集合)的项目?
movies示例:可以从 https://archive.org/details/movies检索集合的 HTML ,从https://archive.org/metadata/movies/检索 JSON/meta 。然而,JSON 负载没有引用集合的子项(即子集合,如“ Arts & Music”、“ Community videos”等)。
我正在尝试构建一个围绕互联网存档 API 的包装器。API 信息相当稀疏[0][1][2]并且不完整。
注意:如果您的声誉高于 1500,请创建“internet-archive”标签
[0] http://blog.archive.org/2011/03/31/how-archive-org-items-are-structed/ [1] http://blog.archive.org/developers/
写完此回复后,我意识到这并不是您问题的真正答案,因为它不返回子集合,而是返回所有项目。我稍微编辑了我的答案以反映这一点,并将其保留以供将来参考。
我很难列出集合的所有项目 - 我尝试使用简单列表 API,但与文档library_of_atlantis中的示例不同,它不会返回我感兴趣的另一个集合的任何结果。
最终,我得到了 IA 团队的有用回复,建议进行高级搜索查询,例如:https://archive.org/advancedsearch.php ?q=collection:movies&fl[]=identifier&rows=100&page=1&output =json 。
可能有更好的方法来查找集合的所有子集合movies,但是如果您将fl[]=collection参数添加到查询中,它将返回每个项目所在的所有集合的列表。也许您可以收集集合名称从那里?
至于为什么简单列表 API 不起作用:显然并非所有集合都由 simplelist 填充(而*_simplelists.sqlite https://archive.org/download/library_of_atlantis的存在似乎表明集合确实使用 simplelist)。