如何获取图书元数据?

Sak*_*eth 25 database search amazon google-books

我的应用程序需要根据提供的ISBN,标题或作者检索有关任何已发布图书的信息.这不是一个独特的要求---像Amazon.com,Chegg.com这样的网站,甚至像Book Collector这样的软件似乎都能够轻松地做到这一点.但我无法复制它.

为了澄清,我不需要搜索整个书籍数据库 - 只有已经输入的有限子集,如书籍集.数据库只是允许我用必要的元数据标记输入的书籍,以便能够搜索该书籍子集.所以规模不是问题 - 获取元数据是.

我尝试的选项是:

  1. 刮亚马逊.刮掉常规的亚马逊页面并不像缺少作者那样强大,虽然抓取较小的移动页面速度更快,但他们在提取的稳健性方面存在相同的问题.此外,将其构建到应用程序中明显违反了亚马逊的服务条款.
  2. 刮掉国会图书馆.虽然这似乎有较少的法律后果,但又是问题的简单性和稳健性.
  3. ISBNdb.com API.尽管该服务是免费的,并且能够很好地返回必要的元数据,但我需要每天为500多本书执行此操作,此时此服务的使用成本与使用成比例.我更喜欢免费或一次性付款解决方案,允许我这样做.
  4. Google图书数据API.虽然这似乎提供了我需要的信息,但我无法按照他们的服务条款要求显示图书预览.
  5. 购买书籍数据库的许可证.例如,像Ingram或Baker&Taylor这样的公司向零售商和图书馆提供这些目录.这个解决方案显然很昂贵,所以我希望有一个我错过的更优雅的解决方案.但如果没有,并且SO上的某个人对某个特定数据库有很好的体验,我愿意接受它.

我试图详细描述我的方法,所以书籍较少的人可以利用上述解决方案.但鉴于我的要求,我在检测书籍元数据方面的斗智尽头,所以任何指针都非常受欢迎.

aki*_*ira 5

由于您不太可能每天检索相同的 500 本书:将从 isbndb.com 检索到的数据存储在数据库中,并逐本书填充它。