GAE - 如何生活没有加入?

Sam*_*Sam 13 python google-app-engine join google-cloud-datastore

示例问题:

实体:

  • 用户包含姓名和朋友列表(用户参考)
  • 博客文章包含标题,内容,日期和作者(用户)

需求:

我想要一个显示标题的页面以及用户朋友最近10篇帖子的博客链接.我还希望能够继续回溯旧条目.

SQL解决方案:

所以在sql land中它会是这样的:

select * from blog_post where user_id in (select friend_id from user_friend where user_id = :userId) order by date

我能想到的GAE解决方案是:

  • 加载用户,遍历好友列表并加载他们最新的博客帖子.最后合并所有博客文章,找到最新的10篇博客文章
  • 在博客文章中列出了将作者作为朋友的所有用户的列表.这将意味着简单的阅读,但在添加拥有大量博客帖子的朋友时会导致配额超载.

我不相信这些解决方案中的任何一个都会扩展.

我确定其他人已经遇到了这个问题,但我已经搜索过,观看谷歌io视频,阅读其他代码......我缺少什么?

Nic*_*son 13

如果你看看你提供的SQL解决方案将如何执行,它将基本上像这样:

  1. 获取当前用户的朋友列表
  2. 对于列表中的每个用户,启动对最近帖子的索引扫描
  3. 合并 - 加入步骤2中的所有扫描,当您检索到足够的条目时停止

您可以在App Engine中自己执行完全相同的过程,方法是将Query实例用作迭代器并对它们进行合并连接.

你是对的,这对于大量的朋友来说不会很好地扩展,但它会遇到与SQL实现完全相同的问题,它也不会掩盖它们:获取最新的20个(例如)条目大致成本O(n log n)工作,其中n是朋友的数量.


Sam*_*Sam 7

Google io话题中介绍了此主题:http: //code.google.com/events/io/sessions/BuildingScalableComplexApps.html

基本上Google团队建议使用列表属性以及他们称之为关系索引实体的内容,可以在此处找到示例应用程序:http://pubsub-test.appspot.com/