标签: reddit

针对特定文章的评论的 Reddit 端点

我正在尝试获取特定文章的所有 reddit 评论。

在 Reddit API 页面上，似乎表明：

www.reddit.com/r/subreddit/comments/ARTICLE

Run Code Online (Sandbox Code Playgroud)

会给我这些结果（文章是一个变量），但是如果我转到评论后附加文章的端点，我得到的只是 404 错误。

如何通过 Reddit API 获取特定文章的评论？

我用 Javascript 来做这件事，但这显然是一个与语言无关的问题。

endpoints reddit

Cec*_*uez

lucky-day

4
推荐指数

1
解决办法

1062
查看次数

bigquery中如何进行子查询？

我正在尝试使用 bigquery 上的 reddit 数据，并且希望在一行中看到评论和回复。我看到 bigquery 支持子查询，但我无法构建查询。由于数据的结构，我必须使用子查询来自连接同一个表，特别是我想将 id 和parent_id 连接在一起，但我需要先修改 id 才能连接。这是我尝试执行查询的方式：

SELECT 
  p.subreddit, 
  p.body AS first_body,
  p.score AS first_score,
  CONCAT('t1_',p.id) AS first_id ,
  c.last_body,
  c.last_score,
  c.last_id 
FROM 
[fh-bigquery:reddit_comments.2016_01] p,
(
  SELECT 
    body AS last_body,
    score AS last_score,
    CONCAT('t1_',id) AS last_id,
    parent_id,
    author,
    body 
  FROM  [fh-bigquery:reddit_comments.2016_01] 
  WHERE body != '[deleted]' 
  AND author != '[deleted]' 
  AND score > 1
)  c
WHERE  p.first_id = c.parent_id  
AND p.score > 1 
AND  p.author != '[deleted]' 
AND p.body != '[deleted]';

Run Code Online (Sandbox Code Playgroud)

我得到的错误是：

Field 'c.parent_id' not …

Run Code Online (Sandbox Code Playgroud)

sql subquery reddit bigdata google-bigquery

jas*_*jas

2017 09-23

4
推荐指数

1
解决办法

2万
查看次数

有没有办法以编程方式批量订阅特定列表中的所有子reddit（没有内置方法可以做到这一点）

目前，列表以回车符分隔，也以“(break)”分隔，但当然它可以是任何其他格式，例如 csv。管他呢。

希望这里有人能帮助我。我在谷歌上搜索试图找到解决方案，但我一生都找不到，我一定在搜索中遗漏了一些东西！我很惊讶没有人会喜欢这个功能。

scripting google-chrome reddit web firefox-addon-webextensions

wyv*_*wes

lucky-day

4
推荐指数

1
解决办法

1508
查看次数

如何解决与 zstandard 中使用的帧相关的错误，该错误需要太多内存进行解码

要下载与问题和答案相关的数据，我按照facebook/ELI5上的脚本进行操作。

那里说运行命令：python download_reddit_qalist.py -Q。运行此命令时，我在 python 文件“download_reddit_qalist.py”中的第 70 行收到错误，其中枚举了 zstandardDecompressor 对象。错误日志说：

zstd.ZstdError：Zstd解压缩错误：帧需要太多内存来解码

考虑到内存问题，我为容器分配了 32 GB 内存和 8 个 CPU。但错误仍然存在。

当我用 ElementTree.iterparse() 替换枚举函数时，除了此错误之外，还会出现另一条消息：

对于 ET.iterparse(f) 中的 i、l：

文件“/anaconda3/lib/python3.8/xml/etree/ElementTree.py”，第 1229 行，迭代器中

数据 = 源.read(100 * 2048)

zstd.ZstdError：zstd解压缩错误：帧需要太多内存来解码

有人面临类似的错误吗？我在 slurm 集群上运行着 docker 容器。如果您需要更多信息，请告诉我。

nlp reddit nlp-question-answering

aks*_*tia

2021 09-21

4
推荐指数

1
解决办法

3220
查看次数

使用PHP返回reddit中的链接列表

只是想知道是否有人有示例代码来返回reddit的前25个链接(使用PHP).在JSON或XML中.我无法绕过API ...并且很少使用python.

php reddit

Gle*_*020

lucky-day

3
推荐指数

1
解决办法

1214
查看次数

有一行Reddit的代码(排名功能)让我感到困惑

代码来自此页面:https: //github.com/reddit/reddit/blob/master/r2/r2/lib/db/_sorts.pyx

这是代码片段:

cpdef double epoch_seconds(date):
"""Returns the number of seconds from the epoch to date. Should
   match the number returned by the equivalent function in
   postgres."""
td = date - epoch
return td.days * 86400 + td.seconds + (float(td.microseconds) / 1000000)

Run Code Online (Sandbox Code Playgroud)

我觉得td.days * 86400应该等于td.seconds还有(float(td.microseconds) / 1000000),我想知道为什么他们不只是让td.seconds乘以3？

python reddit

sil*_*ent

lucky-day

3
推荐指数

1
解决办法

180
查看次数

Reddit Search API URL？

我正在尝试使用reddit的api实现搜索,但是没有太多运气:

http://www.reddit.com/search.json?q=ferrari?jsonp=?

Run Code Online (Sandbox Code Playgroud)

它返回一些json格式的文本但没有结果..如果我搜索"cars",它返回2个结果,我的其余代码将无法识别对象.(另外,我知道汽车的结果超过2个).有关如何修改URL的任何想法？

javascript api search json reddit

mic*_*eez

lucky-day

3
推荐指数

1
解决办法

9961
查看次数

在Reddit上找到用户karma

我正在尝试创建一个应用程序,向查看器显示有关目标Reddit用户的有用信息.一切都顺利进行,直到我意识到人们可能想要看到用户的业力.

为了让自己更有趣和更具挑战性,我决定不使用PRAW,Python Reddit API Wrapper,而是使用urllib.request和xml.etree.ElementTree手动解析xml.

但是,有一个问题.我已经看过无处不在给出的XML(作为一个例子,用户reddit的).在我试过的每一页上,链接和用户的业力都无处可见.有谁知道找到这种难以捉摸的业力的方法？

如果有人能解决我的问题而不包括PRAW,我会很高兴.谢谢!

python xml reddit

Mat*_*tir

2014 11-23

3
推荐指数

1
解决办法

760
查看次数

有没有办法通过网址在reddit上提交文本帖子

我知道有办法向reddit提交链接帖子.

https://www.reddit.com/r/test/submit?title=myTitle&url=http://www.exampledsfsd.com

Run Code Online (Sandbox Code Playgroud)

弹出一个这样的页面,标题和网址填写

有没有办法开始提交文本帖子？它真的只需要到"文本"选项卡并填写此页面中的"文本"字段

为了清楚起见,我知道Reddit API.我不想采取需要设置reddit帐户,reddit应用程序以及管理用户身份验证的方法.我实际上已经尝试过这种方法,但是在我网站的其他方面使用它时存在问题.我正在寻找像上面的提交链接帖一样简单的东西

kan*_*ane

2015 09-10

3
推荐指数

2
解决办法

2625
查看次数

如何使用GSON将空字符串视为空对象？

我正在从Reddit API中检索评论.该模型具有线程,以便每个注释可以在内部具有注释列表,命名为回复.以下是JSON响应的外观示例:

[
   {
      "kind":"Listing",
      "data":{
         "children":[
            {
               "data":{
                  "body":"comment",
                  "replies":{
                     "kind":"Listing",
                     "data":{
                        "children":[
                           {
                              "data":{
                                 "body":"reply to comment",
                                 "replies":""
                              }
                           }
                        ]
                     }
                  }
               }
            }
         ]
      }
   }
]

Run Code Online (Sandbox Code Playgroud)

以下是我使用POJO进行建模的方法.上述响应将被视为CommentListings列表.

public class CommentListing {
    @SerializedName("data")
    private CommentListingData data;
}

public final class CommentListingData {
    @SerializedName("children")
    private List<Comment> comments;
}

public class Comment {
    @SerializedName("data")
    private CommentData data;
}

public class CommentData {
    @SerializedName("body")
    private String body;

    @SerializedName("replies")
    private CommentListing replies;
}

Run Code Online (Sandbox Code Playgroud)

注意底层CommentData POJO如何引用另一个名为"replies"的CommentList.

此模型有效,直到GSON到达最后一个没有回复的子CommentData.API不提供null,而是提供空字符串.当然,这会导致GSON异常,它需要一个对象但却找到一个String: