标签: reddit

针对特定文章的评论的 Reddit 端点

我正在尝试获取特定文章的所有 reddit 评论。

在 Reddit API 页面上,似乎表明:

www.reddit.com/r/subreddit/comments/ARTICLE
Run Code Online (Sandbox Code Playgroud)

会给我这些结果(文章是一个变量),但是如果我转到评论后附加文章的端点,我得到的只是 404 错误。

如何通过 Reddit API 获取特定文章的评论?

我用 Javascript 来做这件事,但这显然是一个与语言无关的问题。

endpoints reddit

4
推荐指数
1
解决办法
1062
查看次数

bigquery中如何进行子查询?

我正在尝试使用 bigquery 上的 reddit 数据,并且希望在一行中看到评论和回复。我看到 bigquery 支持子查询,但我无法构建查询。由于数据的结构,我必须使用子查询来自连接同一个表,特别是我想将 id 和parent_id 连接在一起,但我需要先修改 id 才能连接。这是我尝试执行查询的方式:

SELECT 
  p.subreddit, 
  p.body AS first_body,
  p.score AS first_score,
  CONCAT('t1_',p.id) AS first_id ,
  c.last_body,
  c.last_score,
  c.last_id 
FROM 
[fh-bigquery:reddit_comments.2016_01] p,
(
  SELECT 
    body AS last_body,
    score AS last_score,
    CONCAT('t1_',id) AS last_id,
    parent_id,
    author,
    body 
  FROM  [fh-bigquery:reddit_comments.2016_01] 
  WHERE body != '[deleted]' 
  AND author != '[deleted]' 
  AND score > 1
)  c
WHERE  p.first_id = c.parent_id  
AND p.score > 1 
AND  p.author != '[deleted]' 
AND p.body != '[deleted]';
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

Field 'c.parent_id' not …
Run Code Online (Sandbox Code Playgroud)

sql subquery reddit bigdata google-bigquery

4
推荐指数
1
解决办法
2万
查看次数

有没有办法以编程方式批量订阅特定列表中的所有子reddit(没有内置方法可以做到这一点)

目前,列表以回车符分隔,也以“(break)”分隔,但当然它可以是任何其他格式,例如 csv。管他呢。

希望这里有人能帮助我。我在谷歌上搜索试图找到解决方案,但我一生都找不到,我一定在搜索中遗漏了一些东西!我很惊讶没有人会喜欢这个功能。

scripting google-chrome reddit web firefox-addon-webextensions

4
推荐指数
1
解决办法
1508
查看次数

如何解决与 zstandard 中使用的帧相关的错误,该错误需要太多内存进行解码

要下载与问题和答案相关的数据,我按照facebook/ELI5上的脚本进行操作。

那里说运行命令:python download_reddit_qalist.py -Q。运行此命令时,我在 python 文件“download_reddit_qalist.py”中的第 70 行收到错误,其中枚举了 zstandardDecompressor 对象。错误日志说:

zstd.ZstdError:Zstd解压缩错误:帧需要太多内存来解码

考虑到内存问题,我为容器分配了 32 GB 内存和 8 个 CPU。但错误仍然存​​在。

当我用 ElementTree.iterparse() 替换枚举函数时,除了此错误之外,还会出现另一条消息:

对于 ET.iterparse(f) 中的 i、l:

文件“/anaconda3/lib/python3.8/xml/etree/ElementTree.py”,第 1229 行,迭代器中

数据 = 源.read(100 * 2048)

zstd.ZstdError:zstd解压缩错误:帧需要太多内存来解码

有人面临类似的错误吗?我在 slurm 集群上运行着 docker 容器。如果您需要更多信息,请告诉我。

nlp reddit nlp-question-answering

4
推荐指数
1
解决办法
3220
查看次数

使用PHP返回reddit中的链接列表

只是想知道是否有人有示例代码来返回reddit的前25个链接(使用PHP).在JSON或XML中.我无法绕过API ...并且很少使用python.

php reddit

3
推荐指数
1
解决办法
1214
查看次数

有一行Reddit的代码(排名功能)让我感到困惑

代码来自此页面:https: //github.com/reddit/reddit/blob/master/r2/r2/lib/db/_sorts.pyx

这是代码片段:

cpdef double epoch_seconds(date):
"""Returns the number of seconds from the epoch to date. Should
   match the number returned by the equivalent function in
   postgres."""
td = date - epoch
return td.days * 86400 + td.seconds + (float(td.microseconds) / 1000000)
Run Code Online (Sandbox Code Playgroud)

我觉得td.days * 86400应该等于td.seconds还有(float(td.microseconds) / 1000000),我想知道为什么他们不只是让td.seconds乘以3?

python reddit

3
推荐指数
1
解决办法
180
查看次数

Reddit Search API URL?

我正在尝试使用reddit的api实现搜索,但是没有太多运气:

http://www.reddit.com/search.json?q=ferrari?jsonp=?
Run Code Online (Sandbox Code Playgroud)

它返回一些json格式的文本但没有结果..如果我搜索"cars",它返回2个结果,我的其余代码将无法识别对象.(另外,我知道汽车的结果超过2个).有关如何修改URL的任何想法?

javascript api search json reddit

3
推荐指数
1
解决办法
9961
查看次数

在Reddit上找到用户karma

我正在尝试创建一个应用程序,向查看器显示有关目标Reddit用户的有用信息.一切都顺利进行,直到我意识到人们可能想要看到用户的业力.

为了让自己更有趣和更具挑战性,我决定不使用PRAW,Python Reddit API Wrapper,而是使用urllib.request和xml.etree.ElementTree手动解析xml.

但是,有一个问题.我已经看过无处不在给出的XML(作为一个例子,用户reddit的).在我试过的每一页上,链接和用户的业力都无处可见.有谁知道找到这种难以捉摸的业力的方法?

如果有人能解决我的问题而不包括PRAW,我会很高兴.谢谢!

python xml reddit

3
推荐指数
1
解决办法
760
查看次数

有没有办法通过网址在reddit上提交文本帖子

我知道有办法向reddit提交链接帖子.

https://www.reddit.com/r/test/submit?title=myTitle&url=http://www.exampledsfsd.com
Run Code Online (Sandbox Code Playgroud)

弹出一个这样的页面,标题和网址填写

在此输入图像描述

有没有办法开始提交文本帖子?它真的只需要到"文本"选项卡并填写此页面中的"文本"字段

在此输入图像描述

为了清楚起见,我知道Reddit API.我不想采取需要设置reddit帐户,reddit应用程序以及管理用户身份验证的方法.我实际上已经尝试过这种方法,但是在我网站的其他方面使用它时存在问题.我正在寻找像上面的提交链接帖一样简单的东西

reddit

3
推荐指数
2
解决办法
2625
查看次数

如何使用GSON将空字符串视为空对象?

我正在从Reddit API中检索评论.该模型具有线程,以便每个注释可以在内部具有注释列表,命名为回复.以下是JSON响应的外观示例:

[
   {
      "kind":"Listing",
      "data":{
         "children":[
            {
               "data":{
                  "body":"comment",
                  "replies":{
                     "kind":"Listing",
                     "data":{
                        "children":[
                           {
                              "data":{
                                 "body":"reply to comment",
                                 "replies":""
                              }
                           }
                        ]
                     }
                  }
               }
            }
         ]
      }
   }
]
Run Code Online (Sandbox Code Playgroud)

以下是我使用POJO进行建模的方法.上述响应将被视为CommentListings列表.

public class CommentListing {
    @SerializedName("data")
    private CommentListingData data;
}

public final class CommentListingData {
    @SerializedName("children")
    private List<Comment> comments;
}

public class Comment {
    @SerializedName("data")
    private CommentData data;
}

public class CommentData {
    @SerializedName("body")
    private String body;

    @SerializedName("replies")
    private CommentListing replies;
}
Run Code Online (Sandbox Code Playgroud)

注意底层CommentData POJO如何引用另一个名为"replies"的CommentList.

此模型有效,直到GSON到达最后一个没有回复的子CommentData.API不提供null,而是提供空字符串.当然,这会导致GSON异常,它需要一个对象但却找到一个String:

"replies":""
Run Code Online (Sandbox Code Playgroud)

预计BEGIN_OBJECT但是STRING …

java json reddit gson

3
推荐指数
1
解决办法
2366
查看次数