我正在尝试获取特定文章的所有 reddit 评论。
在 Reddit API 页面上,似乎表明:
www.reddit.com/r/subreddit/comments/ARTICLE
Run Code Online (Sandbox Code Playgroud)
会给我这些结果(文章是一个变量),但是如果我转到评论后附加文章的端点,我得到的只是 404 错误。
如何通过 Reddit API 获取特定文章的评论?
我用 Javascript 来做这件事,但这显然是一个与语言无关的问题。
我正在尝试使用 bigquery 上的 reddit 数据,并且希望在一行中看到评论和回复。我看到 bigquery 支持子查询,但我无法构建查询。由于数据的结构,我必须使用子查询来自连接同一个表,特别是我想将 id 和parent_id 连接在一起,但我需要先修改 id 才能连接。这是我尝试执行查询的方式:
SELECT
p.subreddit,
p.body AS first_body,
p.score AS first_score,
CONCAT('t1_',p.id) AS first_id ,
c.last_body,
c.last_score,
c.last_id
FROM
[fh-bigquery:reddit_comments.2016_01] p,
(
SELECT
body AS last_body,
score AS last_score,
CONCAT('t1_',id) AS last_id,
parent_id,
author,
body
FROM [fh-bigquery:reddit_comments.2016_01]
WHERE body != '[deleted]'
AND author != '[deleted]'
AND score > 1
) c
WHERE p.first_id = c.parent_id
AND p.score > 1
AND p.author != '[deleted]'
AND p.body != '[deleted]';
Run Code Online (Sandbox Code Playgroud)
我得到的错误是:
Field 'c.parent_id' not …Run Code Online (Sandbox Code Playgroud) 目前,列表以回车符分隔,也以“(break)”分隔,但当然它可以是任何其他格式,例如 csv。管他呢。
希望这里有人能帮助我。我在谷歌上搜索试图找到解决方案,但我一生都找不到,我一定在搜索中遗漏了一些东西!我很惊讶没有人会喜欢这个功能。
scripting google-chrome reddit web firefox-addon-webextensions
要下载与问题和答案相关的数据,我按照facebook/ELI5上的脚本进行操作。
那里说运行命令:python download_reddit_qalist.py -Q。运行此命令时,我在 python 文件“download_reddit_qalist.py”中的第 70 行收到错误,其中枚举了 zstandardDecompressor 对象。错误日志说:
zstd.ZstdError:Zstd解压缩错误:帧需要太多内存来解码
考虑到内存问题,我为容器分配了 32 GB 内存和 8 个 CPU。但错误仍然存在。
当我用 ElementTree.iterparse() 替换枚举函数时,除了此错误之外,还会出现另一条消息:
对于 ET.iterparse(f) 中的 i、l:
文件“/anaconda3/lib/python3.8/xml/etree/ElementTree.py”,第 1229 行,迭代器中
数据 = 源.read(100 * 2048)
zstd.ZstdError:zstd解压缩错误:帧需要太多内存来解码
有人面临类似的错误吗?我在 slurm 集群上运行着 docker 容器。如果您需要更多信息,请告诉我。
只是想知道是否有人有示例代码来返回reddit的前25个链接(使用PHP).在JSON或XML中.我无法绕过API ...并且很少使用python.
代码来自此页面:https: //github.com/reddit/reddit/blob/master/r2/r2/lib/db/_sorts.pyx
这是代码片段:
cpdef double epoch_seconds(date):
"""Returns the number of seconds from the epoch to date. Should
match the number returned by the equivalent function in
postgres."""
td = date - epoch
return td.days * 86400 + td.seconds + (float(td.microseconds) / 1000000)
Run Code Online (Sandbox Code Playgroud)
我觉得td.days * 86400应该等于td.seconds还有(float(td.microseconds) / 1000000),我想知道为什么他们不只是让td.seconds乘以3?
我正在尝试使用reddit的api实现搜索,但是没有太多运气:
http://www.reddit.com/search.json?q=ferrari?jsonp=?
Run Code Online (Sandbox Code Playgroud)
它返回一些json格式的文本但没有结果..如果我搜索"cars",它返回2个结果,我的其余代码将无法识别对象.(另外,我知道汽车的结果超过2个).有关如何修改URL的任何想法?
我正在尝试创建一个应用程序,向查看器显示有关目标Reddit用户的有用信息.一切都顺利进行,直到我意识到人们可能想要看到用户的业力.
为了让自己更有趣和更具挑战性,我决定不使用PRAW,Python Reddit API Wrapper,而是使用urllib.request和xml.etree.ElementTree手动解析xml.
但是,有一个问题.我已经看过无处不在给出的XML(作为一个例子,用户reddit的).在我试过的每一页上,链接和用户的业力都无处可见.有谁知道找到这种难以捉摸的业力的方法?
如果有人能解决我的问题而不包括PRAW,我会很高兴.谢谢!
我知道有办法向reddit提交链接帖子.
https://www.reddit.com/r/test/submit?title=myTitle&url=http://www.exampledsfsd.com
Run Code Online (Sandbox Code Playgroud)
弹出一个这样的页面,标题和网址填写
有没有办法开始提交文本帖子?它真的只需要到"文本"选项卡并填写此页面中的"文本"字段
为了清楚起见,我知道Reddit API.我不想采取需要设置reddit帐户,reddit应用程序以及管理用户身份验证的方法.我实际上已经尝试过这种方法,但是在我网站的其他方面使用它时存在问题.我正在寻找像上面的提交链接帖一样简单的东西
我正在从Reddit API中检索评论.该模型具有线程,以便每个注释可以在内部具有注释列表,命名为回复.以下是JSON响应的外观示例:
[
{
"kind":"Listing",
"data":{
"children":[
{
"data":{
"body":"comment",
"replies":{
"kind":"Listing",
"data":{
"children":[
{
"data":{
"body":"reply to comment",
"replies":""
}
}
]
}
}
}
}
]
}
}
]
Run Code Online (Sandbox Code Playgroud)
以下是我使用POJO进行建模的方法.上述响应将被视为CommentListings列表.
public class CommentListing {
@SerializedName("data")
private CommentListingData data;
}
public final class CommentListingData {
@SerializedName("children")
private List<Comment> comments;
}
public class Comment {
@SerializedName("data")
private CommentData data;
}
public class CommentData {
@SerializedName("body")
private String body;
@SerializedName("replies")
private CommentListing replies;
}
Run Code Online (Sandbox Code Playgroud)
注意底层CommentData POJO如何引用另一个名为"replies"的CommentList.
此模型有效,直到GSON到达最后一个没有回复的子CommentData.API不提供null,而是提供空字符串.当然,这会导致GSON异常,它需要一个对象但却找到一个String:
"replies":""
Run Code Online (Sandbox Code Playgroud)
预计BEGIN_OBJECT但是STRING …