我在一些浏览器中看到过(例如Firefox),只有当页面包含RSS/Atom提要时才会激活RSS提要图标.浏览器如何检测页面是否包含Feed?
当RSS客户端遇到具有相同guid /标识符的多个项目的订阅源时,它应具有的正确响应是什么?
目前在我的应用程序中,任何使用现有guid的项目都不会被缓存或显示,因为它认为它已经拥有该项目.
在此示例Feed中,许多项目共享此ID:
tag:blizzard.com,2010-10-22:diablo3:feed:en-us:1
Run Code Online (Sandbox Code Playgroud) 我已使用以下代码成功将我的Gmail Atom Feed添加到组织文件中
(setq org-feed-alist
'(("Mail Entries"
"http://mail.google.com/mail/feed/atom"
"~/org/feeds.org" "Mail Entries"
:parse-entry org-feed-parse-atom-entry
:parse-feed org-feed-parse-atom-feed
:item-full-text
:template "* TODO %title\n %summary\n"
)))
Run Code Online (Sandbox Code Playgroud)
典型的Gmail Atom Feed如下所示:
<?xml version="1.0" encoding="UTF-8"?>
<feed version="0.3" xmlns="http://purl.org/atom/ns#">
<title>Gmail - Inbox for mail@gmail.com</title>
<tagline>New messages in your Gmail Inbox</tagline>
<fullcount>1</fullcount>
<link rel="alternate" href="http://mail.google.com/mail" type="text/html" />
<modified>2011-02-22T06:38:03Z</modified>
<entry>
<title>RE: URGENT URGENT</title>
<summary>Do this now or the world will end</summary>
<link rel="alternate" href="http://mail.google.com/mail?account_id=mail@gmail.com&message_id=654646578943541&view=conv&extsrc=atom" type="text/html" />
<modified>2011-02-21T21:30:18Z</modified>
<issued>2011-02-21T21:30:18Z</issued>
<id>tag:gmail.google.com,2003:104521846321321</id>
<author>
<name>me</name>
<email>mail@gmail.com</email>
</author>
</entry>
Run Code Online (Sandbox Code Playgroud)
当我点击Cc Cx g并输入我的凭据时,我会在我的.org文件中找到它
** TODO RE: …Run Code Online (Sandbox Code Playgroud) 我做了一些谷歌搜索,并没有找到任何完整的问题,但它是如此通用,必须有一些东西.
我需要为我的Django应用程序提供feed解析工具(我想从某处获取原子提要并存储其内容).我刚刚发现了一些feedparser.py引用,但实际的网站已经很久了.
你能提供一些指示吗?
该OData的规格为长。甚至“ OData Core ”文档也很长。
那么,对于只读OData发布者至少需要实现的内容的简要总结呢?
根据Google 的说法,包含 pubsubhubbub 中心 URL 的链接标签(这是一个非常糟糕的名称)需要位于 Atom 条目元素下,如下所示:
<?xml version="1.0" encoding="utf-8"?>
<feed xml:lang="en-GB" xmlns="http://www.w3.org/2005/Atom">
<!-- ... -->
<entry>
<link rel="hub" href="https://pubsubhubbub.appspot.com/" />
<!-- ... -->
</entry>
</feed>
Run Code Online (Sandbox Code Playgroud)
然而,我见过的所有实现和博客文章都将其添加到 feed 元素中,如下所示:
<?xml version="1.0" encoding="utf-8"?>
<feed xml:lang="en-GB" xmlns="http://www.w3.org/2005/Atom">
<!-- ... -->
<link rel="hub" href="https://pubsubhubbub.appspot.com/" />
<entry>
<!-- ... -->
</entry>
</feed>
Run Code Online (Sandbox Code Playgroud)
它的正确位置是什么?
如何解析XML/RSS提要并将其存储在数据库中.我有一组RSS提要解析并将它们存储在我的数据库表中.
有没有任何代码/教程可用于此.
请帮忙.
使用XDocument和Descendants方法.
//first problem 'entries' doesn't fetch at all
var entries = xmlDoc.Descendants(XName.Get("entry"))
//neither does
// xmlDoc.Descendants("entry")
var ids = from e in entries
select e.Element(XName.Get("id")).Value;
Run Code Online (Sandbox Code Playgroud)
相同的XDocument代码适用于更详细的博客提要,即我的博客:http://blog.nick.josevski.com/feed/一个片段在这里:http://pastebin.com/KU65dgwL其中'条目' element替换为'item','id'替换为'link'.
为了测试任何建议,我创建了一个演示该问题的LinqPad代码要点.
我错过了一些明显的东西吗 我已经试过的各种组合.Elements() .Elements("entry")和公正的.Descendants(),然后试图进一步筛选没有运气了.
这是我正在努力从以下位置提取入口/标识节点的XML:
<feed xmlns="http://www.w3.org/2005/Atom">
<title type="text">Author</title>
<subtitle type="text">subtitle</subtitle>
<link rel="alternate" href="http://www.site.com/blog" />
<entry>
<id>http://www.site.com/a-blog-post</id>
<title type="text">Title Of Blog Post</title>
...
<entry>
<id>http://www.site.com/another-blog-post</id>
<title type="text">Title Of Another Blog Post</title>
Run Code Online (Sandbox Code Playgroud) 我想使用Ruby的RSS类来解析Atom和RSS提要,因此我可以从中提取链接.如何区分代码中的两种类型?
我已经准备好了解析器响应.
response = RSS::Parser.parse(rss_url, false)
Run Code Online (Sandbox Code Playgroud) 原子供稿有效所需的最低限度标签是什么?我承认我尚未阅读完规范,但认为简短的摘要对我和任何寻求简短,清晰答案的人都是有益的。