我正在建立一个网站,对IT问题进行分类.
如何获取stackoverflow上使用的所有标记的内容?
我需要使用相同内容的相同标记功能,但需要单独使用.
如何提取所有标签的内容?(应该是几千)
And*_*ndy 11
您可以使用Stack Exchange Data Explorer收集此类信息.
下面的查询将提取所有标签,摘录及其维基内容:
select
t.tagName,
e.body as 'Excerpt',
w.body as 'WikiBody'
from tags t
left join Posts e
on t.ExcerptPostId = e.Id
left join Posts w
on t.WikiPostId = w.Id
order by t.tagName
Run Code Online (Sandbox Code Playgroud)
在这篇文章的时候,这将返回42,553行.
请注意,并非所有标签都有摘录或维基内容.
我根据安迪的答案进行了开发,并收集了每个标签的同义词:
select e.id,
count(t.tagName),
string_agg(TagSynonyms.SourceTagName, ',') as synonyms,
t.tagName,
e.body as 'Excerpt',
w.body as 'WikiBody'
from tags t
left join Posts e
on t.ExcerptPostId = e.Id
left join Posts w
on t.WikiPostId = w.Id
left join TagSynonyms
on TagSynonyms.TargetTagName = t.tagName
group by t.tagName, e.body, w.body, e.id
order by count(t.tagName) desc
Run Code Online (Sandbox Code Playgroud)
链接在这里。
| 归档时间: |
|
| 查看次数: |
931 次 |
| 最近记录: |