stackoverflow中使用的所有标记的列表

Jac*_*sel 5 stackexchange-api

我正在建立一个网站,对IT问题进行分类.

如何获取stackoverflow上使用的所有标记的内容?

我需要使用相同内容的相同标记功能,但需要单独使用.

如何提取所有标签的内容?(应该是几千)

And*_*ndy 11

您可以使用Stack Exchange Data Explorer收集此类信息.

下面的查询将提取所有标签,摘录及其维基内容:

select 
  t.tagName,
  e.body as 'Excerpt',
  w.body as 'WikiBody'
from tags t
left join Posts e
  on t.ExcerptPostId = e.Id
left join Posts w
  on t.WikiPostId = w.Id
order by t.tagName
Run Code Online (Sandbox Code Playgroud)

在这篇文章的时候,这将返回42,553行.

请注意,并非所有标签都有摘录或维基内容.

  • 安迪,你知道我如何获得相似标签的关系表吗?比如如果你添加标签“php”,它会显示“php5”、“php4”标签作为相似标签。 (2认同)

Ami*_*ati 5

我根据安迪的答案进行了开发,并收集了每个标签的同义词:

select e.id,
  count(t.tagName),
  string_agg(TagSynonyms.SourceTagName, ',') as synonyms,
  t.tagName,
  e.body as 'Excerpt',
  w.body as 'WikiBody'
from tags t
left join Posts e
  on t.ExcerptPostId = e.Id
left join Posts w
  on t.WikiPostId = w.Id
left join TagSynonyms 
  on TagSynonyms.TargetTagName = t.tagName
group by t.tagName, e.body, w.body, e.id
order by  count(t.tagName) desc
Run Code Online (Sandbox Code Playgroud)

链接在这里