我有一张表,其中 Z 列中的每一行都有一个通过TAGS从 Twitter 恢复的 JSON 字符串。
Z 列中的 JSON 字符串都具有类似的结构:
{
"hashtags": [
{
"text": "Negev_Summit",
"indices": [
172,
185
]
}
],
"symbols": [],
"user_mentions": [
{
"screen_name": "JY_LeDrian",
"name": "Jean-Yves Le Drian",
"id": 1055021191,
"id_str": "1055021191",
"indices": [
69,
80
]
}
],
"urls": [],
"media": [
{
"id": 1513588335893258200,
"id_str": "1513588335893258240",
"indices": [
271,
294
],
"media_url": "http://pbs.twimg.com/media/FQFYknkXoAAxgYd.jpg",
"media_url_https": "https://pbs.twimg.com/media/FQFYknkXoAAxgYd.jpg",
"url": "https://twitter.com/yairlapid/status/1513588345468825605",
"display_url": "pic.twitter.com/dA4cBepIh2",
"expanded_url": "https://twitter.com/yairlapid/status/1513588345468825605/photo/1",
"type": "photo",
"sizes": {
"medium": {
"w": 1024, …Run Code Online (Sandbox Code Playgroud) 曾经有一种方法来提取包含原生视频的推文的Twitter卡(以获取视频的:链接).反过来,获取此链接可以将其复制并粘贴到另一条推文中,让原始推文中的视频在新推文中原生播放,甚至可以直接发送本地视频,也可以使用第三方应用安排使用原生视频的推文.似乎该链接已被弃用.任何人都知道另一种方法吗?amp.twimg.comamp.twimg.com
我试图将帖子的数量刮到给定的标签(#castles),并使用ImportXML填充Google表格单元格。
我尝试从Chrome复制Xpath并将其粘贴到像这样的单元格中的ImportXML参数中:
=ImportXML("https://www.instagram.com/explore/tags/castels/", "//*[@id="react-root"]/section/main/header/div[2]/div/div[2]/span/span")
Run Code Online (Sandbox Code Playgroud)
我看到引号存在问题,因此我也尝试了:
=ImportXML("https://www.instagram.com/explore/tags/castels/", "//*[@id='react-root']/section/main/header/div[2]/div/div[2]/span/span")
Run Code Online (Sandbox Code Playgroud)
但是,两者都返回错误。
我究竟做错了什么?
附言:我知道元标记描述的Xpath,"//meta[@name='description']/@content"但是我想抓取帖子的确切数目,而不是缩写的数目。
xpath google-sheets web-scraping google-apps-script instagram
我的挑战是获取拥有超过 3000 万粉丝的帐户的所有粉丝列表。
目前,我正在 Twitter 的 REST API 上使用GET followers/list端点,但是,由于免费 API 的速率限制,这需要很多天才能实现。
我愿意为高级 API 访问付费,但是我找不到任何数据表明高级 API 具有必要的端点和足够的速率限制来帮助最多在几个小时内解决此任务。
对此事有任何见解将不胜感激......