我获得了一系列(已批准的)要求和已经批准的解决方案,可以将Google自定义搜索实施到现有网站.
本网站有以下内容:
工作
普通页面
搜索功能的要求是人们可以使用CheckBoxes来过滤结果.如果以下是真的:
[x] Category 1
[ ] Category 2
[x] Category 3
Run Code Online (Sandbox Code Playgroud)
然后,类别2中不会显示任何页面.但是,还有:
[x] Show jobs only
Run Code Online (Sandbox Code Playgroud)
我如何通过Google自定义搜索实现此功能?我已经阅读过PageMap,使用<meta>标签等.但是我无法理解我是如何根据这些来过滤结果的.
我看了一下:谷歌自定义搜索API - 排序/过滤
但它似乎没有回答我的担忧.我在文档中仍然有点迷失.
这种事情有可能吗?有没有人有任何更完整的例子链接?
我有一个想法,试图在内存滤波.但是,如果谷歌刚刚发生,而在10个结果丢回1个作业页面[x] Show jobs only复选框被选中..然后用户将只能得到网页上的1个结果.
我倾向于使用自定义搜索引擎的基于XML的结果集..但是如果需要更改我会接受建议.
任何建议表示赞赏
因此,我有一个Web应用程序,由于某种原因,在Google上,网站描述为:
没有为sitename.com设置转发。
如何更改此说明?
这是一个屏幕截图:http : //imgur.com/YIE0dNO
我是php的新手,我正在使用带有导航栏的php的网站上工作.这个网站将相当大(超过30页),如果我发现需要更改它,我不想在每个页面上更改我的导航栏.
我也想让Google的蜘蛛跟随导航栏上的链接.如果我将导航栏放在包含文件中,Google是否会跟踪包含文件中的链接?包含文件是在每个页面上使用相同导航栏的正确方法吗?任何人都可以提供的任何帮助将不胜感激!
我正在尝试检索谷歌搜索次数的字符串,以便将其与赛普拉斯测试一起使用。

这是我试图用来获取它的代码。它检索 null。
let text = cy.get('#result-stats').innerText
cy.log(text)
Run Code Online (Sandbox Code Playgroud)
我还尝试了其他几种方法,例如innerHtml 或textContent。我尝试过获取整个 div、调用文本、调用 val、获取孩子...没有任何效果...
我想要得到的是字符串“About 8.200.000.000.000 results”。此时我不在乎 HTML 语法是否存在,我只想要数字。
我有一个包含 1000 个关键字的列表A1:A1000。我想在每个关键字的相应单元格中获取第一页的 Google 搜索结果片段。例如:A1单元格的搜索结果片段应该在B1......*1等等。任何帮助深表感谢。
假设我想从搜索“hi google”中抓取结果(只是一个例子)。我正在使用带有 Node.js 的 Puppeteer 进行抓取。我使用以下代码:
const puppeteer = require('puppeteer');
scrape = async function () {
const browser = await puppeteer.launch({headless: false});
const page = await browser.newPage();
await page.goto("https://www.google.com/search?q=hi+google&rlz=1C1CHBF_enUS879US879&oq=hi+google&aqs=chrome..69i57j0l3j46j69i60l3.1667j0j7&sourceid=chrome&ie=UTF-8", { waitUntil: "networkidle2" });
await page.setViewport({ width: 1366, height: 663 });
await page.waitForSelector('.xpd');
let data = await page.evaluate(() => {
return document.querySelectorAll('.xpd')[16];
});
await browser.close();
return data;
}
scrape()
.then(function(result) {
console.log(result);
})
Run Code Online (Sandbox Code Playgroud)
当浏览器启动时,它会立即转到 reCAPTCHA 页面:
有没有办法超越这个问题?我在网上做了一些研究,但这些结果要么是 1. 非常理论化,我不知道如何在我的代码中实现这些,要么 2. Python 解决方案,我不确定其中一些解决方案会如何傀儡师。我遇到的最有用的结果是随机定时抓取以使请求看起来像人类,但正如您所看到的,即使只检索一个数据元素也不起作用,它只会立即将您带到 reCAPTCHA 页面。
谢谢。
我只是鬼混,并准备搜索food谷歌.我输错了-food,谷歌没有给出任何结果:
您的搜索 - 食物 - 与任何文件都不匹配.
建议:
确保所有单词拼写正确.
尝试不同的关键字
尝试更宽泛的关键字.
我还尝试在谷歌上搜索其他关键字-.所有这些都没有结果.我知道这是因为算法的某些部分,但无法理解哪个部分.
有人能告诉我这是一个错误,或者如果不是,这是怎么回事?算法的哪一部分导致了这个?
注意:这不是SO的主题,因为我在问这个算法.在-给出适当的结果后给出一个空格.喜欢:- food.