标签: google-search

Google自定义搜索过滤

我获得了一系列(已批准的)要求和已经批准的解决方案,可以将Google自定义搜索实施到现有网站.

本网站有以下内容:

  • 工作

    • 第1类
    • 第2类
    • 第3类
  • 普通页面

    • 第1类
    • 第2类
    • 第3类

搜索功能的要求是人们可以使用CheckBoxes来过滤结果.如果以下是真的:

[x] Category 1
[ ] Category 2
[x] Category 3
Run Code Online (Sandbox Code Playgroud)

然后,类别2中不会显示任何页面.但是,还有:

[x] Show jobs only
Run Code Online (Sandbox Code Playgroud)

我如何通过Google自定义搜索实现此功能?我已经阅读过PageMap,使用<meta>标签等.但是我无法理解我是如何根据这些来过滤结果的.

我看了一下:谷歌自定义搜索API - 排序/过滤

但它似乎没有回答我的担忧.我在文档中仍然有点迷失.

这种事情有可能吗?有没有人有任何更完整的例子链接?

我有一个想法,试图在内存滤波.但是,如果谷歌刚刚发生,而在10个结果丢回1个作业页面[x] Show jobs only复选框被选中..然后用户将只能得到网页上的1个结果.

我倾向于使用自定义搜索引擎的基于XML的结果集..但是如果需要更改我会接受建议.

任何建议表示赞赏

google-search google-search-api google-custom-search

0
推荐指数
1
解决办法
3790
查看次数

如何在Google上更改网站说明?

因此,我有一个Web应用程序,由于某种原因,在Google上,网站描述为:

没有为sitename.com设置转发。

如何更改此说明?

这是一个屏幕截图:http : //imgur.com/YIE0dNO

html metadata google-search

0
推荐指数
1
解决办法
3725
查看次数

Google是否在PHP中抓取include/require文件?

我是php的新手,我正在使用带有导航栏的php的网站上工作.这个网站将相当大(超过30页),如果我发现需要更改它,我不想在每个页面上更改我的导航栏.

我也想让Google的蜘蛛跟随导航栏上的链接.如果我将导航栏放在包含文件中,Google是否会跟踪包含文件中的链接?包含文件是在每个页面上使用相同导航栏的正确方法吗?任何人都可以提供的任何帮助将不胜感激!

php seo google-search

0
推荐指数
1
解决办法
1838
查看次数

为什么我无法获取元素的 innerText 属性?

我正在尝试检索谷歌搜索次数的字符串,以便将其与赛普拉斯测试一起使用。
谷歌搜索结果

这是我试图用来获取它的代码。它检索 null。

let text = cy.get('#result-stats').innerText
    cy.log(text)
Run Code Online (Sandbox Code Playgroud)

我还尝试了其他几种方法,例如innerHtml 或textContent。我尝试过获取整个 div、调用文本、调用 val、获取孩子...没有任何效果...

我想要得到的是字符串“About 8.200.000.000.000 results”。此时我不在乎 HTML 语法是否存在,我只想要数字。

javascript google-search innertext cypress

0
推荐指数
1
解决办法
315
查看次数

如何使用 VBA 在 Excel 中获取第一页的 Google 搜索结果片段

我有一个包含 1000 个关键字的列表A1:A1000。我想在每个关键字的相应单元格中获取第一页的 Google 搜索结果片段。例如:A1单元格的搜索结果片段应该在B1......*1等等。任何帮助深表感谢。

excel internet-explorer vba google-search web-scraping

-1
推荐指数
1
解决办法
2614
查看次数

有没有办法在不被验证码阻止的情况下抓取 Google 搜索结果?

假设我想从搜索“hi google”中抓取结果(只是一个例子)。我正在使用带有 Node.js 的 Puppeteer 进行抓取。我使用以下代码:

const puppeteer = require('puppeteer');
scrape = async function () {
    const browser = await puppeteer.launch({headless: false});
    const page = await browser.newPage();
    await page.goto("https://www.google.com/search?q=hi+google&rlz=1C1CHBF_enUS879US879&oq=hi+google&aqs=chrome..69i57j0l3j46j69i60l3.1667j0j7&sourceid=chrome&ie=UTF-8", { waitUntil: "networkidle2" });
    await page.setViewport({ width: 1366, height: 663 });
    await page.waitForSelector('.xpd');
    let data = await page.evaluate(() => {
        
        return document.querySelectorAll('.xpd')[16];

    });
    await browser.close();
    return data;

}
scrape()
    .then(function(result) {
        console.log(result);
    })

Run Code Online (Sandbox Code Playgroud)

当浏览器启动时,它会立即转到 reCAPTCHA 页面: 验证码 有没有办法超越这个问题?我在网上做了一些研究,但这些结果要么是 1. 非常理论化,我不知道如何在我的代码中实现这些,要么 2. Python 解决方案,我不确定其中一些解决方案会如何傀儡师。我遇到的最有用的结果是随机定时抓取以使请求看起来像人类,但正如您所看到的,即使只检索一个数据元素也不起作用,它只会立即将您带到 reCAPTCHA 页面。

谢谢。

google-search recaptcha web-scraping puppeteer

-1
推荐指数
1
解决办法
1919
查看次数

搜索-food,在谷歌上没有结果

我只是鬼混,并准备搜索food谷歌.我输错了-food,谷歌没有给出任何结果:

您的搜索 - 食物 - 与任何文件都不匹配.

建议:

  • 确保所有单词拼写正确.

  • 尝试不同的关键字

  • 尝试更宽泛的关键字.

我还尝试在谷歌上搜索其他关键字-.所有这些都没有结果.我知道这是因为算法的某些部分,但无法理解哪个部分.

有人能告诉我这是一个错误,或者如果不是,这是怎么回事?算法的哪一部分导致了这个?

注意:这不是SO的主题,因为我在问这个算法.在-给出适当的结果后给出一个空格.喜欢:- food.

google-search

-3
推荐指数
1
解决办法
113
查看次数