标签: google-search

Google自定义搜索过滤

我获得了一系列(已批准的)要求和已经批准的解决方案,可以将Google自定义搜索实施到现有网站.

本网站有以下内容:

工作
- 第1类
- 第2类
- 第3类
普通页面
- 第1类
- 第2类
- 第3类

搜索功能的要求是人们可以使用CheckBoxes来过滤结果.如果以下是真的:

[x] Category 1
[ ] Category 2
[x] Category 3

Run Code Online (Sandbox Code Playgroud)

然后,类别2中不会显示任何页面.但是,还有:

[x] Show jobs only

Run Code Online (Sandbox Code Playgroud)

我如何通过Google自定义搜索实现此功能？我已经阅读过PageMap,使用<meta>标签等.但是我无法理解我是如何根据这些来过滤结果的.

我看了一下:谷歌自定义搜索API - 排序/过滤

但它似乎没有回答我的担忧.我在文档中仍然有点迷失.

这种事情有可能吗？有没有人有任何更完整的例子链接？

我有一个想法,试图在内存滤波.但是,如果谷歌刚刚发生,而在10个结果丢回1个作业页面[x] Show jobs only复选框被选中..然后用户将只能得到网页上的1个结果.

我倾向于使用自定义搜索引擎的基于XML的结果集..但是如果需要更改我会接受建议.

任何建议表示赞赏

google-search google-search-api google-custom-search

Sim*_*ead

2017 05-23

0
推荐指数

1
解决办法

3790
查看次数

如何在Google上更改网站说明？

因此，我有一个Web应用程序，由于某种原因，在Google上，网站描述为：

没有为sitename.com设置转发。

如何更改此说明？

这是一个屏幕截图：http : //imgur.com/YIE0dNO

html metadata google-search

Son*_*ack

2014 11-13

0
推荐指数

1
解决办法

3725
查看次数

Google是否在PHP中抓取include/require文件？

我是php的新手,我正在使用带有导航栏的php的网站上工作.这个网站将相当大(超过30页),如果我发现需要更改它,我不想在每个页面上更改我的导航栏.

我也想让Google的蜘蛛跟随导航栏上的链接.如果我将导航栏放在包含文件中,Google是否会跟踪包含文件中的链接？包含文件是在每个页面上使用相同导航栏的正确方法吗？任何人都可以提供的任何帮助将不胜感激!

php seo google-search

作者

2014 11-15

0
推荐指数

1
解决办法

1838
查看次数

为什么我无法获取元素的 innerText 属性？

我正在尝试检索谷歌搜索次数的字符串，以便将其与赛普拉斯测试一起使用。
谷歌搜索结果

这是我试图用来获取它的代码。它检索 null。

let text = cy.get('#result-stats').innerText
    cy.log(text)

Run Code Online (Sandbox Code Playgroud)

我还尝试了其他几种方法，例如innerHtml 或textContent。我尝试过获取整个 div、调用文本、调用 val、获取孩子...没有任何效果...

我想要得到的是字符串“About 8.200.000.000.000 results”。此时我不在乎 HTML 语法是否存在，我只想要数字。

javascript google-search innertext cypress

v0v*_*vvy

2023 06-09

0
推荐指数

1
解决办法

315
查看次数

如何使用 VBA 在 Excel 中获取第一页的 Google 搜索结果片段

我有一个包含 1000 个关键字的列表A1:A1000。我想在每个关键字的相应单元格中获取第一页的 Google 搜索结果片段。例如：A1单元格的搜索结果片段应该在B1......*1等等。任何帮助深表感谢。

excel internet-explorer vba google-search web-scraping

sha*_*adi

2016 11-16

-1
推荐指数

1
解决办法

2614
查看次数

有没有办法在不被验证码阻止的情况下抓取 Google 搜索结果？

假设我想从搜索“hi google”中抓取结果（只是一个例子）。我正在使用带有 Node.js 的 Puppeteer 进行抓取。我使用以下代码：

const puppeteer = require('puppeteer');
scrape = async function () {
    const browser = await puppeteer.launch({headless: false});
    const page = await browser.newPage();
    await page.goto("https://www.google.com/search?q=hi+google&rlz=1C1CHBF_enUS879US879&oq=hi+google&aqs=chrome..69i57j0l3j46j69i60l3.1667j0j7&sourceid=chrome&ie=UTF-8", { waitUntil: "networkidle2" });
    await page.setViewport({ width: 1366, height: 663 });
    await page.waitForSelector('.xpd');
    let data = await page.evaluate(() => {
        
        return document.querySelectorAll('.xpd')[16];

    });
    await browser.close();
    return data;

}
scrape()
    .then(function(result) {
        console.log(result);
    })

Run Code Online (Sandbox Code Playgroud)

当浏览器启动时，它会立即转到 reCAPTCHA 页面：有没有办法超越这个问题？我在网上做了一些研究，但这些结果要么是 1. 非常理论化，我不知道如何在我的代码中实现这些，要么 2. Python 解决方案，我不确定其中一些解决方案会如何傀儡师。我遇到的最有用的结果是随机定时抓取以使请求看起来像人类，但正如您所看到的，即使只检索一个数据元素也不起作用，它只会立即将您带到 reCAPTCHA 页面。