如果我使用<div>tag itemprop="review"itemscope itemtype="http://mydomainname.com/Review"itemtype,那么我是否需要在我的网站上创建一个名为review的页面?
这是我的 Duck Duck Go 搜索脚本。
import duckduckgo
r = duckduckgo.query('DuckDuckGo')
print r.results[0].url
Run Code Online (Sandbox Code Playgroud)
它回来了;列表索引超出范围。如果我打印 r.results 我得到;
[<duckduckgo.Result object at 0x0000000002E98F60>]
Run Code Online (Sandbox Code Playgroud)
但是,如果我搜索“DuckDuckGo”以外的任何内容。它返回一个空值
[]
Run Code Online (Sandbox Code Playgroud)
我完全按照他们在示例代码中所做的。 https://github.com/mikejs/python-duckduckgo
我有一个开发网站https://text-domain.com.(不是真实的网站)当我访问https://duckduckgo.com并搜索text-domain.com时,它会返回结果.
到目前为止我尝试了什么:
robots.txt使用以下代码创建文件(放在我的根目录中,即在text-domain.com/robots.txt中):
User-agent: *
Disallow: /
Run Code Online (Sandbox Code Playgroud)
然后在我的模板文件中添加了这样的元标记:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
Run Code Online (Sandbox Code Playgroud)
即便在这样做之后,我搜索了DuckDuckGo并得出了相同的结果.欢迎大家提出意见.
PS
嗨,等了几天后有2个发现:
但是我看到一条消息说:"我们想在这里向您展示一个描述,但该网站不允许我们."
是否有可能完全阻止在结果中显示?
DuckduckGo/Bing上的默认图像搜索返回35张图像.
例如https://duckduckgo.com/?q=Temple+of+the+Golden+Pavilion&iax=1&ia=images
Bing的相同内容,请参阅http://www.bing.com/images/search?q=Temple%20of%20the%20Golden%20Pavilion
有没有办法让它使用http网址返回更多图像?
或者,如果不可能,有没有办法通过http网址转到接下来的35张图片?
我检查了他们的语法页面,但没有关于图像搜索的信息:https://duckduckgo.com/params
我也试过&count=1000但它仍然返回35张图片:https://www.bing.com/images/search?q = times + square&count = 100
我的 public_html 文件夹是 /domain.com/public_html/ 但我希望 htaccess 将它们重定向到文件夹 /domain/public_html/www/ 但仍然将 domain.com 作为域而不是 domain.com/www 。
编辑:我希望 public_html 中的子文件夹 www 是默认根目录而不是 public_html 本身
对此有什么解决方案吗?
这是我目前的 htacess
Options +FollowSymlinks
RewriteEngine On
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_FILENAME}\.php -f
RewriteRule ^(.*)$ $1.php
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteRule ^(.*)$ www/$1 [NC,L]
</IfModule>
Run Code Online (Sandbox Code Playgroud) duckduckgo ×2
.htaccess ×1
apache ×1
bing ×1
directory ×1
html ×1
html5 ×1
image ×1
microdata ×1
python ×1
robot ×1
robots.txt ×1
url ×1
web-crawler ×1