标签: snoopy

如何从需要cookie登录的网站上抓取PHP中的网站内容?

我的问题是它不仅需要一个基本的cookie,而是要求一个会话cookie,以及随机生成的ID.我想这意味着我需要使用带有cookie jar的Web浏览器模拟器?

我曾尝试使用Snoopy,Goutte和其他几个Web浏览器模拟器,但到目前为止我还没有找到有关如何接收cookie的教程.我有点绝望了!

谁能给我一个如何在史努比或Goutte中接受cookie的例子?

提前致谢!

php cookies snoopy scraper goutte

5
推荐指数
2
解决办法
1万
查看次数

从Codeigniter中的类创建对象

以下代码来自http://d.hatena.ne.jp/dix3/20081002/1222899116,代码运行良好.

这是在codeigniter 中使用snoopy的一个例子.

Q1.我是否正确地说我不能使用,

$this -> load -> library('snoopy')
Run Code Online (Sandbox Code Playgroud)

因为Snoopy.php不会创建对象.以下示例是如何做到的?如果是这样,你可以向我解释/指导如何详细说明的教程或解释吗?

if ( ! class_exists('Snoopy'))
    {
        require_once(APPPATH.'libraries/Snoopy'.EXT);
    }
Run Code Online (Sandbox Code Playgroud)

Q2.作者为何使用

$to_specialchars=true
Run Code Online (Sandbox Code Playgroud)

它需要吗?

Q3.你能解释一下APPPATH和EXT吗?

APPPATH.'libraries/Snoopy'.EXT
Run Code Online (Sandbox Code Playgroud)

我在php.net中检查过但我找不到它.EXT必须是扩展名,但我可以在任何地方使用吗?

提前致谢.

我在application/library/Snoopy.php中有一个史努比

我有application/library/Snoopy.php

<?php  if ( ! defined('BASEPATH')) exit('No direct script access allowed');

class Scraping{
    var $c; 
    function Scraping(){
        if ( ! class_exists('Snoopy'))
        {
            require_once(APPPATH.'libraries/Snoopy'.EXT);
        }
        $this -> c = new Snoopy();
    }

    function getWebHtml($url="",$to_specialchars=true){
        $this ->c -> fetch( $url );
        $str = mb_convert_encoding( (string) $this -> c -> results,"UTF-8","auto");
        return ($to_specialchars) ? …
Run Code Online (Sandbox Code Playgroud)

php codeigniter snoopy

3
推荐指数
1
解决办法
3万
查看次数

标签 统计

php ×2

snoopy ×2

codeigniter ×1

cookies ×1

goutte ×1

scraper ×1