包括使用PHP的外部网页

Mos*_*she 0 html php xhtml include

如何使用PHP包含外部网页?(有点像wordpress主题预览.)

我想要(X)符合HTML STRICT的代码 - 没有iFrame,最好没有javascript.

我的想法是,我正在为客户制作一个沙箱,以便在我受控制的环境中查看网页.另一件事是,如果没有"沙盒"包装器,所包含的网页应该是不可见的.

编辑:

据一些评论员说,GoDaddy已经开始了.问题的下一部分变成了 - 如何在php中删除html的页眉和页脚,以便只保留body标签的内容? 我宁愿使用PHP字符串函数而不是正则表达式.

Cod*_*ust 5

尝试使用卷曲:

/**
 * Get a web file (HTML, XHTML, XML, image, etc.) from a URL.  Return an
 * array containing the HTTP server response header fields and content.
 */
function get_web_page( $url )
{
    $options = array(
        CURLOPT_RETURNTRANSFER => true,     // return web page
        CURLOPT_HEADER         => false,    // don't return headers
        CURLOPT_FOLLOWLOCATION => true,     // follow redirects
        CURLOPT_ENCODING       => "",       // handle all encodings
        CURLOPT_USERAGENT      => "spider", // who am i
        CURLOPT_AUTOREFERER    => true,     // set referer on redirect
        CURLOPT_CONNECTTIMEOUT => 120,      // timeout on connect
        CURLOPT_TIMEOUT        => 120,      // timeout on response
        CURLOPT_MAXREDIRS      => 10,       // stop after 10 redirects
    );

    $ch      = curl_init( $url );
    curl_setopt_array( $ch, $options );
    $content = curl_exec( $ch );
    $err     = curl_errno( $ch );
    $errmsg  = curl_error( $ch );
    $header  = curl_getinfo( $ch );
    curl_close( $ch );

    $header['errno']   = $err;
    $header['errmsg']  = $errmsg;
    $header['content'] = $content;
    return $header;
}
Run Code Online (Sandbox Code Playgroud)

只需用你的url调用该函数,它应该将整个网页回显到php页面.

但是,您可能需要使用某些正则表达式重写资源链接,例如样式表和图像.(将"/image.jpg"替换为" http://mydomain.com/image.jpg ").

Curl通常安装在共享主机上.

如果你想获取页面的主体或头部,你可以使用simplexml或regex表达式.(如果html格式正确,simplexml非常适合遍历DOM).