昨天晚上群裡有朋友采集網頁時發現file_get_contents 獲得的網頁保存到本地為亂碼
但在浏覽器裡看是正常的
因為我有過相關經驗馬上發現是網站開啟了gzip而file_get_contents 獲得的是壓縮過的頁面
剛好我前不久剛看到可以用讀取文件的前
代碼如下
//米爾軍事網采用 gzip壓縮網頁
//file_get_contents 直接獲得的網頁是亂碼
header(
$url =
$file = fopen($url
//只讀
$bin = fread($file
fclose($file);
$strInfo = @unpack("C
$typeCode = intval($strInfo[
$isGzip =
switch ($typeCode)
{
case
//網站開啟了gzip
$isGzip =
break;
default:
$isGzip =
}
$url = $isGzip ? "compress
$mierHtml = file_get_contents($url); //獲得米爾軍事網數據
$mierHtml = iconv("gbk"
echo $mierHtml;
From:http://tw.wingwit.com/Article/program/PHP/201311/21292.html