亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

PHP實(shí)現(xiàn)采集中國(guó)天氣網(wǎng)未來(lái)7天天氣

 更新時(shí)間:2014年10月15日 12:53:12   投稿:junjie  
這篇文章主要介紹了PHP實(shí)現(xiàn)采集中國(guó)天氣網(wǎng)未來(lái)7天天氣方法,本文詳細(xì)的講解了需求的實(shí)現(xiàn),也可以做為學(xué)習(xí)PHP采集的入門(mén)教程,需要的朋友可以參考下

前言

我們?cè)趯?xiě)一個(gè)Web程序的時(shí)候,總會(huì)想著把自己的網(wǎng)站更美觀一些,功能能更多一些,有時(shí)候?qū)懸恍┬〉墓ぞ呋蛘呒由闲〉牟寮?huì)讓我們的站點(diǎn)更加完善。比如萬(wàn)年歷功能,比如我們現(xiàn)在要講的天氣預(yù)報(bào)功能。

當(dāng)然我們沒(méi)法利用專業(yè)的衛(wèi)星接受數(shù)據(jù),所以我們的天氣數(shù)據(jù)來(lái)自現(xiàn)有的天氣預(yù)報(bào)網(wǎng)站。利用天氣預(yù)報(bào)網(wǎng)站提供的數(shù)據(jù)服務(wù),我們可以寫(xiě)一個(gè)PHP爬蟲(chóng),然后動(dòng)態(tài)采集我們所需要的數(shù)據(jù),并且在目標(biāo)站點(diǎn)更新數(shù)據(jù)的時(shí)候,我們的程序也能做到同步更新,自動(dòng)地獲取數(shù)據(jù)。

下面就介紹一下如何編寫(xiě)一個(gè)簡(jiǎn)單的PHP數(shù)據(jù)采集程序(PHP爬蟲(chóng))。

原理

給定一個(gè)網(wǎng)頁(yè)的URL,使用PHP下載該網(wǎng)頁(yè)并得到網(wǎng)頁(yè)內(nèi)容,然后通過(guò)正則表達(dá)式將其中我們感興趣的數(shù)據(jù)提取出來(lái),然后輸出。

具體在這個(gè)例子中,我們要抓取的網(wǎng)頁(yè)是 http://www.weather.com.cn/weather/101050101.shtml,我們感興趣的是頁(yè)面中的未來(lái)7天天氣情況。

實(shí)現(xiàn)

0.獲取天氣預(yù)報(bào)網(wǎng)頁(yè)的URL:

復(fù)制代碼 代碼如下:

$url = "http://www.weather.com.cn/weather/101050101.shtml";
$page_content = file_get_contents($url);

在這里,file_get_contents() 函數(shù)會(huì)將 $url 指向的網(wǎng)頁(yè)下載下來(lái),并把網(wǎng)頁(yè)內(nèi)容作為一個(gè)字符串返回。于是,$page_content 變量中就是我們要抓取的網(wǎng)頁(yè)的全部HTML代碼了。接下來(lái),我們要從其中抽取我們需要的數(shù)據(jù)。

1.使用正則表達(dá)式匹配符合條件的字符串

先輸出 $page_content 的值,然后查看網(wǎng)頁(yè)源代碼,觀察可知我們需要的字符串可以在

復(fù)制代碼 代碼如下:

<!--day 1 -->
......
<!--day 7 -->

這兩行的注釋里找到。

使用正則表達(dá)式來(lái)取得 <!--day 1--> 和 <!--day 7--> 之間的所有內(nèi)容:

復(fù)制代碼 代碼如下:

eregi("<!--day 1-->(.*)<!--day 7-->",$page_content,$res);

2.補(bǔ)全頁(yè)面中圖片的路徑

由于遠(yuǎn)程網(wǎng)頁(yè)中的圖片路徑都是像 /m2/i/icon_weather/29x20/d01.gif 這樣的相對(duì)路徑,我們需要把這些路徑補(bǔ)全,在它們前面加上 http://www.weather.com.cn。

復(fù)制代碼 代碼如下:

$forecast = str_replace("<img src="","<img src="http://www.weather.com.cn",$res[0]);

至此,$forecast 中就是我們需要的天氣預(yù)報(bào)信息了。這個(gè)簡(jiǎn)單的PHP爬蟲(chóng)也就寫(xiě)好了。

源代碼

以下是這個(gè)抓取天氣預(yù)報(bào)小程序的完整源代碼,其中添加了一些測(cè)量各部分程序運(yùn)行時(shí)間的代碼,并可以通過(guò)設(shè)置 $start 和 $end 的值來(lái)控制抓取哪幾天的信息。

復(fù)制代碼 代碼如下:

$url = "http://www.weather.com.cn/weather/101050101.shtml";
$t1 = time();
   
$page_content = file_get_contents($url);
$t2 = time();

$start = 1;
$end = 3;

if ($end > 7){
    echo "超出預(yù)報(bào)能力范圍,請(qǐng)重新設(shè)置!";
}else {
    echo "未來(lái)".($end-$start)."天哈爾濱的天氣預(yù)報(bào)("
              .date('Y-m-j')."發(fā)布)";

    eregi("--day $start--(.*)--day $end--", $page_content, $res);

    $forecast = str_replace("<img src=\"",
        "<img src=\"http://www.weather.com.cn", $res[0]);
    $t3 = time();

    echo $forecast;

    echo 'First step costs '.($t2 - $t1).' ms.';
    echo 'Last step costs '.($t3 - $t2).' ms.';
}

其他應(yīng)用例子

同樣的思路可以嘗試的有:NBA每天的比分牌、今日哈工大的新聞同步、股市行情等等。都能實(shí)現(xiàn)同步實(shí)時(shí)更新。暫時(shí)只想到這些,歡迎大家拍磚~

相關(guān)文章

最新評(píng)論