php結合正則批量抓取網(wǎng)頁中郵箱地址
更新時間:2015年05月19日 11:35:30 投稿:hebedich
目前在做一個項目,需要提取一個小型網(wǎng)站的所有郵箱地址,度娘了一下,方法還挺多,這里給大家總結幾個比較實用的,分享給大家。
php如何抓取網(wǎng)頁中郵箱地址,下面我就給大家分享一個用php抓取網(wǎng)頁中電子郵箱的實例。
<?php
$url='http://chabaoo.cn'; //要采集的網(wǎng)址
$content=file_get_contents($url);
//echo $content;
function getEmail($str) {
//$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i";
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
preg_match_all($pattern,$str,$emailArr);
return $emailArr[0];
}
print_r( getEmail($content));
?>
方法2:
<?php
$url='http://chabaoo.cn'; //當頁已留郵箱
$content=file_get_contents($url); //獲取頁面內(nèi)容
function getEmail($str) { //匹配郵箱內(nèi)容
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
preg_match_all($pattern,$str,$emailArr);
return $emailArr[0];
}
print_r( getEmail($content));
?>
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
您可能感興趣的文章:
- PHP怎樣用正則抓取頁面中的網(wǎng)址
- PHP正則表達式抓取某個標簽的特定屬性值的方法
- php使用curl和正則表達式抓取網(wǎng)頁數(shù)據(jù)示例
- PHP采集利器 Snoopy 試用心得
- PHP采集類snoopy詳細介紹(snoopy使用教程)
- snoopy 強大的PHP采集類使用實例代碼
- 基于Snoopy的PHP近似完美獲取網(wǎng)站編碼的代碼
- PHP采集類Snoopy抓取圖片實例
- snoopy PHP版的網(wǎng)絡客戶端提供本地下載
- php基于Snoopy解析網(wǎng)頁html的方法
- php中Snoopy類用法實例
- PHP正則+Snoopy抓取框架實現(xiàn)的抓取淘寶店信譽功能實例
相關文章
YII Framework框架教程之使用YIIC快速創(chuàng)建YII應用詳解
這篇文章主要介紹了YII Framework框架教程之使用YIIC快速創(chuàng)建YII應用的方法,詳細分析說明了YII Framework框架使用YIIC命令行創(chuàng)建應用的相關技巧與注意事項,需要的朋友可以參考下2016-03-03

