php 采集書并合成txt格式的實現(xiàn)代碼

更新時間：2009年03月01日 23:15:53 作者：

記得上次有過一個叫采集后的處理這個就是它的升級版本連采再處理，合成一本書txt的。

<?php
/**
* @name 采集書.php
* @date Sun Mar 01 22:48:02 CST 2009
* @copyright 馬永占(MyZ)
* @author 馬永占(MyZ)
* @link http://blog.csdn.net/mayongzhan/
*/
//header('Content-Type:text/html;charset=utf8');
header('Content-Type:text/html;charset=gb2312');
error_reporting(E_ALL);
date_default_timezone_set('Asia/Shanghai');
set_time_limit(0);
function writer($content,$url)
{
$fp = fopen($url, 'ab');
fwrite($fp, $content);
fclose($fp);
}
$folder = '2'; //文件夾
$book_base_url = 'xxxxxxxxxxxxxxxxxxxxx';
$book_url = 'yyyyyyyyyyyyy.html';
$main = file_get_contents($book_base_url.$book_url);
preg_match_all('/chapter_.*?\.html/', $main, $pages);
$pages = array_unique($pages[0]);
foreach ($pages as $value) {
writer(file_get_contents($book_base_url.$value), './'.$folder.'/'.$value.'.txt');
$str = file_get_contents('./'.$folder.'/'.$value.'.txt');
//print_r($str);
preg_match("/(<h1>)(.*?)(<\/h1>)(.*?)(<div id=\"contTxt\" class=\"contTxt1\">)(.*?)(<\/div>)/s",$str,$arr);
//print_r($arr);die();
$arr[6] = preg_replace("/(<span[^>]+>.*?<a[^>]+>)(.*?)(<\/a><\/span>)/s","$2",preg_replace("/<p>|<\/p>/","\r\n",$arr[6]));
$result = "\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n----------------".$arr[2]."\r\n------------------------------------------------\r\n------------------------------------------------\r\n------------------------------------------------\r\n".$arr[6];
writer($result, './'.$folder.'/new.txt');
}
?>

您可能感興趣的文章:

處理(php-cgi.exe?-?FastCGI?進程超過了配置的請求超時時限)的問題
本篇文章是對解決(php-cgi.exe?-?FastCGI?進程超過了配置的請求超時時限)的問題進行了詳細的分析介紹，需要的朋友參考下
2013-07-07
php 獲得漢字拼音首字母的函數(shù)
php 獲得漢字拼音首字母的函數(shù)，大家可以自行測試。
2009-08-08
PHP將身份證正反面兩張照片合成一張圖片的代碼
本文介紹將身份證正反兩張圖片在PHP中如何合成一張圖片，還可以給圖片打上水印,需要的朋友可以參考下
2017-04-04
php實現(xiàn)Mysql簡易操作類
這個PHP實現(xiàn)的mysql的操作類完整版已經(jīng)使用過了，而這個簡化版是經(jīng)過修改完整版后的簡化版，適用在一般的 PHP 應用中，功能上可以實現(xiàn)基本的增刪改查的操作，以及打印 MYSQL 錯誤，自我感覺不錯，如果網(wǎng)站應用不是很強大，應用這個 MYSQL 的操作類已經(jīng)足夠了，
2015-10-10
windows下PHP APACHE MYSQ完整配置
windows下PHP APACHE MYSQ完整配置...
2007-01-01
PHP使用遞歸方式列出當前目錄下所有文件的方法
這篇文章主要介紹了PHP使用遞歸方式列出當前目錄下所有文件的方法,涉及php遞歸操作文件的相關技巧,需要的朋友可以參考下
2015-06-06
PHP實現(xiàn)的隨機紅包算法示例
這篇文章主要介紹了PHP實現(xiàn)的隨機紅包算法,結合實例形式分析了php隨機紅包算法的原理、實現(xiàn)方法與相關注意事項,需要的朋友可以參考下
2017-08-08
PHP字符串與數(shù)組處理函數(shù)用法小結
這篇文章主要介紹了PHP字符串與數(shù)組處理函數(shù)用法,結合實例形式詳細分析了PHP字符串與數(shù)組常用處理函數(shù)功能、定義、使用方法與操作注意事項,需要的朋友可以參考下
2020-01-01
php自動給網(wǎng)址加上鏈接的方法
這篇文章主要介紹了php自動給網(wǎng)址加上鏈接的方法,可實現(xiàn)對本文中的網(wǎng)址加上鏈接的功能,涉及正則匹配的相關技巧,需要的朋友可以參考下
2015-06-06
PHP中substr函數(shù)字符串截取用法分析
這篇文章主要介紹了PHP中substr函數(shù)字符串截取用法,結合實例形式分析說明的PHP中substr函數(shù)的功能,定義與具體使用技巧,需要的朋友可以參考下
2016-01-01