淺析php插件 HTMLPurifier HTML解析器
更新時間:2013年07月01日 11:31:33 作者:
本篇文章是對php插件 HTMLPurifier HTML解析器進行了詳細的分析介紹,需要的朋友參考下
HTMLPurifier插件的使用
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網給出的例子是
require_once 'HTMLPurifier.auto.php';
我同事常用的是
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設)
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設)
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對象
$purifier = new HTMLPurifier($config);
調用HTMLPurifier對象的purify方法
$puri_html = $purifier->purify($html);
第二種方式
自定義一個類 HtmlPurifier.php
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設置config信息
例如:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調用
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
下載HTMLPurifier插件
HTMLPurifier插件有用的部分是 library
使用HTMLPurifier library類庫
第一種方式
復制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.auto.php';
$config = HTMLPurifier_Config::createDefault();
?>
或者
復制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
$config = HTMLPurifier_Config::createDefault();
?>
官網給出的例子是
復制代碼 代碼如下:
require_once 'HTMLPurifier.auto.php';
我同事常用的是
復制代碼 代碼如下:
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
設置$config
configdoc
http://htmlpurifier.org/live/configdoc/plain.html
例子
復制代碼 代碼如下:
$config->set('HTML.AllowedElements', array('div'=>true, 'table'=>true, 'tr'=>true, 'td'=>true, 'br'=>true));
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional') //html文檔類型(常設)
$config->set('Core.Encoding', 'UTF-8') //字符編碼(常設)
HTML允許的元素
div元素,table元素,tr元素,td元素,br元素
new HTMLPurifier對象
復制代碼 代碼如下:
$purifier = new HTMLPurifier($config);
調用HTMLPurifier對象的purify方法
復制代碼 代碼如下:
$puri_html = $purifier->purify($html);
第二種方式
自定義一個類 HtmlPurifier.php
復制代碼 代碼如下:
<?php
require_once 'HTMLPurifier.includes.php';
require_once 'HTMLPurifier.autoload.php';
class Resume_HtmlPurifier implements Zend_Filter_Interface{
protected $_htmlPurifier = null;
public function __construct($options = null)
{
$config = HTMLPurifier_Config::createDefault();
$config->set('Code.Encoding', 'UTF-8');
$config->set('HTML.Doctype', 'XHTML 1.0 Transitional')
if(!is_null($options)){
foreach($options as $option){
$config->set($option[0], $option[1], $option[2]);
}
}
$this->_htmlPurifier = new HTMLPurifier($config);
}
public function filter($value)
{
return $this->_htmlPurifier->purify($value);
}
}
?>
設置config信息
例如:
復制代碼 代碼如下:
$conf = array(
array('HTML.AllowedElements',
array(
'div' => true,
'table' => true,
'tr' => true,
'td' => true,
'br' => true,
),
false), //允許屬性 div table tr td br元素
array('HTML.AllowedAttributes', array('class' => TRUE), false), //允許屬性 class
array('Attr.ForbiddenClasses', array('resume_p' => TRUE), false), //禁止classes如
array('AutoFormat.RemoveEmpty', true, false), //去空格
array('AutoFormat.RemoveEmpty.RemoveNbsp', true, false), //去nbsp
array('URI.Disable', true, false),
);
調用
復制代碼 代碼如下:
$p = new Resume_HtmlPurifier($conf);
$puri_html = $p->filter($html);
您可能感興趣的文章:
- PHP解析html類庫simple_html_dom的轉碼bug
- php解析html類庫simple_html_dom(詳細介紹)
- 淺析php插件 Simple HTML DOM 用DOM方式處理HTML
- PHP simple_html_dom.php+正則 采集文章代碼
- WordPress中轉義HTML與過濾鏈接的相關PHP函數(shù)使用解析
- php基于Snoopy解析網頁html的方法
- PHP抓取網頁、解析HTML常用的方法總結
- php實現(xiàn)的一個很好用HTML解析器類可用于采集數(shù)據(jù)
- 解析關于java,php以及html的所有文件編碼與亂碼的處理方法匯總
- 解析PHP生成靜態(tài)html文件的三種方法
- 用php解析html的實現(xiàn)代碼
- php使用simple_html_dom解析HTML示例
相關文章
php使用array_search函數(shù)實現(xiàn)數(shù)組查找的方法
這篇文章主要介紹了php使用array_search函數(shù)實現(xiàn)數(shù)組查找的方法,涉及php數(shù)組查找的相關技巧,需要的朋友可以參考下2015-06-06Windows2003 下 MySQL 數(shù)據(jù)庫每天自動備份
Windows2003 下 MySQL 數(shù)據(jù)庫每天自動備份...2006-12-12ThinkPHP使用心得分享-上傳類UploadFile的使用
ThinkPHP中的UploadFile類用于處理文件上傳,本文小總結了一下關于學習過程中對UploadFile類的使用方法。2014-05-05