phpword插件導出word文件時中文亂碼問題處理方案
最近一個項目開發(fā)要用到PHP技術導出Word文檔,比較了幾種方案,首先是使用Microsoft Office自帶的ActiveX/COM組件,比如Word.Application,這種方式的優(yōu)點是格式兼容度高,可以生成純doc的Word2003格式文檔,缺點一是比較占資源(調(diào)用會啟動一個WINWORD.EXE進程),不適合Web多用戶訪問使用;二是PHP這種Web開發(fā)技術大多數(shù)是跑在Linux服務器上,當然也就無法使用Windows下的技術了,平臺可移植和兼容性不好。
第二種生成Word的方案是生成Word兼容的網(wǎng)頁格式,然后以Word方式打開,這種方案總體上感覺怪怪的,畢竟文件格式是HTML的,而且格式兼容度不好,不過這種方式的優(yōu)點是節(jié)省服務器資源,能夠快速生成;最后一種方案也就是今天的主角,采用PHPWord生成Word2007(docx)格式的文檔,現(xiàn)在基本上微軟Office Word 2003以后的版本均兼容這種格式了,對于2003版本來說,僅需要下載安裝個兼容格式包(下載地址),也能正常打開這類文件,當然如果你使用的是最新版本的Office(包括但不限于Office 2007、Office 2010)則不需要安裝此格式包。
好了,下面我就介紹一下PHPWord,大家可以通過訪問項目主頁下載并獲得關于項目的更多信息。
我在使用過程中主要遇到了中文亂碼的問題,結(jié)合網(wǎng)上大神們的指導,通過下面的方式解決了這類問題,希望對大家有所幫助。
1、增加東亞字體支持
打開并編輯路徑/Writer/Word2007/Base.php文件內(nèi)容,大概在第349行(行數(shù)隨著版本可能會有變化)大概函數(shù)_writeTextStyle內(nèi)添加:
$objWriter->writeAttribute('w:eastAsia', $font)
比如我的修改片段基本是下面這樣:
// Font
if($font != 'Arial') {
$objWriter->startElement('w:rFonts');
$objWriter->writeAttribute('w:eastAsia', $font); // 添加這行
$objWriter->writeAttribute('w:ascii', $font);
$objWriter->writeAttribute('w:hAnsi', $font);
$objWriter->writeAttribute('w:cs', $font);
$objWriter->endElement();
}
2. 解決中文亂碼問題
編輯PHPWord/Template.php,找到代碼$replace = utf8_encode($replace);,刪除或者注釋掉這行代碼,添加$replace = iconv( 'gbk','utf-8', $replace);,比如代碼改為如下:
/**
* Set a Template value
*
* @param mixed $search
* @param mixed $replace
*/
public function setValue($search, $replace) {
if(substr($search, 0, 2) !== '${' && substr($search, -1) !== '}') {
$search = '${'.$search.'}';
}
if(!is_array($replace)) {
//$replace = utf8_encode($replace);
$replace =iconv('gbk', 'utf-8', $replace); // 注釋掉上面行后添加這行
}
$this->_documentXML = str_replace($search, $replace, $this->_documentXML);
}
調(diào)用方式如下:
$document->setValue('Template', iconv('utf-8', 'GB2312//IGNORE', '中文'));
上面的代碼主要解決模板的問題,下面同樣的道理,解決Section添加文本的問題,找到代碼$givenText = utf8_encode($text);,刪除或者注釋掉這行代碼,添加$givenText = iconv('gbk', 'utf-8', $text);,比如代碼如下:
/**
* Add a Text Element
*
* @param string $text
* @param mixed $styleFont
* @param mixed $styleParagraph
* @return PHPWord_Section_Text
*/
public function addText($text, $styleFont = null, $styleParagraph = null) {
//$givenText = utf8_encode($text);
$givenText = iconv('gbk', 'utf-8', $text); // 注釋掉上面行后添加這行
$text = new PHPWord_Section_Text($givenText, $styleFont, $styleParagraph);
$this->_elementCollection[] = $text;
return $text;
}
調(diào)用方式和上面的模板調(diào)用大同小異,這邊就不列舉了。
折騰了這么多,突然發(fā)現(xiàn)網(wǎng)上還有另外一個版本的PhpWord,項目類名大小寫上略有不同,隸屬于PHPOffice/PHPWord,GitHub項目地址(文檔)。這個版本的PHPWord內(nèi)容更加豐富,支持的功能也比較多(包括行間距,縮進和首行縮進等),最后我也采取的這個版本的PHPWord,值得注意的是這兩個版本的PHPWord在API接口上基本一致,可以通用。但是有些API,在PHPOffice/PHPWord里是不推薦的,比如createSection需要改成addSection,另外應用這個版本的PHPWord不需要像上面那樣做任何中文支持的修改,比較省事。
這兩個PHPWord項目的官方都提供了較詳細的使用例子和文檔,這里就不介紹了。最后提示的是:在模板模式下loadTemplate,只能使用setValue等模板操作方法,不能再添加段落或者段落修改了。這個略有不便。
對于PHPOffice/PHPWord我提供一個簡單的例子供參考(當然官方例子更多):
require_once 'PhpOffice/PhpWord/PhpWord.php'; // 包含頭文件
use PhpOffice\PhpWord\Autoloader;
use PhpOffice\PhpWord\Settings;
use PhpOffice\PhpWord\IOFactory;
require_once __DIR__ . '/PhpOffice/PhpWord/Autoloader.php';
Autoloader::register();
Settings::loadConfig();
// Create a new PHPWord Object
$PHPWord = new \PhpOffice\PhpWord\PhpWord();
$PHPWordHelper= new \PhpOffice\PhpWord\Shared\Font();
$PHPWord->setDefaultFontName('仿宋'); // 全局字體
$PHPWord->setDefaultFontSize(16); // 全局字號為3號
// 設置文檔的屬性,這些在對文檔右擊屬性可以看到,也可以省去這些步驟
$properties = $PHPWord->getDocumentProperties();
$properties->setCreator('張三'); // 創(chuàng)建者
$properties->setCompany('某公司'); // 公司
$properties->setTitle('某某文檔'); // 標題
$properties->setDescription('http://wangye.org'); // 描述
$properties->setLastModifiedBy('李四'); // 最后修改
$properties->setCreated( time() ); // 創(chuàng)建時間
$properties->setModified( time() ); // 修改時間
// 添加3號仿宋字體到'FangSong16pt'留著下面使用
$PHPWord->addFontStyle('FangSong16pt', array('name'=>'仿宋', 'size'=>16));
// 添加段落樣式到'Normal'以備下面使用
$PHPWord->addParagraphStyle(
'Normal',array(
'align'=>'both',
'spaceBefore' => 0,
'spaceAfter' => 0,
'spacing'=>$PHPWordHelper->pointSizeToTwips(2.8),
'lineHeight' => 1.19, // 行間距
'indentation' => array( // 首行縮進
'firstLine' => $PHPWordHelper->pointSizeToTwips(32)
)
)
);
// Section樣式:上3.5厘米、下3.8厘米、左3厘米、右3厘米,頁腳3厘米
// 注意這里厘米(centimeter)要轉(zhuǎn)換為twips單位
$sectionStyle = array(
'orientation' => null,
'marginLeft' => $PHPWordHelper->centimeterSizeToTwips(3),
'marginRight' => $PHPWordHelper->centimeterSizeToTwips(3),
'marginTop' => $PHPWordHelper->centimeterSizeToTwips(3.5),
'marginBottom' => $PHPWordHelper->centimeterSizeToTwips(3.8),
'pageNumberingStart' => 1, // 頁碼從1開始
'footerHeight' => $PHPWordHelper->centimeterSizeToTwips(3),
);
$section = $PHPWord->addSection($sectionStyle); // 添加一節(jié)
// 下面這句是輸入文檔內(nèi)容,注意這里用到了剛才我們添加的
// 字體樣式FangSong16pt和段落樣式Normal
$section->addText('文檔內(nèi)容', 'FangSong16pt', 'Normal');
$section->addTextBreak(1); // 新起一個空白段落
$objWriter = IOFactory::createWriter($PHPWord, 'Word2007');
$objWriter->save('/path/to/file'); // 保存到/path/to/file路徑下
總結(jié)
1、用模板word生成word中文亂碼解決方案:打開phpword/Template.php文件,找到$replace = utf8_encode($replace);將其改為$replace =iconv('gbk', 'utf-8', $replace); 即可。
2、直接生成word文檔,調(diào)用addText對象時中文亂碼解決方案:打開phpword/Section.php文件,找到$givenText = utf8_encode($text);將其改為$givenText = iconv('gbk', 'utf-8', $text);即可。
3、貌似其他方法也類似第解決。
4、注意php文件采用gbk哦。反正我的顯示中文了。在網(wǎng)上找了好久,研究了半天才搞定。
相關文章
EPSON打印機 連供墨水系統(tǒng) 維修有哪些保養(yǎng)竅門
EPSON打印機 連供墨水系統(tǒng) 維修有哪些保養(yǎng)竅門...2007-12-12
thinkphp 字母函數(shù)詳解T/I/N/D/M/A/R/U
下面小編就為大家?guī)硪黄猼hinkphp 字母函數(shù)詳解T/I/N/D/M/A/R/U。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-04-04
PHP中 empty() 和 isset() 的區(qū)別介紹
作為PHP中經(jīng)常用來判斷變量是否為空的函數(shù):empty()和isset() ,二者其實在很多方面還是存在區(qū)別的,本文將為大家詳細介紹一下他們的區(qū)別之處,需要的朋友可以了解一下2021-12-12
讓PHP以ROOT權(quán)限執(zhí)行系統(tǒng)命令的方法
這種問題我想大家可能都遇到過,網(wǎng)友提供的解決方法也很多。我也只是結(jié)合自己系統(tǒng)的需求并結(jié)合網(wǎng)友的解決方案來總結(jié)的一種方法2011-02-02

