使用CDN之后APACHE日志記錄中IP地址不正確的解決方案
最近在搞APACHE日志分析,裝好了awstats之后,這兩天進(jìn)行了觀察,
報(bào)表日期 月 1 月 2010
首次參觀日期 2010年01月12日 11:04
最近參觀日期 2010年01月13日 23:59
參觀者 參觀人次 網(wǎng)頁(yè)數(shù) 文件數(shù) 字節(jié)
瀏覽器流量 * 77 226 (2.93 參觀人次/參觀者) 508979 (2252.11 網(wǎng)頁(yè)數(shù)/參觀) 509492 (2254.38 文件數(shù)/參觀) 13.67 G字節(jié) (63430.28 K字節(jié)/參觀)
非瀏覽器流量 * 117312 122716 736.24 M字節(jié)
這邊的結(jié)果很讓人費(fèi)解,通過(guò)google統(tǒng)計(jì)網(wǎng)站的獨(dú)立IP訪問(wèn)量有2W做,這里顯示的數(shù)字相差甚遠(yuǎn)。 后面的網(wǎng)頁(yè)數(shù)和文件數(shù)又都與實(shí)際相吻合。 經(jīng)過(guò)查找原因發(fā)現(xiàn) apache日志里記錄的IP地址不正確,大部分都是cdn的節(jié)點(diǎn)地址。 產(chǎn)生的原因很顯然是因?yàn)镃DN造成的,之前在網(wǎng)站后臺(tái)程序里讀取用戶IP地址也出現(xiàn)了類似問(wèn)題。 可以使用print_r($_SERVER) (PHP語(yǔ)言),查找到真實(shí)的用戶IP地址,本站為 $_SERVER[‘HTTP_CDN-SRC-IP']. 這個(gè)是CDN攜帶的真實(shí)的客戶IP地址(這里不計(jì)較用戶是否使用代理)。 但在APACHE的日志記錄里如何使用這個(gè)值呢? 本人在GOOGLE和百度里查找了許久都沒有找到相應(yīng)的資料或者說(shuō)解決方案,只好自己思考尋求了。
仔細(xì)看了下APACHE里日志記錄的相關(guān)配置,針對(duì)LogFormat:
LogFormat "%h %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combined
我思索里面的%{Referer}和%{User-Agent} 是如何取得的, 這兩個(gè)是在程序里也是經(jīng)常會(huì)用到的東西,客戶端發(fā)送請(qǐng)求的時(shí)候 這兩個(gè)信息都是作為頭詳細(xì)發(fā)送到服務(wù)器的。后來(lái)查看了下訪問(wèn)時(shí)的所有頭信息,如下:
Array
(
[Cdn-Src-Ip] => 222.44.46.58
[Accept] => image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
[Accept-Language] => zh-cn
[User-Agent] => Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727)
[Host] => www.875.cn
[Cookie] => __utma=217127135.1188793388.1263188369.1263364666.1263368206.5; __utmz=217127135.1263368206.5.2.utmcsr=211.167.92.250|utmccn=(referral)|utmcmd=referral|utmcct=/cgi-bin/awstats/awstats.pl; viewedShopsID=621; viewedShopsPP=%u6B27%u5C1A%u574A
[Accept-Encoding] => gzip
[Via] => 1.1 hnay40:80 (Cdn Cache Server V2.0)
[Connection] => keep-alive
)
當(dāng)然rerfer的時(shí)候也會(huì)有rerfer信息出現(xiàn)在頭部信息里,上面也有Cookie、Host、User-Agent等信息,這些信息都是可以在apache配置文件里可以使用的變量,當(dāng)然這里Cdn-Src-Ip正是我想要的客戶的真實(shí)IP地址。 于是推測(cè)${Cdn-Src-Ip}在日志記錄格式里應(yīng)該也是可以使用的。 后面的i應(yīng)該是指忽略大小寫的意思。于是得出一個(gè)解決方案:
添加一個(gè)新的logformat信息
LogFormat "%{Cdn-Src-Ip}i %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combinedcdn
在需要記錄的網(wǎng)站配置里增加:
CustomLog "|/usr/local/sbin/cronolog /usr/local/apache/logs/www.875.cn-access_log.%Y%m%d" combinedcdn env=!IMAGES
重啟apache服務(wù),然后訪問(wèn)網(wǎng)站,查看日志記錄發(fā)現(xiàn)現(xiàn)在可以正常記錄客戶IP地址了。
相關(guān)文章
Linux date命令知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家分享的是關(guān)于Linux date命令詳細(xì)說(shuō)明,有興趣的朋友們跟著學(xué)習(xí)下。2020-02-02有效學(xué)習(xí)Linux系統(tǒng)的4個(gè)方法
這篇文章主要為大家詳細(xì)介紹了有效學(xué)習(xí)Linux系統(tǒng)的4個(gè)方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-01-01linux服務(wù)器上使用nginx訪問(wèn)本地靜態(tài)資源的方法
這篇文章主要介紹了linux服務(wù)器上如何使用nginx訪問(wèn)本地靜態(tài)資源,本文給出了解決方法,需要的朋友可以參考下2019-12-12Ubuntu部署python3.5的開發(fā)和運(yùn)行環(huán)境
這篇文章主要介紹了Ubuntu部署python3.5的開發(fā)和運(yùn)行環(huán)境,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。2017-01-01crontab執(zhí)行時(shí)間與系統(tǒng)時(shí)間不一致問(wèn)題解決
這篇文章主要給大家介紹了關(guān)于crontab執(zhí)行時(shí)間與系統(tǒng)時(shí)間不一致問(wèn)題的解決方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-01-01Apache服務(wù)器中使用.htaccess實(shí)現(xiàn)偽靜態(tài)URL的方法
這篇文章主要介紹了Apache服務(wù)器中使用.htaccess實(shí)現(xiàn)偽靜態(tài)URL的方法,示例結(jié)合PHP腳本,需要的朋友可以參考下2015-07-07