第十五课:动态网站的优化处理
; d; l% T& n6 v/ n
动态网站的静态话处理,一般国内常用的方法都是将网站换成一套后台是动态的,前台是自动生成静态页面的系统,这类系统已经有非常多了,你可以根据你网站的需要去选择,或者专门请人开发。国外目前一般都采用的是下面URL映射的方法:
; Z- L% G: U G( l
w2 m! T. {* T, |* U9 D) u" H
实现方式主要有2种:
8 p% n% h! U, C
7 J$ c6 e6 ?6 r- c
" o% R+ k0 }" L0 |$ ]& V' d基于url rewrite
. P: o/ }$ I: h$ Q0 w
; U$ s% c3 T- G基于path_info
0 S( n }* n; Z( C5 r- l
1 C1 ]3 P) f7 E5 F! {把URI地址用作参数传递:URL REWRITE
6 A4 l z9 O6 p/ j6 r2 n5 @( v
2 Z* }4 r; h8 |0 T! n8 c5 [最简单的是基于各种WEB服务器中的URL重写转向(Rewrite)模块的URL转换:
1 W# B7 A# @7 n* b/ V1 b# q这样几乎可以不修改程序的实现将 news.asp?id=234 这样的链接映射成 news/234.html,从外面看上去和静态链接一样。Apache服务器上有一个模块(非缺省):mod_rewrite:URL REWRITE功能之强大足够写上一本书。
% e$ i' ~3 B* s+ H; V, w( B
+ s0 o. x$ v& x& X6 F
7 O3 a$ ~/ H, }* f当我需要将将news.asp?id=234的映射成news/234.html时,只需设置:
4 h/ ?, P5 Y. @$ ?
RewriteRule /news/(d+).html /news.asp?id=$1 [N,I]
- G8 b3 P& T/ H( F# L) h8 v这样就把 /news/234.html 这样的请求映射成了 /news.asp?id=234
" [2 J- O4 R5 u" p3 x当有对/news/234.html的请求时:web服务器会把实际请求转发给/news.asp?id=234
8 m. P V6 b" x6 Y. p0 F% ^2 r. ^6 Q
* S* B- e/ {, H8 E; u
而在IIS也有相应的REWRITE模块:比如ISAPI REWRITE和IIS REWRITE,语法都是基于正则表达式,因此配置几乎和apache的mod_rewrite是相同的:
, ]& H0 |5 J) `7 |5 B
7 c: M8 A7 G# y: |2 I" i比对于某一个简单应用可以是:
2 S; M, n* E3 g3 X6 |: a( ^, u7 a. ?RewriteRule /news/(d+).html /news/news.php?id=$1 [N,I]
- \4 I: V% K7 ~4 U) J这样就把
http://www.chedong.com/news/234.html 映射到了
http://www.chedong.com/news/news.php?id=234
# j& L! J5 f9 p& I- e: z; j7 N# W: n3 X# l6 o1 W6 f
一个更通用的能够将所有的动态页面进行参数映射的表达式是:
4 G1 [. v) v5 c% E; N4 I8 t把
http://www.myhost.com/foo.php?a=A&b=B&c=C
" U1 s* @2 a" \, I6 |4 ?表现成
http://www.myhost.com/foo.php/a/A/b/B/c/C。
8 |* ]4 q, A, {RewriteRule (.*?.php)(?[^/]*)?/([^/]*)/([^/]*)(.+?)?$1(?2$2&:?)$3=$4?5$5: [N,I]
0 d7 `# Z' b7 _' j$ J, I( x+ O# V6 U9 |/ W9 a& D
以下是针对phpBB的一个Apache mod_rewrite配置样例:
- v+ z. j5 j3 c- H7 J
# V$ X$ [" v: y) d8 ]# e6 C RewriteEngine On
$ Z( p0 X9 l) M4 S& P
RewriteRule /forum/topic_(.+).html$ /forum/viewtopic.php?t=$1 [L]
0 r9 k2 E, y- X, r. B0 B
RewriteRule /forum/forum_(.+).html$ /forum/viewforum.php?f=$1 [L]
7 Q- f$ n& k" s RewriteRule /forum/user_(.+).html$ /forum/profile.php?mode=viewprofile&u=$1 [L]
6 Z ~7 \: y+ l; L; N' T/ p . L. |* @7 C! b( K0 h
这样设置后就可以通过topic_1234.html forum_2.html user_34.html这样的链接访问原来的动态页面了。
9 w& I9 A5 ]- A( H1 x$ Q' n! ?
6 v/ N6 f g* s$ G9 Z8 e5 ~3 g* e+ C通过URL REWRITE还有一些好处:
$ K- t; a( P. q2 o+ \9 ~mod_rewrite和isapirewrite基本兼容,但是还是有些不同,比如:isapirewrite中"?"需要转义成"?",mod_rewrite不用,isapirewrite支持 "d+" (全部数字),mod_rewrite不支持
5 H3 s5 n: q5 O- ]/ ^
5 X6 b" E/ [! L隐藏后台实现:这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,根本感受不到后台应用的变化;
! g5 w4 N4 P, N( i% Q简化数据校验:因为像(d+)这样的参数,可以有效的控制数字的格式甚至位数;
: K, c3 D0 X( a5 l$ n% e# y
比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用mod_rewrite甚至可以把请求转发到其他后台服务器上。
T1 j9 j ]. A l3 f% o& p9 S/ G- a, o
- k- Q4 Y1 l. p8 Q7 S基于PATH_INFO的URL美化
9 g2 M- P$ Z( q& {, b8 S4 d, oUrl美化的另外一个方式就是基于PATH_INFO:
, V5 j L. Q& O' OPATH_INFO是一个CGI 1.1的标准,经常发现很多跟在CGI后面的"/value_1/value_2"就是PATH_INFO参数:
E1 h6 V9 \6 }+ E' ~! m2 f$ ]比如:
http://phpunixman.sourceforge.net/index.php/man/ls 中:$PATH_INFO = "/man/ls"
G4 Z' t( H9 n- L. b" n
4 d$ q, I5 v+ k3 H4 X/ o1 a+ [9 h: D7 Y8 g; n @" }- W
PATH_INFO是CGI标准,因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
% x1 C& D6 j) ]注意:/myapp/servlet/Hello/foo的 getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()将返回的 /hello.jsp,从这里你也可以知道jsp其实就是一个Servlet的PATH_INFO参数。ASP不支持PATH_INFO
' J1 o8 H/ G( Q; F9 P5 lPHP中基于PATH_INFO的参数解析的例子如下:
& Y) @7 V+ h- W, N* M: N3 C( k//注意:参数按"/"分割,第一个参数是空的:从/param1/param2中解析出$param1 $param2这2个参数
1 M! q8 {: i% ]# tif ( isset($_SERVER["PATH_INFO"]) ) {
# f5 M7 c( [( ?# T3 x" f! ~1 c
? ? list($nothing, $param1, $param2) = explode('/', $_SERVER["PATH_INFO"]);
& ]+ c% Y% k) q; h9 S2 V$ [* G& x
}
P6 z* C* x( Z$ z
$ x% w M/ j; u Z0 g如何隐蔽应用:例如 .php,的扩展名:
' O- w3 {' `- {& t2 m( S9 J+ U1 I
在APACHE中这样配置:
+ o d" U* `) k' y<FilesMatch "^app_name$">
; q4 d( D2 V/ u5 ]? ? ForceType application/x-httpd-php
8 h$ T) C2 f9 {. [</FilesMatch>
# l) [* n1 n( R
& J3 J1 }" c' P. n! P* u
如何更像静态页面:app_name/my/app.html
% M U6 L. U @1 g- C: ~, j& S
解析的PATH_INFO参数的时候,把最后一个参数的最后5个字符“.html”截断即可。
0 [$ j8 h" C* h! R注意:APACHE2中缺省是不允许PATH_INFO的,需要设置 AcceptPathInfo on
5 Q* b+ v1 x/ A6 M
9 i8 X- E/ i! p* E" d5 x7 @4 y. ^
特别是针对使用虚拟主机用户,无权安装和配置mod_rewrite的时候,PATH_INFO往往就成了唯一的选择。
6 o0 T1 e" c: a* F% u: n- n0 i: k" o/ M
* B2 I- F0 m3 }' N+ l% H8 A- W4 N9 oOK,这样以后看见类似于
http://www.example.com/article/234这样的网页你就知道可能是 article/show.php?id=234这个php程序生成的动态网页,很多站点表面看上去可能有很多静态目录,其实很有可能都是使用1,2个程序实现的内容发布。比如很多WIKIWIKI系统都使用了这个机制:整个系统就一个简单的wiki程序,而看上去的目录其实都是这个应用拿后面的地址作为参数的查询结果。
& d% y* m5 r; w
$ u- p* v* ?3 s% \, H, v利用基于MOD_REWRITE/PATH_INFO + CACHE服务器的解决方案对原有的动态发布系统进行改造,也可以大大降低旧有系统升级到新的内容管理系统的成本。并且方便了搜索引擎收录入索引。
4 V! }( f+ r& e4 \
9 b+ k( r H0 B1 \* K0 h0 b附:如何在IIS上利用PHP支持PATH_INFO
2 f3 I, S, o' H, F L
PHP的ISAPI模式安装备忘:只试成 php-4.2.3-Win32
6 z* l) p# n. |! o
9 \; g7 X( |* }) B6 G a g解包目录
, t1 k. E) y6 y* P0 f* }
========
$ s3 r4 h6 x0 P" p
php-4.2.3-Win32.zip c:php
4 r: D% l9 g9 n5 O' x, H. h4 y
. Z5 T6 X! k# EPHP.INI初始化文件
3 w& n7 [, c" W; ~$ A=================
( a, D8 W1 x8 l5 W4 K3 | v) A复制:c:phpphp.ini-dist 到 c:winntphp.ini
! R) X: }5 U9 ]( {; Q# b2 ?, j# p' u) r* I, Q
配置文件关联
2 {+ s0 J) n/ K) N2 {* z3 a
============
: K4 @# a0 C O& Q按照install.txt中的说明配置文件关联
# P0 ]& I) l) q" f' C7 o
; V8 m+ H5 u' _5 @& q1 S运行库文件
! E( M- O; {9 G# x3 D$ y- z$ C
==========
& B2 f7 b, ]1 i- b# S i2 f9 {
复制 c:phpphp4ts.dll 到 c:winntsystem32php4ts.dll
; ~: G- h% W9 X
0 S# T& v1 S1 `# D6 | Q) a这样运行后:会发现php把PATH_INFO映射到了物理路径上
6 C+ F* B; D1 B3 D5 v: d- }$ T6 CWarning: Unknown(C:CheDongDownloadsariadnewww est.phppath): failed to create stream: No such file or directory in Unknown on line 0
" W# i' ]7 T" ]4 O9 H# K- P1 U! u3 D/ i% `' \% A- ]
Warning: Unknown(): Failed opening 'C:CheDongDownloadsariadnewww est.phppath' for inclusion (include_path='.;c:php4pear') in Unknown on line 0
# G* m1 `- a4 B5 o3 T
, v' |7 z: o; D! U. v
安装ariadne的PATCH
$ A; G) M$ j- z! P5 ], R- b" _5 A
==================
6 T% O# K; z" P _
停止IIS服务
) q3 m2 Y8 F8 U; Z, C+ i" Nnet stop iisadmin
( k/ e4 `- s. o ]ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll/ Y( F9 x5 S8 |6 Q; E
覆盖原有的c:phpsapiphp4isapi.dll
2 j: H' P0 e3 M% ?6 S
6 x* P% l4 W8 N4 p; m1 L* d0 R注:
) Y6 g- B7 E' {3 Uariadne是一个基于PATH_INFO的内容发布系统,
# }( w, P: |$ D4 w5 g
PHP 4.3.2 RC2中CGI模式的PATH_INFO已经修正,照常安装即可。
3 S" w0 d7 Z! h S
r6 n2 R3 p' R7 n' w5 t6 ?$ X+ s+ L/ L" i/ E3 d
参考资料:
2 M- O2 {$ u- b# i$ X' O
URL Rewrite文档:
0 \4 _9 ? s+ m/ u- G
ISAPI REWRITE文档
- I3 O& ?3 w3 j% U1 i3 X& z8 ~! TIIS的ISAPI REWRITE下载(免费)
' J5 L1 W. Y! ^$ |+ Bhttp://httpd.apache.org/docs/mod/mod_rewrite.html
! }2 v) `* A6 _7 f" hhttp://httpd.apache.org/docs-2.0/mod/mod_rewrite.html
- O4 |5 p4 I% C1 K3 |) D$ m1 _1 n
9 V9 Z% I8 h7 U+ k$ I7 E1 I7 W* l6 T8 Q' @" S
搜索引擎友好的URL设计
+ x% j. l) h! s9 v( g. F
http://www.sitepoint.com/article/485
# U- Z6 c$ @& I$ V说不定这个URL原来就是articel.php?id=485
' k/ c1 E5 N) _
" K8 o: E* N2 j' t9 l: A
& _/ U( N+ r+ |; a# Q一个基于PATH_INFO的开源内容管理系统
* Z5 R( A5 l% [http://typo3.com/
6 {4 ?: K: ]' i5 w3 y
& G! J, V8 I0 W- Z! M2 x$ i) \- @) Q0 O4 t: Q1 G3 S! f8 i
Google的PageRank算法说明:
' Z* N R6 `4 J/ n& Ahttp://pr.efactory.de/