设计动量论坛's Archiver

sogood 发表于 2007-3-24 11:31

用正则表达式,取得网页正文部分内容,且仅仅保留表格部分的HTML标签

<?php6|:R%\*^ @+d z_5M1b

C0xFE4NcD1A aV // --------------------------------------------------------------------------)I*e2R M0kl e,ZG7] i$t
// File name   : testRegex.php
pP$f2q[WZG+s"L // Description : 用正则表达式,取得网页正文部分内容,且仅仅保留表格部分的HTML标签1f-SkH'H3w
// Requirement : PHP4 ([url]http://www.php.net)[/url]T&V7I6V2Z$E?
//(L)LW xxk0Ta7z
// Copyright(C), HonestQiao, 2005, All Rights Reserved.f0U }5Gn!_v
//
-L&C:?m9uK%} // Author: HonestQiao ([email]honestqiao@hotmail.com[/email]) 6SpB#vJ2M5J8lB
//)JQ_*RL u
// --------------------------------------------------------------------------
|!ny"y+oJV echo preg_replace('/<!--.*?-->|<(head|title|script|style)[^>]*?>.*?</1>|        |(</?(?:table|tbody|th|tr|td))[^>]*?(>)|(?:</(?!table|tbody|th|tr|td))[^>]*?>|(?:<(?!table|tbody|th|tr|td))[^>]*?>/sim', '$2$3', file_get_contents("http://bbs.chinaunix.net"));6D8JU&z[&k
[u9^ M'ZH)n
?>

页: [1]

Powered by Discuz! Archiver 7.0.0  © 2001-2009 Comsenz Inc.