用正则表达式,取得网页正文部分内容,且仅仅保留表格部分的HTML标签
<?php6|:R%\*^ @+dz_5M1b// --------------------------------------------------------------------------)I*e2R M0kl e,ZG7]i$t
// File name : testRegex.php
// Description : 用正则表达式,取得网页正文部分内容,且仅仅保留表格部分的HTML标签1f-SkH'H3w
// Requirement : PHP4 ([url]http://www.php.net)[/url]T&V7I6V2Z$E?
//(L)LW xxk0Ta7z
// Copyright(C), HonestQiao, 2005, All Rights Reserved.f0U }5Gn!_v
//
// Author: HonestQiao ([email]honestqiao@hotmail.com[/email]) 6Sp B#vJ2M5J8lB
//)JQ_*RLu
// --------------------------------------------------------------------------
echo preg_replace('/<!--.*?-->|<(head|title|script|style)[^>]*?>.*?</1>| |(</?(?:table|tbody|th|tr|td))[^>]*?(>)|(?:</(?!table|tbody|th|tr|td))[^>]*?>|(?:<(?!table|tbody|th|tr|td))[^>]*?>/sim', '$2$3', file_get_contents("http://bbs.chinaunix.net"));6D8JU&z[&k
[u9^ M'ZH)n
?>
页:
[1]