您好,欢迎访问一九零五行业门户网

匹配网页内容的网址的正则,该如何解决

匹配网页内容的网址的正则
我希望把这个网址http://www.425sf.com/的网址都匹配出来
php code$url = http://www.425sf.com/;//采集地址$content = file_get_contents($url);$patten = ^((https|http|ftp|rtsp|mms)?://)?(([0-9a-z_!~*'().&=+$%-]+:)?[0-9a-z_!~*'().&=+$%-]+@)?(([0-9]{1,3}\.){3}[0-9]{1,3}|([0-9a-z_!~*'()-]+\.)*([0-9a-z][0-9a-z-]{0,61})?[0-9a-z]\.[a-z]{2,6})(:[0-9]{1,4})?((/?)|(/[0-9a-z_!~*'().;?:@&=+$,%#-]+)+/?)$;preg_match_all($patten, $content, $matches);
上面的匹配正则我是参考这里的
http://topic.csdn.net/u/20070307/14/87e6b878-800e-4a88-830e-7d0eeeaba891.html
我用正则测试工具试过比较准确
但是这里php运行好像取不出来
------解决方案--------------------
php code$html = sdfjksdfjkhtml;$r = '/';print_r($a[1]);/*array( [0] => http://www.baidu.com [1] => http://hi.baidu.com?info=aaa)*/
------解决方案--------------------
ls正解:
preg_match_all
(php 4, php 5)
preg_match_all ― 进行全局正则表达式匹配
说明
int preg_match_all ( string $pattern , string $subject , array $matches [, int $flags ] )
在 subject 中搜索所有与 pattern 给出的正则表达式匹配的内容并将结果以 flags 指定的顺序放到 matches 中。
搜索到第一个匹配项之后,接下来的搜索从上一个匹配项末尾开始。
flags 可以是下列标记的组合(注意把 preg_pattern_order 和 preg_set_order 合起来用没有意义):
preg_pattern_order 
对结果排序使 $matches[0] 为全部模式匹配的数组,$matches[1] 为第一个括号中的子模式所匹配的字符串组成的数组,以此类推。
(.*)[^>]+>|u,
example: this is a test
,
$out, preg_pattern_order);
print $out[0][0]., .$out[0][1].\n;
print $out[1][0]., .$out[1][1].\n;
?> 
本例将输出:
example: , this is a test
example: , this is a test
因此,$out[0] 包含匹配整个模式的字符串,$out[1] 包含一对 html 标记之间的字符串。
preg_set_order 
对结果排序使 $matches[0] 为第一组匹配项的数组,$matches[1] 为第二组匹配项的数组,以此类推。
(.*)[^>]+>|u,
example: this is a test
,
$out, preg_set_order);
print $out[0][0]., .$out[0][1].\n;
print $out[1][0]., .$out[1][1].\n;
?> 
本例将输出:
example: , example:
this is a test
, this is a test
本例中,$matches[0] 是第一组匹配结果,$matches[0][0] 包含匹配整个模式的文本,$matches[0][1] 包含匹配第一个子模式的文本,以此类推。同样,$matches[1] 是第二组匹配结果,等等。
preg_offset_capture 
如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量。注意这改变了返回的数组的值,使其中的每个单元也是一个数组,其中第一项为匹配字符串,第二项为其在 subject 中的偏移量。本标记自 php 4.3.0 起可用。
如果没有给出标记,则假定为 preg_pattern_order。
返回整个模式匹配的次数(可能为零),如果出错返回 false。
example #1 从某文本中取得所有的电话号码
example #2 搜索匹配的 html 标记(greedy)
// \\2 是一个逆向引用的例子,其在 pcre 中的含义是
// 必须匹配正则表达式本身中第二组括号内的内容,本例中
// 就是 ([\w]+)。因为字符串在双引号中,所以需要
// 多加一个反斜线。
$html = bold textclick me;

其它类似信息

推荐信息