我读取url
获取所有 的链接
<a href="$不要含http的链接... $特殊的字符 ... “>$含中文的链接</a>
获取到数组里面
在链接href="+入链接"
我要用的网站竟然用相对路径晕哦。
再在 < href="+$加入我指定的url...$提取的数据>
1。正则
我用的是
"<a( |\\n)*?href=(\\\")?(.|\\n)*?(.|\\n)*?([\u4E00-\u9FA5]|[\uFE30-\uFFA0])?(.|\\n)*?</a>"
2。在字符窜指定位子插入substr
我要在
href="后插入我指定的url
<?php
$url="http://www.netxeyes.com/";
$filename = $url;
if(false===($handle = @file($filename))) echo "对不起,服务器忙,请稍候再试" ;
$sult = join ("",$handle);
preg_match_all(/<a href=\"(?!http:).*?>.*?<\/a>/,$sult,$arr); //提取需要的正则
$arr[0][0] = eregi_replace("src=\"","src=\"http://www.netxeyes.com/",$arr[0][0]);
$arr[0][0] = eregi_replace("href=\"","href=\"http://www.netxeyes.com/",$arr[0][0]); //相对地址替换成绝对地址
echo $arr[0][0];
?>