很多站长朋友们都不太清楚php采集正则,今天小编就来给大家整理php采集正则,希望对各位有所帮助,具体内容如下:
本文目录一览: 1、 php用正则采集百度首页的标题和内容 2、 php 正则表达式 网页采集为什么源代码一换行 模式也换行 就是匹配不到? 3、 php简单正则匹配Img标签src内容采集? 4、 php用正则采集到多个数据如何写入数据库 现在我用php正则采集到了,商品名称title:1,2,3,...n;商品id... 5、 请问如何用php中的正则采集指定内容? php用正则采集百度首页的标题和内容CURL获取源码,正则匹配就是了
<title>(.*)</title>
<div id=wrapper>(.*)<script id=s_js_newsplus
php 正则表达式 网页采集为什么源代码一换行 模式也换行 就是匹配不到?php里的.不能匹配换行,可以使用[\s\S]替换.
或者添加s模式修饰符,如:
$pattern = '#<div>[\s\S]*?</div>#';
或
$pattern = '#<div>.*?</div>#s';
更多正则问题,请参考我的博客《我眼里的正则表达式入门教程》
php简单正则匹配Img标签src内容采集?// 抓取网页
echo "\n\n抓取网页=======================================\n";
function getHTTPS($url) {
$ch = curl_init ();
curl_setopt ( $ch, CURLOPT_SSL_VERIFYPEER, FALSE );
curl_setopt ( $ch, CURLOPT_HEADER, false );
curl_setopt ( $ch, CURLOPT_FOLLOWLOCATION, true );
curl_setopt ( $ch, CURLOPT_URL, $url );
curl_setopt ( $ch, CURLOPT_REFERER, $url );
curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, TRUE );
$result = curl_exec ( $ch );
curl_close ( $ch );
return $result;
}
$result = getHTTPS ( "" );
$array = array (
'img',
'script',
'link'
);
$num = count ( $array );
for($i = 0; $i < $num; ++ $i) {
echo $array [$i] . "--------------------------------\n";
if (preg_match_all ( "/<" . $array [$i] . "[^>]*>/i", $result, $m )) {
for($j = 0; $j < count ( $m [0] ); $j ++) {
echo $m [0] [$j] . "\n";
}
}
}
php用正则采集到多个数据如何写入数据库 现在我用php正则采集到了,商品名称title:1,2,3,...n;商品id...个人建议采集到的数据存储为二维数组,其中商品id是唯一的,所以将id作为键值,然后每个键值对应的是一个一次包含title,price等数据的二维数组,这样采集完成后,可以将这个二维数组遍历循环插入数据库,这样也不容易出现错误
比如其中一个商品id为1,标题为“牙刷”,价格为$2,就这样写入数组$arr[1]=array("牙刷","$2")
请问如何用php中的正则采集指定内容?简单写的话就是
preg_match("(<title>.*?<.*?title>)ims",$b,$a);
$a[0]是你要的
关于php采集正则的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。
查看更多关于php采集正则 phpemail正则的详细内容...