iT邦幫忙

0

使用curl撈取多個網站資料

  • 分享至 

  • xImage

嗨!!各位前輩 大家好

小弟目前使用curl去做撈取資料的動作,但有時候撈取資料時卻會遇上只有撈到一個網站的資料,另一個網站則必須重新整理幾次後才撈的到,還請各位前輩指點迷津!!

這是小弟撈取資料的檔案

allaction.php

	//第一個網站
	$url= "$web_url1";
	$ch = curl_init();	
	curl_setopt($ch, CURLOPT_URL, $url);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
	curl_setopt($ch, CURLOPT_HEADER, 0);
	$output = curl_exec($ch);
	curl_close($ch);
	header('Content-type: text/html; charset=utf-8');
	preg_match('/<span itemprop="price" content="\s*(.*?)\s*">\s*(.*?)\s*<\/span>/s', $output, $matches);
	$price1 = strip_tags($matches[0]);

        //第二個網站
	$url= "$web_url2";
	$ch = curl_init();
	curl_setopt($ch, CURLOPT_URL, $url);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
	curl_setopt($ch, CURLOPT_HEADER, 0);
	$output = curl_exec($ch);
	curl_close($ch);
	header('Content-type: text/html; charset=utf-8');
	preg_match('/<span id="priceblock_ourprice" class="a-size-medium a-color-price">\s*(.*?)\s*<\/span>/s', $output, $matches);
	$price = strip_tags($matches[0]);
 	$price2 = str_replace("¥"," ",$price);
一個小小建議

既然是撈兩個網站
程式裡所有的變數就不要共用
免去一些互相干擾的可能

像你就分 price1 和 price2
那麼乾脆連
$url, $ch, $matches, $output 也都分 1, 2
反正幾個變數
佔不了多少 memory 的
現階段
跟節省 memory 比起來
程式能正確執行最重要
jojolin iT邦新手 5 級 ‧ 2015-04-16 09:44:47 檢舉
恩恩 重複的名稱已經修改了

感謝 前輩指點!!
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

4
qooqoo1127
iT邦新手 3 級 ‧ 2015-04-15 15:35:51
最佳解答

不如這樣

<pre class="c" name="code">
$url= "$web_url1";
$output ="";
goGetIt( $url, $output );

function goGetIt( $url, &$output ){
  $ch = curl_init();
  curl_setopt($ch, CURLOPT_URL, $url);
  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  curl_setopt($ch, CURLOPT_HEADER, 0);
  
  $reTry = 1;
  $http_code = 0;
  
  while($http_code!=200 && $reTry<=5){
    $output = curl_exec($ch);
    $info = curl_getinfo($ch);
    $http_code = $info["http_code"];
    if ((int)$http_code!=200){
      $reTry++;
      sleep(3);
    }
  }
  curl_close($ch);
}

header('Content-type: text/html; charset=utf-8');
preg_match('/<span itemprop="price" content="\s*(.*?)\s*">\s*(.*?)\s*<\/span>/s', $output, $matches);
$price1 = strip_tags($matches[0]);

我要發表回答

立即登入回答