Pergunta

Eu estou tentando raspar um site utilizando PHP, ONDULAÇÃO e o método POST para enviar um formulário web antes de raspar a página.O problema que estou enfrentando é que não está ligado com o método POST:nenhum dado é enviado para o servidor, para que a raspada página da web não contêm o que eu estou procurando.

Eu saia certeza de que o problema está relacionado com o tipo de formulário:enctype="multipart/form-data".Como posso gerir a este POST, a pedido, considerando que o formulário é multipart/form-data?Tenho para codificar o post_string de uma forma especial?

Aqui está o código que estou usando:

 function curl($url) {

//POST string
$post_string="XXXX";

$options = Array(
        CURLOPT_RETURNTRANSFER => TRUE,  
        CURLOPT_FOLLOWLOCATION => TRUE, 
        CURLOPT_AUTOREFERER => TRUE, 
        CURLOPT_CONNECTTIMEOUT => 120,  
        CURLOPT_TIMEOUT => 120, 
        CURLOPT_MAXREDIRS => 10, 
        CURLOPT_USERAGENT => "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1a2pre) Gecko/2008073000 Shredder/3.0a2pre ThunderBrowse/3.2.1.8",  
        CURLOPT_URL => $url, 
        CURLOPT_CAINFO => dirname(__FILE__)."/cacert.pem",

        CURLOPT_POSTFIELDS => $post_string,

    );

    $ch = curl_init(); 
    curl_setopt_array($ch, $options);   
    $data = curl_exec($ch); 
    curl_error($ch);
    curl_close($ch);       
    return $data;   
}

$scraped_page = curl("XXXURLXXX");    
echo $scraped_page; 

Obrigado!

Foi útil?

Solução

Definir o CURLOPT_POST para true:

CURLOPT_POST = true

Em seguida, preencha o seu post campos como este "setup":

$postfields = array();
$postfields['field1'] = 'value1';
$postfields['field2'] = 'value2';
CURLOPT_POSTFIELDS => $postfields

Se o valor for uma matriz, o cabeçalho de Tipo de Conteúdo será definido para multipart/form-data.

O manual do PHP

Outras dicas

Sim, $post_string precisa ser uma matriz.

Defina também CURLOPT_POST para true.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top