CURL + POST + multipart/form-data
Pergunta
Eu estou tentando raspar um site utilizando PHP, ONDULAÇÃO e o método POST para enviar um formulário web antes de raspar a página.O problema que estou enfrentando é que não está ligado com o método POST:nenhum dado é enviado para o servidor, para que a raspada página da web não contêm o que eu estou procurando.
Eu saia certeza de que o problema está relacionado com o tipo de formulário:enctype="multipart/form-data".Como posso gerir a este POST, a pedido, considerando que o formulário é multipart/form-data?Tenho para codificar o post_string de uma forma especial?
Aqui está o código que estou usando:
function curl($url) {
//POST string
$post_string="XXXX";
$options = Array(
CURLOPT_RETURNTRANSFER => TRUE,
CURLOPT_FOLLOWLOCATION => TRUE,
CURLOPT_AUTOREFERER => TRUE,
CURLOPT_CONNECTTIMEOUT => 120,
CURLOPT_TIMEOUT => 120,
CURLOPT_MAXREDIRS => 10,
CURLOPT_USERAGENT => "Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.1a2pre) Gecko/2008073000 Shredder/3.0a2pre ThunderBrowse/3.2.1.8",
CURLOPT_URL => $url,
CURLOPT_CAINFO => dirname(__FILE__)."/cacert.pem",
CURLOPT_POSTFIELDS => $post_string,
);
$ch = curl_init();
curl_setopt_array($ch, $options);
$data = curl_exec($ch);
curl_error($ch);
curl_close($ch);
return $data;
}
$scraped_page = curl("XXXURLXXX");
echo $scraped_page;
Obrigado!
Solução
Definir o CURLOPT_POST para true:
CURLOPT_POST = true
Em seguida, preencha o seu post campos como este "setup":
$postfields = array();
$postfields['field1'] = 'value1';
$postfields['field2'] = 'value2';
CURLOPT_POSTFIELDS => $postfields
Se o valor for uma matriz, o cabeçalho de Tipo de Conteúdo será definido para multipart/form-data.
Outras dicas
Sim, $post_string precisa ser uma matriz.
Defina também CURLOPT_POST para true.