Index de l'article

Autre exemple de récupération à partir d'un json

<?php
include_once('simple_html_dom.php');
 
// Connexion MySQL
$bdd = new PDO('mysql:host=localhost; dbname=webscraping; charset=utf8', 'root', 'geo_local');
 
// Boucle gérant les pages html
$nb_lignes = 29900 ;
while($nb_lignes<= 30100 )
{
 
// Préfixe de l'URL
$content = 'http://www.xxxx.org.br/xxxx/profil?cod=' ;
 
// URL incrémentée
$content_ = str_get_html($content.$nb_lignes++) ;
 
// Création d'un contexte avant l'appel de la page afin de pouvoir ignorer les erreurs d'import
$context = stream_context_create(array(
'http' => array('ignore_errors' => true),
));
 
// Appel de la page
$json = file_get_html($content_, false, $context) ;
$parsed_json = json_decode($json) ;
 
// Appel des contenus
$ii=0;
 
foreach($parsed_json as $item)
{
$objectToArray = (array)$item;
 
if($ii==0)
$name = $objectToArray[0];
 
else if($ii==1)
$email = $objectToArray[0];
 
else if($ii==2)
$Telefone1 = $objectToArray[0];
 
$ii++;
}
 
// Préparation de la requête
$req = $bdd->prepare("INSERT IGNORE INTO extract (name, email, tel1)
VALUES (:name, :email, :Telefone1)");
 
// Exécution de la requête
$req->execute(array(
 
// Variables contenues
"name" => $name,
"email" => $email,
"Telefone1" => $Telefone1,
)
);
 
// Fin de la boucle gérant les pages html
}
?>