bueno pues se que llevo muuucho tiempo sin aparecer por aqui pero pues auqi les dejo un aporte. xD
Es algo en lo que he estado trabajando y me ha parecido muy interesante.
Snoopy es una clase de PHP que me permite acceder a un sitio web y llamar su contenido sin tener que visualizar la pagina en el navegador, el primer y hasta ahora unico uso que le he dado es poder plagiar informacion automaticamente de sitios, en teoria con un poquito de codigo se podria hacer una copiaentera de youtube en 30minutos. xD
http://http://sourceforge.net/projects/snoopy/este es el link de la clase
Este es un pequeño ejemplo de lo que he echo. xD
<?PHP
$urlbase = "http://luna-nueva-bella.programas-gratis.net/";
include "Snoopy.class.php";
$snoopy = new Snoopy;
$snoopy->fetch($urlbase);
$anticodigo = $snoopy->results;
$codigo = eregi_replace("[\n|\r|\n\r]", ' ', $anticodigo);
//titulo
preg_match_all("#<meta name=\"title\" content=\"(.*?)\"#", $codigo, $salida);
for ($i = 0, $limite = count($salida[1]); $i < $limite; $i++) {
$vtitulo = $salida[1][$i];
}
//seccion
preg_match_all("#<div class=\"categoria\"><div class=\"categoria_texto\"><strong>(.*?)</strong>#", $codigo, $seccion);
for ($i = 0, $limite = count($seccion[1]); $i < $limite; $i++) {
$fseccion = $seccion[1][$i];
}
preg_match_all("#\">(.*?)</#", $fseccion, $sseccion);
for ($i = 0, $limite = count($sseccion[1]); $i < $limite; $i++) {
$vseccion = $sseccion[1][$i];
}
//descrip
preg_match_all("#</script> </div>(.*?)<p class=#", $codigo, $descrip);
for ($i = 0, $limite = count($descrip[1]); $i < $limite; $i++) {
$vdescrip = $descrip[1][$i];
}
//link
$caracteres = array("(", "'");
$vacio = "";
$snoopyt = new Snoopy;
$snoopyt->fetch($urlbase."descargar");
$anticodigot = $snoopyt->results;
$codigot = eregi_replace("[\n|\r|\n\r]", ' ', $anticodigot);
preg_match_all("#nueva_vent2=open(.*?),#", $codigot, $link);
for ($i = 0, $limite = count($link[1]); $i < $limite; $i++) {
$finalink = $link[1][$i];
$vlink = str_replace($caracteres, $vacio, $finalink);
}
echo $vtitulo;
echo "<hr />";
echo $vseccion;
echo "<hr />";
echo $vdescrip;
echo "<hr />";
//imagen
$caracteres = array("(", "'");
$vacio = "";
$snoopyd = new Snoopy;
$snoopyd->fetch($urlbase."imagenes");
$anticodigod = $snoopyd->results;
$codigod = eregi_replace("[\n|\r|\n\r]", ' ', $anticodigod);
preg_match_all("#f=\"javascript:imagen(.*?),#", $codigod, $imagen);
for ($i = 0, $limite = count($imagen[1]); $i < $limite; $i++) {
$finalimagen = $imagen[1][$i]."<br/>";
$finalimagen = str_replace($caracteres, $vacio, "$finalimagen");
echo $finalimagen;
}
echo "<hr />";
echo $vlink;
?>
y este es el resultado
Luna Nueva Bella Gratis
Fondos de Pantalla
Luna nueva - Bella es un fantástico fondo de pantalla donde podremos ver a Bella, uno de los personajes principales de la saga Crepúsculo, con una mirada pensativa. Enamorada del vampiro Edward, en esta segunda parte de la saga, las aventuras y nuevos acontecimientos la llevarán a una complicada situación.
Tanto si te gusta esta historia, como si quieres tener a la bella actriz en tu fondo de escritorio, no puedes dejar pasar la oportunidad de descargar Luna nueva - Bella, que se encuentra en una resolución de 1024x768.
http://www.programas-gratis.net/imagenes_extra/29338_1.jpg
http://www.programas-gratis.net/css/descargar_pop.php?programa=luna-nueva-bella
Como veran puedo obtener el codigo de fuente de determinada url y luego la parseo apra obtener solo los datos que me interesan, ahora siçolo habria que crear un pequeño script para que buscara las urls d elos links internos y repitiera la opreacion. XD
Saludos y espero que les sirva.