Crear backup en PDF de los hilos del foro

Buenas amigos preparacionistas. No sabía bien dónde colocar esto, pero creo que dada la naturaleza del programa, éste me parece el foro más apropiado.

El usuario y el pass son OPCIONALES para descargar de foros "ocultos". (Sólo hace falta ponerlos la primera vez mientras uséis siempre la misma carpeta de salida).

NOTA: Nueva versión con FRAMESHOOTER para sacar capturas de los frames de Twitter, Youtube, Instagram, etc.
Para usarlo es necesario cargar antes un contenedor de DOCKER y usarlo desde Burbudump


(Los que uséis Linux doy por hecho que sabéis instalar y usar Docker)

Para lanzar el contenedor Docker:
Código:
docker run -d -p 4444:4444 -p 7900:7900 -e SE_NODE_SESSION_TIMEOUT=15 -e SE_SESSION_REQUEST_TIMEOUT=15 -e SE_SESSION_RETRY_INTERVAL=2 selenium/standalone-chrome

ALTERNATIVA (Si tenemos una CPU con por ejemplo 6 núcleos podemos lanzar el grid de Selenium así así para que vaya más rápido)
Código:
docker run -d -p 4444:4444 -p 7900:7900 -e SE_NODE_SESSION_TIMEOUT=15 -e SE_SESSION_REQUEST_TIMEOUT=15 -e SE_SESSION_RETRY_INTERVAL=2 -e SE_NODE_MAX_SESSIONS=6 selenium/standalone-chrome

EXTRA: La IP del contenedor de Selenium viene ya metida en Burbudump, pero si por lo que fuera en tu equipo esa IP fuera diferente, para averiguarla y poder usarla en Burbudump:


AVISO: si hacéis backups utilizando vuestra cuenta del foro, recordad que los mensajes de vuestros ignorados no saldrán en el PDF.
(Un truco para evitar esto y poder ver foros ocultos es crearse una cuenta de palo en el foro para utilizar con el burbudump que no tenga ignorados).


--------------------------------
REPOSITORIO NO OFICIAL DE HILOS DE BURBUJA (TELEGRAM)

Espero que sea útil y recordad que un gran poder conlleva una gran responsabilidad.

Salu2 ;)

PD:

PhantomJS -> Download PhantomJS

Instrucciones de uso:

Esta es una herramienta de línea de comandos. Para utilizarla, una vez tenéis descargado y descomprimido el ejecutable de PhantomJS:

Código:
phantomjs --cookies-file=cookies.txt --ignore-ssl-errors=true --web-security=false burbudump.js URL_HILO USUARIO PASSWORD

Los parámetros que nos interesan son los del final:

URL_HILO: la URL del hilo del que queremos hacer el backup (se le puede pasar una LISTA de URLs dentro de un fichero de texto en vez de una url sola).

Ejemplo de URL para descargar el hilo completo:
Código:
https://www.burbuja.info/inmobiliaria/threads/te-tocan-los-130-000-000-euros-del-euromillon-que-haces.1658681

Ejemplo de URL para descargar desde la página 3 hasta el final:
Código:
https://www.burbuja.info/inmobiliaria/threads/te-tocan-los-130-000-000-euros-del-euromillon-que-haces.1658681/page-3

Ejemplo de URL para descargar únicamente la página 4:
Código:
https://www.burbuja.info/inmobiliaria/threads/te-tocan-los-130-000-000-euros-del-euromillon-que-haces.1658681/page-4!

USUARIO y PASSWORD (son opcionales): para poder descargar hilos de foros restringidos.

Extra: ejemplo de uso pasándole una LISTA de HILOS dentro de un fichero de texto (enlaces.txt):
Código:
phantomjs --cookies-file=cookies.txt --ignore-ssl-errors=true --web-security=false burbudump.js enlaces.txt USUARIO PASSWORD

Para cada hilo se genera una carpeta nueva (en la carpeta donde esté el ejecutable de PhantomJS) y dentro de esa carpeta se meten los PDFs de cada página.


No entiendo todo ese lenguaje de bakup, contenedor docker, etc...

¿Qué pasos exactamente hay que hacer para usando windows10 guardar hilos enteros? explicado para patosos de la informática. Gracias.
 
y hacer un mirror del floro mediante wget y luego subirlo a archive.org?

lástima que no vea lo de la vista de impresión, que había en vBulletin, con la que podías obtener versiones más ligeras de las páginas
 
Cuidadito con lo que vayáis a hacer con esas descargras. Aquí nadie hemos dado permiso para que lo que aquí se postea aparezca en otro sitio. Avisados estáis.
 
Última edición:
Bueno, jugad, jugad. Luego vendrán los lloros. Otro que no se lee las condiciones cuando se da de alta en un sitio.

a mi no me lo digas que no pienso mover un solo dedo para hacerme con copias de hilos de burbuja, pero mientras sea algo visible al publico, no hay nada ilegal, por eso está archive.org abierto desde hace años. Solo publica copias de lo que es visible al publico, y no incluye IPs ni emails de usuarios ni nada que sea confidencial

los que hagan copias de hilos tampoco pueden acceder a esa informacion conficencial, pero si hacen publicos en telegram o cualquier sitio como telegram, hilos que solo son visibles a usuarios registrados, entonces si pueden tener un problema. querido líder estará al tanto de estas movidas, pero sabe que sois como niños, y le dará igual.
 
a mi no me lo digas que no pienso mover un solo dedo para hacerme con copias de hilos de burbuja, pero mientras sea algo visible al publico, no hay nada ilegal, por eso está archive.org abierto desde hace años. Solo publica copias de lo que es visible al publico, y no incluye IPs ni emails de usuarios ni nada que sea confidencial

los que hagan copias de hilos tampoco pueden acceder a esa informacion conficencial, pero si hacen publicos en telegram o cualquier sitio como telegram, hilos que solo son visibles a usuarios registrados, entonces si pueden tener un problema. querido líder estará al tanto de estas movidas, pero sabe que sois como niños, y le dará igual.

Archive org no almacena todo. Informate. Hay límites. Intenta por ejemplo buscar contenidos de facebook, twitter, etc, en archive org.
 
Archive org no almacena todo. Informate. Hay límites. Intenta por ejemplo buscar contenidos de facebook, twitter, etc, en archive org.

estoy perfectamente informado, gracias.

pero es que no entiendes o no quieres entender, que a mi no me interesa lo más mínimo preservar nada de lo que se escribe en burbuja.

Aunque hace bastante tiempo que tuve curiosidad por como era el foro en sus inicios, y eché un vistazo a las copias que hay en archive.org, pues todo eso está publicado


Lo de los limites se lo explicas a otro, que a mi no me hace falta
 

Este es para mí el más importante de los que he escrito, aunque hay que descargar videos, no solo pdfs.
 
Sacad screenshot absolutamente de todo, no os dejéis ni una coma. Las generaciones futuras necesita comprobar hasta qué puñetero se puede ser ridículo y estar cognitivamente perdido.
 
@Clorhídrico una pregunta, he sacado copia de un hilo de tan solo 9 pags, y todo bien, pero las primeras 5 o 6 pantallas (pantalla abajo con la rueda del ratón) las ocupa lo que creo que es un banner publicitario, porque es como una página en blanco con cifras a la izquierda, justo despues de la cabecera de burbuja.info y antes del primer post.

¿Hay alguna manera de evitar eso? Quizá editando y borrando del .pdf?

De hantebraso y tal.
 
Volver