Este programa es una herramienta de código abierto diseñada para realizar operaciones de scraping y descarga de medios desde un onion link en la deep web de manera automatizada. Utiliza la red Tor para asegurar la privacidad y el anonimato durante las operaciones de scraping, garantizando que las solicitudes sean enrutadas de forma anónima a través de nodos Tor.
Todas las imágenes, documentos, links y comentarios del código fuente se almacenan en el directorio /Media, dentro de la carpeta con el nombre del site que hemos introducido.
- Kali Linux 2024.1
- Kali Nethunter
- Arc Linux
git clone /~https://github.com/afsh4ck/DarkScrap.git
pip3 install -r requirements.txt
python3 darkscrap.py
Es necesario iniciar TOR antes de ejecutar la herramienta de la siguiente manera:
sudo apt update
sudo apt install tor
sudo service tor start
sudo service tor status
https://youtu.be/SbdPsxYT_mU?si=gKIolbbuNXKMUycs
- Descarga de Medios: Descarga todos los archivos multimedia desde un Onion Link.
- Scraping desde URL Única: Obtén enlaces, comentarios y media desde una única URL.
- Reconocimiento Facial: Reconocimiento de rostros en imágenes obtenidas.
- Scraping desde Archivos:
- Txt: Scraping desde un archivo de texto con múltiples URLs.
- Csv: Scraping desde un archivo CSV con múltiples URLs.
- Excel: Crawling desde un archivo Excel con múltiples URLs.
Este programa está basado en el programa original Dark Scrape (fuera de mantenimiento), añadiendo nuevas funcionalidades y mejoras, cómo:
- La descarga automática de documentos e imágenes
- El scraping de links y comentarios del código fuente a un archivo de texto
- La creación de una carpeta con el nombre del site y mejor gestión de archivos
- Manejo de excepciones y mantenimiento