Skip to content

Herramienta completa de Scrapping en la Deep Web

License

Notifications You must be signed in to change notification settings

afsh4ck/DarkScrap

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DarkScrap

image

Descripción

Este programa es una herramienta de código abierto diseñada para realizar operaciones de scraping y descarga de medios desde un onion link en la deep web de manera automatizada. Utiliza la red Tor para asegurar la privacidad y el anonimato durante las operaciones de scraping, garantizando que las solicitudes sean enrutadas de forma anónima a través de nodos Tor.

Todas las imágenes, documentos, links y comentarios del código fuente se almacenan en el directorio /Media, dentro de la carpeta con el nombre del site que hemos introducido.

image

Testeado en

  • Kali Linux 2024.1
  • Kali Nethunter
  • Arc Linux

Instalación

git clone /~https://github.com/afsh4ck/DarkScrap.git
pip3 install -r requirements.txt
python3 darkscrap.py

Iniciar TOR

Es necesario iniciar TOR antes de ejecutar la herramienta de la siguiente manera:

sudo apt update
sudo apt install tor
sudo service tor start
sudo service tor status

Video de la herramienta

https://youtu.be/SbdPsxYT_mU?si=gKIolbbuNXKMUycs

Características

  • Descarga de Medios: Descarga todos los archivos multimedia desde un Onion Link.
  • Scraping desde URL Única: Obtén enlaces, comentarios y media desde una única URL.
  • Reconocimiento Facial: Reconocimiento de rostros en imágenes obtenidas.
  • Scraping desde Archivos:
    • Txt: Scraping desde un archivo de texto con múltiples URLs.
    • Csv: Scraping desde un archivo CSV con múltiples URLs.
    • Excel: Crawling desde un archivo Excel con múltiples URLs.

Autor

Inspiración:

Este programa está basado en el programa original Dark Scrape (fuera de mantenimiento), añadiendo nuevas funcionalidades y mejoras, cómo:

  • La descarga automática de documentos e imágenes
  • El scraping de links y comentarios del código fuente a un archivo de texto
  • La creación de una carpeta con el nombre del site y mejor gestión de archivos
  • Manejo de excepciones y mantenimiento

Soporte

buy-me-a-coffe

About

Herramienta completa de Scrapping en la Deep Web

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages