Data Mining: Understanding the data

This is an attempt to learn how Unsupervised learning is done on random Text data.

We use CountVectorizer, Tf-IdfVectorizer Modules of Python to visualize Document to Document Similarity matrix. We use built-in clustering libraries for K-Means clustering and so on.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Data Mining: Understanding the data

This is an attempt to learn how Unsupervised learning is done on random Text data.

Files

README.md

Latest commit

History

README.md

File metadata and controls

Data Mining: Understanding the data

This is an attempt to learn how Unsupervised learning is done on random Text data.