Skip to content

Latest commit

 

History

History
15 lines (8 loc) · 572 Bytes

README.md

File metadata and controls

15 lines (8 loc) · 572 Bytes

SPAM DETECTION

L'azienda ProfessionAI vuole realizzare una libreria capace di fare analisi delle email ricevute.

Nello specifico, il CEO ha richiesto di identificare le email di tipo SPAM sulle quali fare analisi contenutistiche.

Il CTO nello specifico ti fornisce un dataset e ti chiede di:

  • Addestrare un classificatore per identificare SPAM

  • Individuare i Topic principali tra le email SPAM presenti nel dataset

  • Calcolare la distanza semantica tra i topics ottenuti, per dedurne l'eterogeneità.

  • Estrarre dalle mail NON SPAM le Organizzazioni presenti.