DBDM - Database and Data Mining Group

The DBDM Group carries out its research activity in various areas within the field of data mining and databases. Data mining tackles the study of algorithms aimed at discovering "hidden" information stored in large data collections. The problem of extracting such information is a rather complex due to the large number of variables that must be taken into account. Moreover, the complexity significantly increases when increasing the volume of the data to be processed (Big Data). Big Data underlines the limits of the existing data mining techniques and poses new challenges for the design of novel algorithms to address data analysis. The research activity of the DBDM Group focuses on the study of algorithms for diverse data mining tasks on Big Data, including association rule mining to discover correlation among data at different abstraction levels, the extraction of knowledge for performing predictions (classification task), grouping of similar data (clustering task). The data analytic algorithms, in the Big Data context, must provide the necessary scalability, accessibility, extensibility, and flexibility. The proposed algorithms are validated in different application contexts (e.g., network traffic data analysis, text mining and social network applications, health and medical applications, financial applications).

Skills

  • Design on novel algorithms for Big Data analysis
  • Integration of data mining techniques in relational databases, e.g., by defining novel types of indices
  • Definition of disk-based indices to support data mining algorithms
  • Classification of structured (relational), semi-structured (XML) and unstructured data (text documents)
  • Text mining for social network analysis
  • Application of data mining techniques to network traffic data
  • Application of data mining techniques to clinical and biological data
  • Application of data mining techniques to sensor network data

Projects and publications

  • Selected funded research projects
    • EMPOWERING MULTILINGUAL INCLUSIVE COMMUNICATION (E-MIMIC)
      CERQUITELLI TANIA
      2023 - 2025 (Current)
    • ACRE: AI-BASED CAUSALITY AND REASONING FOR DECEPTIVE ASSETS
      GIORDANO DANILO
      2023 - 2025 (Current)
    • XINTERNET (EXPLAINABLE INTERNET)
      MELLIA MARCO
      2023 - 2025 (Current)
    • CONTRATTO DI RICERCA TRA IL POLITECNICO (DAUIN) E INTESA SANPAOLO INNOVATION CENTER S.P.A PER LA REALIZZAZIONE DEL PROGETTO DI RICERCA “AI FOR TREND ANALYSIS CONTENT ANNOTATION AND SUMMARIZATION”
      CAGLIERO LUCA
      2023 - 2024 (Current)
    • REALIZZAZIONE DI UNA PIATTAFORMA WEB PER IL COLLEGAMENTO DELL’INTERO ECOSISTEMA TURISTICO NAZIONALE AL FINE DI VALORIZZARE, INTEGRARE E FAVORIRE L’OFFERTA TURISTICA COMPLESSIVA
      APILETTI DANIELE
      2023 - 2024 (Current)
    • IMEDA - IMPROVING EFFICIENCY IN DETECTION ANALYSIS
      GIOBERGIA FLAVIO, MELLIA MARCO
      2023 - 2024 (Current)
    • MODELLI STATISTICI, DATA ANALYTICS E MACHINE LEARNING
      CAGLIERO LUCA, VASSIO LUCA
      2023 - 2024 (Current)
    • ALGORITMI DI DATA MINING E MACHINE LEARNING PER SISTEMI DI CYBERSECURITY IN AMBITO WEB
      GARZA PAOLO
      2022 - 2024 (Current)
    • MANAGE 5.0 - MANUFACTURING AUTOMOTIVE GREEN EVOLUTION 5.0
      MELLIA MARCO
      2022 - 2024 (Current)
    • ACCORDO ATTUATIVO TRA IL DIPARTIMENTO DI ELETTRONICA E TELECOMUNICAZIONI DET E IL CONSORTIUM GARR
      MELLIA MARCO
      2021 - 2024 (Current)
    • READING (&) MACHINE. LA PROMOZIONE DELLA LETTURA VERSO IL FUTURO
      MELLIA MARCO
      2022 - 2023 (Current)
    • TOWARD A ZERO DEFECTS MANUFACTURING PROCESS WITH ARTIFICIAL INTELLIGENCE APPLICATIONS
      GIORDANO DANILO
      2020 - 2021 (Current)
    • SUPERVISIONE ALLE ATTIVITÀ DI RICERCA PER LA PROGETTAZIONE DI MODELLI DI INTELLIGENZA ARTIFICIALE PER IL SELF-ASSESSMENT DI COMPLIANCE CON STANDARD AVANZATI PER LA CYBERSECURITY DI SISTEMI AUTOMOTIVE (ISO-21434 E UN-ECE REGULATION 155)
      CAGLIERO LUCA
      2023 - 2023 (Completed)
    • PRODUCTION LINE QUALITY ENHANCEMENT USING ADVANCED DATA ANALYSIS
      GIORDANO DANILO
      2022 - 2023 (Completed)
    • CONTRATTO DI RICERCA TRA IL POLITECNICO (DAUIN), INTESA SANPAOLO SPA E INTESA SANPAOLO INNOVATION CENTER (NELL’AMBITO DELL’ACCORDO QUADRO DI COLLABORAZIONE TRA INTESA SANPAOLO SPA E POLITECNICO DI TORINO - RIF. 146/2019) PER LA REALIZZAZIONE DEL PROGETTO DI RICERCA “HIDDEN RISK”
      BARALIS ELENA MARIA
      2022 - 2023 (Completed)
    • PROGETTAZIONE E REALIZZAZIONE ALGORITMI DI PIANIFICAZIONE PER LA SCHEDULAZIONE AVANZATA DELLA PRODUZIONE PER PICCOLE E MEDIE IMPRESE
      CERQUITELLI TANIA, DELLA CROCE DI DOJOLA FEDERICO
      2022 - 2023 (Completed)
    • PROGETTAZIONE E REALIZZAZIONE ALGORITMI DI PIANIFICAZIONE PER LA SCHEDULAZIONE AVANZATA DELLA PRODUZIONE PER PICCOLE E MEDIE IMPRESE
      CERQUITELLI TANIA, GHIRARDI MARCO
      2022 - 2023 (Completed)
    • PROGETTAZIONE E REALIZZAZIONE ALGORITMI DI PIANIFICAZIONE PER LA SCHEDULAZIONE AVANZATA DELLA PRODUZIONE PER PICCOLE E MEDIE IMPRESE
      CERQUITELLI TANIA, SALASSA FABIO GUIDO MARIO
      2022 - 2023 (Completed)
    • AI-ASSISTED NETWORK SECURITY
      VASSIO LUCA
      2022 - 2023 (Completed)
    • DATA, ARTIFICIAL INTELLIGENCE METHODS & STRATEGIC DECISION MAKING: A CASE STUDY IN MOTORSPORTS
      CERQUITELLI TANIA
      2022 - 2023 (Completed)
    • MODELLI STATISTICI, DATA ANALYTICS E MACHINE LEARNING
      CAGLIERO LUCA, RISSO FULVIO GIOVANNI OTTAVIO, URGESE GIANVITO, VASSIO LUCA
      2022 - 2023 (Completed)
    • DATA & CONCEPT DRIFT METHODOLOGIES: UNSUPERVISED ESTIMATION OF PREDICTIVE MODEL DEGRADATION FOR HIGH-PERFORMANCE COMPUTING CLUSTER
      CERQUITELLI TANIA
      2022 - 2023 (Completed)
    • TECNICHE DI INTELLIGENZA ARTIFICIALE APPLICATE ALLO STUDIO DI FENOMENI FISICI PER LA RISOLUZIONE DI RETI DI FLUSSI NEL DIMENSIONAMENTO DI IMPIANTI TERMOTECNICI
      APILETTI DANIELE
      2022 - 2023 (Completed)
    • ENTREPRENEURS AS SCIENTISTS: WHEN AND HOW START-UPS BENEFIT FROM A SCIENTIFIC APPROACH TO DECISION MAKING
      CAGLIERO LUCA, UGHETTO ELISA
      2020 - 2023 (Completed)
    • MACHINE LEARNING FOR NETWORK SUPERVISION AND FAULT MANAGEMENT
      GARZA PAOLO
      2022 - 2022 (Completed)
    • CHARACTERIZATION OF QUALITY OF EXPERIENCE IN MOBILE NETWORKS
      MELLIA MARCO
      2022 - 2022 (Completed)
    • MACHINE LEARNING ON HPC
      CERQUITELLI TANIA
      2021 - 2022 (Completed)
    • NETWORK MONITORING FOR QOE ASSESSMENT
      BIANCO ANDREA, GIORDANO DANILO
      2021 - 2022 (Completed)
    • FATA: FORMAZIONE ADATTIVA MEDIANTE TECNOLOGIE AVANZATE
      CERQUITELLI TANIA
      2021 - 2022 (Completed)
    • PIMCITY: BUILDING THE NEXT GENERATION PERSONAL DATA PLATFORMS
      MELLIA MARCO
      2019 - 2022 (Completed)
    • TECNICHE DI MACHINE LEARNING E DATA SCIENCE PER CLINICAL TRIALS E PLF
      APILETTI DANIELE
      2021 - 2021 (Completed)
    • MACHINE LEARNING FOR NETWORKSUPERVISION AND FAULT MANAGEMENT
      GARZA PAOLO
      2021 - 2021 (Completed)
    • NETWORK PERFORMANCE & VIDEO
      MELLIA MARCO
      2021 - 2021 (Completed)
    • TELEMATICA APPLICATA AL SETTORE DELLE ASSICURAZIONI: RILEVAZIONE DI DATI GREZZI ED ANALISI MEDIANTE TECNICHE DI INTELLIGENZA ARTIFICIALE
      CAGLIERO LUCA, GATTESCHI VALENTINA, LAMBERTI FABRIZIO
      2020 - 2021 (Completed)
    • AI-ASSISTED NETWORK SECURITY
      MELLIA MARCO
      2020 - 2021 (Completed)
    • ANALISI DI DATI DI VEICOLI CONNESSI PER OTTIMIZZARE L'UPTIME DELLE BATTERIE
      CERQUITELLI TANIA
      2020 - 2021 (Completed)
    • PIATTAFORMA DI PREDICTIVE MAINTENANCE VIBRAZIONALE (PREMA): PROGETTAZIONE E SVILUPPO DEL COMPONENTE PREMA BACKEND
      CERQUITELLI TANIA
      2020 - 2021 (Completed)
    • DEVELOPMENT OF A RAPID PROTOTYPING FLIGHT VEHICLE ENGINEERING TOOLSET
      CHIUSANO SILVIA ANNA, VIOLA NICOLE
      2020 - 2021 (Completed)
    • ATTIVITÀ DI SUPPORTO ALL’IMPLEMENTAZIONE DEL PIANO DI COMPAGNIA DI SAN PAOLO SISTEMA TORINO SCRL DI AGGIORNAMENTO DELLE INFRASTRUTTURE IT
      GIACCONE PAOLO, MELLIA MARCO
      2020 - 2021 (Completed)
    • PIATTAFORMA DI PREDICTIVE MAINTENANCE VIBRAZIONALE (PREMA): PROGETTAZIONE E SVILUPPO DEL COMPONENTE PREMA EDGE
      CERQUITELLI TANIA
      2020 - 2021 (Completed)
    • “MODELLI STATISTICI, DATA ANALYTICS E MACHINE LEARNING (YEAR 2020)”, “FOG COMPUTING E OPPORTUNISTIC NETWORKING (YEAR 2020)” E “DESIGN E IMPLEMENTAZIONE DI FUNZIONALITÀ FIRMWARE AVANZATE (YEAR 2020)”
      CAGLIERO LUCA, RISSO FULVIO GIOVANNI OTTAVIO, URGESE GIANVITO, VASSIO LUCA
      2020 - 2021 (Completed)
    • CENTRO DI COMPETENZA CALCOLO AD ALTE PRESTAZIONI E INTELLIGENZA ARTIFICIALE TORINO
      MELLIA MARCO, PICCOLO ELIO
      2018 - 2021 (Completed)
    • EUROPEAN INFRASTRUCTURE POWERING THE INTERNET OF THINGS
      CERQUITELLI TANIA, GERBALDI CLAUDIO
      2018 - 2021 (Completed)
    • TECNICHE DI MACHINE LEARNING E DATA SCIENCE PER LE FILIERE IN AMBITO CLINICO
      APILETTI DANIELE
      2020 - 2020 (Completed)
    • ANALISI DEI DATI PER MANUTENZIONE PREDITTIVA
      BARALIS ELENA MARIA
      2019 - 2020 (Completed)
    • SMART MANUFACTURING AND PROCESS IMPROVEMENT DRIVEN BY MACHINE LEARNING IN INDUSTRY 4.0
      BARALIS ELENA MARIA, GIORDANO DANILO
      2019 - 2020 (Completed)
    • MODELLI STATISTICI, DATA ANALYTICS E MACHINE LEARNING”, “FOG COMPUTING E OPPORTUNISTIC NETWORKING” E “DESIGN E IMPLEMENTAZIONE DI FUNZIONALITÀ FIRMWARE AVANZATE”
      CAGLIERO LUCA, MELLIA MARCO, RISSO FULVIO GIOVANNI OTTAVIO, URGESE GIANVITO
      2019 - 2020 (Completed)
    • VALUTAZIONE QUALITÀ DELL’INTRODUZIONE DI TECNICHE DI BIG DATA ED ANALYTICS
      CERQUITELLI TANIA
      2019 - 2020 (Completed)
    • ANALISI DI DATI TELEMATICI PER IL FLEET MANAGEMENT
      BARALIS ELENA MARIA
      2019 - 2020 (Completed)
    • PROGRESSING WP3 CARS URBAN MOBILITY MANAGEMENT AND NEW CONCEPTS
      GATTESCHI VALENTINA, LAMBERTI FABRIZIO, MELLIA MARCO
      2019 - 2020 (Completed)
    • R&D MOTION SICKNESS PREDICTION MODEL
      BARALIS ELENA MARIA, CHIUSANO SILVIA ANNA
      2019 - 2019 (Completed)
    • SUPPORT FOR HIGH FUEL PRESSURE PROGNOSTI AND FOR AT SYSTEM AGEING ON-FIELD AN
      BARALIS ELENA MARIA
      2018 - 2019 (Completed)
    • ENHANCED PORE TYPING IMAGE ANALYSIS AND EXTENDED PETROGRAPHY THROUGH MINERALOGY
      BARALIS ELENA MARIA
      2018 - 2019 (Completed)
    • MODELLI STATISTICI, DATA ANALYTICS E MACHINE LEARNING - FOG COMPUTING E OPPORTUNISTIC NETWORKING
      CAGLIERO LUCA, MELLIA MARCO, RISSO FULVIO GIOVANNI OTTAVIO
      2018 - 2019 (Completed)
    • MODELLAZIONE DELL’EFFICIENZA ENERGETICA DEGLI EDIFICI BASATA SU OPEN-DATA
      CERQUITELLI TANIA
      2018 - 2019 (Completed)
    • WP3 CARS URBAN MOBILITY MANAGEMENT AND NEW CONCEPTS
      MELLIA MARCO
      2018 - 2019 (Completed)
    • STUDIO E PROGETTAZIONE DI ALGORITMI PER INTERNET OF BOILERS
      CHIUSANO SILVIA ANNA
      2017 - 2019 (Completed)
    • IMPROVING RESILIENCE TO EMERGENCIES THROUGH ADVANCED CYBER TECHNOLOGIES
      BARALIS ELENA MARIA, CHIASSERINI CARLA FABIANA
      2016 - 2019 (Completed)
    • PROGETTAZIONE DI UNA SOLUZIONE PER LA GESTIONE DI DATI RACCOLTI DA RED-TAG
      CERQUITELLI TANIA
      2018 - 2018 (Completed)
    • ONSET SLEEP DETECTION DATA ANALYTICS
      BARALIS ELENA MARIA, CHIUSANO SILVIA ANNA
      2018 - 2018 (Completed)
    • NOISE APP DETECTION DEVELOPMENT
      BARALIS ELENA MARIA
      2018 - 2018 (Completed)
    • PROGETTAZIONE DI UNA SOLUZIONE A SUPPORTO DEL POSIZIONAMENTO AUTOMATICO DEI RED-TAG
      CERQUITELLI TANIA
      2018 - 2018 (Completed)
    • MOTION SICKNESS PREDICTION MODEL
      BARALIS ELENA MARIA, CHIUSANO SILVIA ANNA
      2018 - 2018 (Completed)
    • SUBSYSTEM SELECTION AND PRELIMINARY DATA AND PREVENTIVE DIAGNOSTIC MODELS
      BARALIS ELENA MARIA
      2017 - 2018 (Completed)
    • MONROE - MEASURING MOBILE BROADBAND NETWORKS IN EUROPE
      MELLIA MARCO
      2015 - 2018 (Completed)
    • STUDY OF STATE-OF-THE-ART METHODS AND TOOLS TO SIMILARITY SEARCH OF CAD OBJECTS
      CERQUITELLI TANIA
      2017 - 2017 (Completed)
    • PROGETTO N. 4 - RECURRENT NEURAL NETWORKS APPLIED TO NETWORK AND SERVICE DATA
      MELLIA MARCO
      2017 - 2017 (Completed)
    • ONTIC - ONLINE NETWORK TRAFFIC CHARACTERIZATION
      BARALIS ELENA MARIA
      2014 - 2017 (Completed)
    • SUBSYSTEM SELECTION AND PRELIMINARY DATA
      BARALIS ELENA MARIA
      2016 - 2016 (Completed)
    • DATA-CENTRIC GENOMIC COMPUTING (GENDATA 2020)
      BARALIS ELENA MARIA
      2013 - 2016 (Completed)
    • MPLANE-AN INTELLIGENT MEASUREMENTE PLANE FOR FUTURE NETWORK AND APPLICATION MANAGMENT
      BARALIS ELENA MARIA, MELLIA MARCO
      2012 - 2015 (Completed)
    • FI-WARE -FUTURE INTERNET CORE PLATFORM
      CHIUSANO SILVIA ANNA
      2014 - 2014 (Completed)
    • ANALISI DI ALGORITMI PER IL BILANCIAMENTO GEOGRAFICO DELLE BICICLETTE IN SISTEMI DI BIKE -SHARING
      BARALIS ELENA MARIA
      2013 - 2013 (Completed)
    • WEB-BI - WEB INTELLIGENCE
      BARALIS ELENA MARIA
      2012 - 2013 (Completed)
    • SMILE-O
      BARALIS ELENA MARIA
      2011 - 2013 (Completed)
    • ANALISI DEL PROCESSO DI MIGRAZIONE DI DATI PER LA NUOVA GESTIONE DELL'IMPOSTA PER L'IGIENE URBANA
      BARALIS ELENA MARIA
      2010 - 2010 (Completed)
    • DEFINIZIONE E PROGETTAZIONE DEL DATA WAREHOUSE AZIENDALE
      BARALIS ELENA MARIA
      2008 - 2009 (Completed)
    • CERTIFICAZIONE DELLA QUALITÀ DELLA BASE DI DATI PER LA GESTIONE DELLE DELEGHE SINDACALI
      BARALIS ELENA MARIA
      2008 - 2008 (Completed)
    • CARATTERIZZAZIONE DI TRAFFICO A LIVELLO TRASPORTO: ANALISI E MODELLI DI FLUSSI DATI E REAL TIME
      MELLIA MARCO
      2006 - 2008 (Completed)
    • VERIFICHE ATTINENTI L'ESTRAZIONE DEI DATI AI FINI DI UNA MIGRAZIONE DI SISTEMA INFORMATICO
      BARALIS ELENA MARIA
      2007 - 2007 (Completed)
    • CLASSIFICAZIONE DI DOCUMENTI XML
      BARALIS ELENA MARIA
      1999 - 2001 (Completed)
    • ESTRAZIONE DI INFORMAZIONI (DATA MINING) DAI DATI ESTRATTI DAL WEB
      BARALIS ELENA MARIA
      1998 - 2000 (Completed)