Cross Industry Standard Process for Data Mining ( CRISP-DM ) este un model de proces de extragere a datelor care descrie o abordare frecvent utilizată pentru rezolvarea problemelor de domeniu .
Sondajele efectuate în 2002, 2004, 2007, 2014 și 2020 arată că aceasta este principala metodă utilizată de minerii de date. Această metodă a fost creată de un consorțiu format din companiile NCR, SPSS și Daimler-Benz. Procesul definește o ierarhie constând din faze majore, sarcini generale, sarcini specializate și instanțe de proces.
CRISP-DM împarte procesul de extragere a datelor în șase faze principale:
Metoda CRISP-DM a fost concepută în 1996. În 1997, sa dezvoltat ca un proiect al Uniunii Europene finanțat de programul ESPRIT . Proiectul este condus de patru companii: ISL, NCR Corporation , Daimler-Benz și OHRA. Acest nucleu al consorțiului aduce experiențe diferite proiectului: ISL, dobândit ulterior și integrat în SPSS Inc. produce pachetele sale de software de analiză predictivă cu același nume, acum integrate în grupul IBM. Gigantul de calculatoare NCR Corporation a creat divizia Teradata specializată în depozite de date și propriul pachet software de data mining. Daimler-Benz avea o echipă numeroasă de mineri de date. OHRA , o companie de asigurări, tocmai începuse să exploreze potențialul de utilizare a exploatării datelor.
Prima versiune a metodei a fost lansată sub versiunea CRISP-DM 1.0 în 1999.
În iulie 2006, consorțiul anunță că va începe să lucreze la o a doua versiune a CRISP-DM. 26 septembrie 2006, CRISP-DM SIG se întâlnește pentru a discuta despre îmbunătățirile pentru CRISP-DM 2.0 și foaia de parcurs rezultată. De cand22 iunie 2011, site-ul redirecționează către o pagină de pe site-ul IBM dedicată SPSS.