Всё, что регистрирует человек и созданные им машины является данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Для того чтобы извлечь из этих сырых данных какие-либо закономерности (знания) применяются методы анализа данных.

Анализ данных занимается вопросами фильтрации и преобразования данных, открытием новых характеристик данных, задачами предсказания, классификации и кластеризации. Математическую основу анализа данных составляют методы математической статистики.

Курс посвящен современной технологии обработки данных — интеллектуальному анализу данных (Data Mining). Data Mining — это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации закономерностей, необходимых для принятия решений в различных сферах человеческой деятельности.