Phân tích dữ liệu là một quá trình gồm các thao tác thu thập, mô hình và phân tích để rút ra những nhận định, hiểu biết để đưa ra quyết định. Có các phương pháp để thực hiện phân tích dữ liệu tùy thuộc và mục đích và ngành.
Dữ liệu thô chính là dữ liệu máy tính chưa qua chế biến, lọc và xử lý. Những thông tin này thường được lưu trữ trong một tập tin, hoặc có thể chỉ là một tập hợp các số và ký tự được lưu trữ trên ở trong ổ cứng của máy tính.