Data labeling (gán nhãn dữ liệu) được sử dụng trong quy trình chuẩn bị dữ liệu và xây dựng mô hình AI. Cung cấp ngữ cảnh để máy học hỏi trên dữ liệu đã được gán nhãn đó.
Data Warehouse hay còn được hiểu như một kho lưu trữ trung tâm được thiết kế để hỗ trợ việc truy vấn và phân tích các dữ liệu cho mục đích thống kê và phân tích kinh doanh. Sau khi hoàn thành giao dịch, dữ liệu đi vào kho sẽ được xử lý, chuyển đổi để người dùng có thể truy cập những dữ liệu này thông qua nhiều công cụ khác nhau.
Data mart là một tập con của một kho thông tin dữ liệu lớn. Nó được thiết kế ra để một bộ phận cụ thể trong một tổ chức sử dụng như tiếp thị, nhân sự, bán hàng, tài chính,… và được kiểm soát bởi một bộ phận duy nhất trong tổ chức.