Data hay còn gọi là dữ liệu, chỉ đơn giản là số liệu – bit thông tin, nhưng không phải là thông tin. Khi dữ liệu được xử lý, giải thích, sắp xếp cấu trúc hoặc trình bày để làm cho chúng có ý nghĩa và hữu ích hơn thì chúng được gọi là thông tin.
“Dữ liệu” và “thông tin” luôn song hành cùng nhau. Việc chúng được sử dụng thay thế cho nhau phụ thuộc phần nào vào việc sử dụng “dữ liệu” – bối cảnh của nó.
Ngày nay dữ liệu tồn tại khắp mọi nơi và trong hầu hết các lĩnh vực. Cho dù bạn là nhà khoa học nghiên cứu dữ liệu, tiếp thị, doanh nhân, chuyên viên phân tích dữ liệu hay bạn đang làm bất kỳ ngành nghề nào khác, bạn đều cần đến dữ liệu thô hoặc dữ liệu cấu trúc. Dữ liệu này rất quan trọng đối với chúng ta nên việc xử lý và lưu trữ đúng cách để không xảy ra bất kỳ lỗi nào trở nên rất quan trọng. Trong khi làm việc với những dữ liệu này, bạn cần phải tìm hiểu kỹ về chúng. Có hai loại dữ liệu chính:
Dữ liệu định tính: hay còn được gọi là dữ liệu phân loại, có thể được đo hoặc tính dưới dạng số. Các loại dữ liệu này được sắp xếp theo thể loại, không phải theo số. Đó là lý do tại sao nó còn được gọi là dữ liệu phân loại. Những dữ liệu này bao gồm âm thanh, hình ảnh, biểu tượng hoặc văn bản. Giới tính của một người, tức là, nam hoặc nữ là dữ liệu định tính.
Dữ liệu định lượng: Dữ liệu định lượng có thể được biểu thị bằng các giá trị số, nghĩa là nó có thể đếm được và kể cả phân tích dữ liệu thống kê. Loại dữ liệu này còn được gọi với cái tên là dữ liệu số.
Dữ liệu định tính cho biết về nhận thức của mọi người và giúp các nhà nghiên cứu thị trường hiểu thị hiếu của khách hàng và sau đó lên ý tưởng và chiến lược phù hợp. Nó được chia thành hai loại dữ liệu khác:
Dữ liệu định danh (Nominal Data): Dữ liệu định danh được sử dụng để dán nhãn các biến để phân biệt các biến với nhau. Màu tóc có thể được coi là dữ liệu định danh, vì một màu có thể được so sánh với một màu khác.
Ví dụ: Màu tóc (đen, nâu, đỏ,…), quốc tịch (Việt Nam, Lào, Thái Lan,…)
Dữ liệu thứ bậc (Ordinal Data): Dữ liệu thứ bậc là dữ liệu định tính mà giá trị của chúng có vị trí tương đối. Các loại dữ liệu này có thể được coi là ở giữa dữ liệu định tính và dữ liệu định lượng. Dữ liệu thứ bậc chỉ hiển thị các chuỗi và không thể sử dụng để phân tích thống kê.
Ví dụ: Các lớp thư trong kỳ thi (a, b, c, d…); tình trạng kinh tế (cao, trung bình và thấp).
Dữ liệu định lượng có thể được sử dụng để thao tác thống kê và các dữ liệu này có thể được biểu diễn bằng nhiều biểu đồ như biểu đồ cột, biểu đường, biểu đồ tròn,… và chia thành hai loại dữ liệu khác:
Dữ liệu rời rạc (Discrete Data): Dữ liệu riêng biệt chứa các giá trị thuộc số nguyên hoặc số lượng toàn bộ. Những dữ liệu này có thể được chia thành các giá trị thập phân hoặc phân số.
Ví dụ: Tổng số học sinh có mặt trong một lớp học; chi phí của điện thoại di động,…
Dữ liệu liên tục (Continuous Data): Dữ liệu liên tục thể hiện thông tin có thể được chia thành các cấp độ nhỏ hơn. Biến liên tục có thể lấy bất kỳ giá trị nào trong một phạm vi.
Ví dụ: Chiều cao của một người; tốc độ của một chiếc xe,…
Khái niệm dữ liệu từ máy tính được xuất hiện công trình nghiên cứu của Claude Shannon, một nhà toán học người Mỹ được biết đến là cha đẻ của lý thuyết thông tin. Ông đã đặt nền móng cho khái niệm kỹ thuật số nhị phân dựa trên việc áp dụng hai giá trị logic Boolean cho các mạch điện tử. Nhờ vào khái niệm này các chuyên gia đã ứng dụng kỹ thuật số nhị phân làm nền tảng cho CPU , bộ nhớ bán dẫn và ổ đĩa, cũng như nhiều thiết bị khác phổ biến trong máy tính ngày nay. ban đầu họ chỉ áp dụng cho thiết bị điều khiển và dữ liệu có dạng thẻ đục lỗ , sau đó phát triển thêm đến băng từ và đĩa cứng.
Ngay từ sớm, tầm quan trọng của dữ liệu trong máy tính kinh doanh đã trở nên rõ ràng bởi sự phổ biến của các thuật ngữ “xử lý dữ liệu” và “xử lý dữ liệu điện tử”, mà mọi người vẫn thường hay biết đến với tên gọi công nghệ thông tin. Trong việc quản lý phần mềm máy tính doanh nghiệp, sự chuyên môn hóa đã xuất hiện và quá trình phát triển dữ liệu công ty đã được phát triển hơn.
Data là một thuật ngữ phổ biến trong lĩnh vực công nghệ thông tin. Nếu bạn muốn hiểu chuyên sâu về lĩnh vực này cũng như là hiểu hơn về Data, bạn có thể tìm hiểu các thuật ngữ liên quan mà các chuyên gia thường dùng như là:
Thu thập dữ liệu (Data Acquisition): Thu thập dữ liệu là quá trình lấy tín hiệu đo lường và chuyển đổi các mẫu kết quả thành các giá trị số.
Cơ sở dữ liệu (Database): Cơ sở dữ liệu là tập hợp các dữ liệu có liên quan đến nhau và được lưu trữ và truy cập từ hệ thống máy tính.
Khối dữ liệu (Data Block): Khối dữ liệu là cấp độ lưu trữ logic nhỏ nhất trong Oracle Database.
NAS SYNOLOGY giúp cá nhân, và các doanh nghiệp lưu trữ dữ liệu an toàn, bảo mật và làm việc hiệu quả hơn!