GIỚI THIỆU VỀ BIG DATA
TIL
595
Male avatar

sqlvietnam viết ngày 13/10/2016

GIỚI THIỆU VỀ BIG DATA

Giới thiệu.
Big data là gì? Khi mà nghe đến Big Data, điều đầu tiên trong suy nghĩ của chúng ta là"Big data là một công cụ hay là một sản phẩm". Sự thật là: Big Data không phải là công cụ hay là sản phẩm. Big Data là một khái niệm mà miêu tả một khối lượng lớn dữ liệu(có cấu trúc, bán cấu trúc, và không được cấu trúc).
OKay, bây giờ tôi sẽ giải thích một cách dễ hiểu nhất khái niệm dữ liệu có cấu trúc và không có cấu trúc. Tôi sẽ không hướng dẫn chi tiết mà chỉ hướng dẫn tổng quan thôi.
Dữ liệu có cấu trúc(Structured data): dữ liệu có cấu trúc đề cập đến CSDL quan hệ như: SQL, Oracle, v.v...
Dữ liệu bán cấu trúc(Semi-Structured data): là một loại dữ liệu có cấu trúc nhưng nó không được xác định cấu trúc. Ví dụ: xml hay json.
Dữ liệu không cấu trúc(Unstructured data): đề cập đến cơ sở dữ liệu không có mối quan hệ hay bạn không dùng câu truy vấn như sql. Ví dụ: mongodb, documentdb, bigtable, v.v...
Tôi sẽ quay lại những khái niệm trên chi tiết trong một bài báo khác.
Những thành phần của Big Data
Theo công ty nghiên cứu của Mỹ và nhà tư vấn xác nhận Big Data của Gartner theo mô hình sau "3Vs". 3V là chuẩn cho: Volume, Variety và Velocity(khối lượng, đa dạng, và tốc độ).
Volume:
Cái tên đã nói lên khối lượng dữ liệu. Sau khi tìm kiếm trên Google tôi đã tìm thấy những thành phần thú vị về dữ liệu được tạo ra mỗi ngày. Điển hình là trang gwava.com. Có rất nhiều tài liệu liên quan. Bao gồm: Social Media, Sensor network, Search data, Email, Military Surveillance, Medicals.

Variety: Như tên được đưa ra nó chỉ định sự đa dạng của dữ liệu. Bạn có thể dùng dữ liệu như: văn bản, email, audio, video, hình ảnh, và dữ liệu được tạo ra một cách máy móc từ bộ cảm biến(sensors) v.v...

Velocity:
Tốc độ sẽ quản lý luồng dữ liệu và sự di chuyển của dữ liệu ở tốc độ cao.

Bình luận


White
{{ comment.user.name }}
Bỏ hay Hay
{{comment.like_count}}
Male avatar
{{ comment_error }}
Hủy
   

Hiển thị thử

Chỉnh sửa

Male avatar

sqlvietnam

1 bài viết.
0 người follow
Kipalog
{{userFollowed ? 'Following' : 'Follow'}}
Bài viết liên quan
White
0 2
fCC: Technical Documentation Page note So I have finished the HTML part of this exercise and I want to come here to lament about the lengthy HTML ...
HungHayHo viết 1 tháng trước
0 2
White
19 1
Toán tử XOR có tính chất: + A XOR A = 0 + 0 XOR A = A Với tính chất này, có thể cài đặt bài toán sau với độ phức tạp O(N) về runtime, và với O(1)...
kiennt viết gần 2 năm trước
19 1
White
1 1
Chào mọi người, hôm nay mình viết một bài TIL nhỏ về cách lấy độ phân giải của màn hình hiện tại đang sử dụng. xdpyinfo | grep dimensions Kết quả...
namtx viết 1 năm trước
1 1
{{like_count}}

kipalog

{{ comment_count }}

bình luận

{{liked ? "Đã kipalog" : "Kipalog"}}


Male avatar
{{userFollowed ? 'Following' : 'Follow'}}
1 bài viết.
0 người follow

 Đầu mục bài viết

Vẫn còn nữa! x

Kipalog vẫn còn rất nhiều bài viết hay và chủ đề thú vị chờ bạn khám phá!