Bạn có chắc chắn muốn xóa bài viết này không ?
Bạn có chắc chắn muốn xóa bình luận này không ?
Data Lake không phải chỉ là tống raw data vào Hadoop
Data Lake không phải chỉ là tống raw data vào Hadoop
Này thì data lake: The Compelling Advantages of a Cloud Data Lake
Một trong những vấn đề lớn nhất với data lake đó là người ta cảm thấy khái niệm này rất rối rắm. Liệu có vải cứ tống hết raw data vào Hadoop nghĩa là sẽ có data lake? Câu trả lời là không! Nếu không có một bộ khung tổ chức khoa học, cách làm trên sẽ lại biến đống dữ liệu thành những silo, thành đầm lầy, và những khoản đầu tư vào data lake sẽ không đem lại hiệu quả như kỳ vọng.
Để thành công, một data lake cần được xây dựng dựa trên các cơ chế để thu thập data, lưu data, phân loại data, bảo mật data, phân tích data, đồng thời hỗ trợ việc cộng tác và chia sẻ những thông tin tìm được trên data.






