1. Giới thiệu về Storm
Storm là một hệ thống tính toán thời gian thực phân tán mã nguồn mở để xử lý các luồng dữ liệu, khả năng xử lý hơn một triệu công việc trên một nút chỉ trong một phần giây. Storm cũng được tích hợp với Hadoop để khai thác thông lượng cao hơn, được tích hợp với bất kỳ ngôn ngữ lập trình nào. Tuple là cấu trúc dữ liệu chính trong Storm, đó là danh sách các yếu tố được sắp xếp, một Tuple hỗ trợ tất cả các kiểu dữ liệu, Stream là một chuỗi các tuple không sắp xếp, Spouts là nguồn của stream, một spout có thể được xem là một nơi tiếp nhận các dữ liệu đầu vào trong mô hình kiến trúc Storm.
Download Storm, Quản lý, phân tích dữ liệu theo luồng
Storm cung cấp tính năng xử lý dữ liệu thời gian thực, chẳng hạn: Storm UI REST API truy xuất dữ liệu số liệu, cấu hình thông tin và quản lý các hoạt động. Storm có khả năng chịu lỗi, linh hoạt, đáng tin cậy và hỗ trợ nhiều ngôn ngữ. Storm có thể theo kịp hiệu suất ngay cả khi tăng tải bằng cách thêm tài nguyên tuyến tính, khả năng mở rộng cao, thực hiện làm mới dữ liệu và phản hồi phân phối từ đầu đến cuối trong trong thời gian nhanh chóng, đảm bảo xử lý dữ liệu ngay cả khi kết nối trong 1 cluster bị hỏng.
2. Các đặc điểm chính của Storm:
- Cho phép xử lý luồng thời gian thực.
- Storm gồm ba thành phần quan trọng: Topo, Stream và Spout.
- Tương tác với nhiều ngôn ngữ lập trình.
- Làm mới dữ liệu và phản hồi nhanh chóng.
3. App liên quan
Tableau Public cũng là nền tảng phân tích dữ liệu mạnh mẽ, thiết kế các biểu đồ tương tác, bản đồ và bảng điều khiển thời gian thực chỉ trong vài phút, bên cạnh đó Tableau Public cũng có khả năng truy cập trực tiếp vào Google Analytics, tương thích với nhiều định dạng dữ liệu khác nhau.