download Apache Spark 3.0.2

Apache Spark

 3.0.2

Download Apache Spark - Công cụ phân tích Big Data

Hoàng Gia Bách  cập nhật: 15/06/2021

Apache Spark là công cụ phân tích dữ liệu dựa trên hệ thống xử lý phân tán mã nguồn mở được sử dụng cho các tập dữ liệu có kích thước rất lớn. Apache Spark sử dụng kỹ thuật In-Memory Caching và thực thi truy vấn được tối ưu hóa để truy xuất nhanh đối với dữ liệu ở bất kỳ kích thước nào. Nói một cách đơn giản, Spark là một công cụ phân tích Big Data để xử lý dữ liệu quy mô lớn.


1. Giới thiệu chung về Apache Spark

Apache Spark là một khung xử lý Big Data mã nguồn mở được xây dựng dựa trên tốc độ, tính dễ sử dụng và khả năng phân tích phức tạp. Spark cung cấp một framework toàn diện, thống nhất để quản lý các yêu cầu xử lý dữ liệu lớn với nhiều bộ dữ liệu đa dạng về bản chất (dữ liệu văn bản, dữ liệu biểu đồ...), cũng như nguồn dữ liệu. Spark cho phép bạn nhanh chóng viết các ứng dụng bằng Java, Scala hoặc Python.

apachespark

Download Apache Spark - Công cụ phân tích Big Data

Nó hỗ trợ truy vấn SQL (SparkSQL), dữ liệu trực tuyến (SparkStreaming), học máy (Spark Mllib) và xử lý dữ liệu đồ thị (SparkGraphX). Spark đưa MapReduce lên một tầm cao mới với việc xử lý dữ liệu nhanh chóng và ít tốn kém hơn. Với các khả năng như lưu trữ dữ liệu trong bộ nhớ và xử lý dữ liệu trong thời gian thực, hiệu suất có thể nhanh hơn nhiều lần so với các công nghệ xử lý Big Data khác.

2. Tính năng chính của Apache Spark

- Tốc độ xử lý dữ liệu siêu nhanh: Chạy nhanh hơn 100 lần trong bộ nhớ và nhanh hơn 10 lần trên đĩa trong cụm Hadoop (Hadoop cluster).

- Dễ sử dụng và linh hoạt: Apache Spark hỗ trợ nhiều ngôn ngữ lập trình và cho phép các nhà phát triển viết ứng dụng bằng Java, Scala, R hoặc Python.

- In-Memory Computing - Xử lý dữ liệu trên bộ nhớ tạm: Spark lưu trữ dữ liệu trong RAM của máy chủ, cho phép truy cập nhanh và do đó tăng tốc độ phân tích.

- Xử lý dữ liệu trong thời gian thực: Không giống như MapReduce chỉ xử lý dữ liệu được lưu trữ, Spark có thể xử lý dữ liệu thời gian thực và do đó, có thể tạo ra kết quả tức thì.

- Phân tích dữ liệu tốt: Apache Spark bao gồm một tập hợp phong phú các truy vấn SQL phong phú, học máy, thuật toán, phân tích phức tạp... Với tất cả các chức năng này, việc phân tích dữ liệu có thể được thực hiện theo cách tốt hơn với sự trợ giúp của Spark.

3. Phần mềm liên quan

Splice Machine cũng là công cụ tự động phân đoạn lưu trữ dựa trên dòng dữ liệu (Row-based) giữa các máy chủ trong khu vực để xử lý giao dịch trực tuyến (OLTP) có độ trễ thấp, bên cạnh đó Splice Machine còn có khả năng xử lý, triển khai dữ liệu tại chỗ hoặc dưới dạng dịch vụ đám mây được quản lý hoàn toàn.


Liên kết tải về - [100 MB]

Bấm vào [Link File] để tải về phần mềm, hoặc tải phiên bản phù hợp phía dưới

Liên kết dự phòng:
Các phiên bản khác



Bài viết liên quan

 Thông tin giới thiệu, hướng dẫn sử dụng phần mềm Apache Spark được biên soạn nhằm giúp bạn có thêm thông tin tham khảo, việc daoloat apache spark là hoàn toàn miễn phí, bạn có thể chi tiết nội dung tại mục "Điều khoản".

Các phiên bảnHướng dẫn

   Tải về

Apache Spark 3.0.2


Phần mềm Liên quan & Tương tự
  • Skytree 3/5 Công cụ phân tích dữ liệu khối lượng lớn
  • Xplenty 3/5 Phân tích, chia sẻ dữ liệu dựa trên đám mây
  • PlotlyCông cụ phân tích và trực quan hóa dữ liệu
  • TalendPhần mềm phân tích và xử lý dữ liệu
  • LumifyPhân tích và trực quan hóa hệ thống Big Data
  • Microsoft HDInsightDịch vụ phân tích dữ liệu mã nguồn mở
  • Splice MachineHệ thống quản lý cơ sở dữ liệu quan hệ SQL
  • Apache SAMOANền tảng mã nguồn mở để khai phá các luồng dữ liệu
  • SAGA PortablePhân tích dữ liệu địa lý
  • KML GeneratorPhân tích dữ liệu GPS
Bấm vào file dưới
Để cài phần mềm