1. Giới thiệu về OpenRefine
OpenRefine có thể giúp bạn khám phá các tập dữ liệu lớn một cách dễ dàng, sử dụng để liên kết và mở rộng tập dữ liệu của bạn với các dịch vụ web khác nhau, tải dữ liệu đã làm sạch của bạn lên cơ sở dữ liệu trung tâm, chẳng hạn như Wikidata. OpenRefine hoạt động với các tệp cục bộ hoặc dữ liệu từ địa chỉ web ở một số định dạng tệp, bao gồm CSV, TSV, XLS, XML và các định dạng khác; khả năng tìm kiếm dữ liệu trùng lặp, dữ liệu không nhất quán và các mẫu lỗi để sửa và làm sạch hàng loạt.
Download OpenRefine, Phân tích, chuyển đổi dữ liệu
OpenRefine có khả năng lọc hoặc tìm kiếm các phần tử dữ liệu nhất định cần được thay đổi, điều này giới hạn chế độ xem chỉ ở các ô, hàng hoặc cột có liên quan chứa các phần tử. OpenRefine cung cấp các công cụ phân tích nhanh chóng về dữ liệu có trong tệp, chức năng hoàn tác cho tất cả các hành động được thực hiện trên dữ liệu, giúp tiết kiệm thời gian và công sức. OpenRefine cũng sử dụng Google Refine Expression Language (GREL) làm ngôn ngữ mẹ đẻ để chuyển đổi dữ liệu hiện có.
2. Các đặc điểm chính của OpenRefine:
- Phân tích, khám phá dữ liệu để xem bức tranh toàn cảnh.
- Hoạt động với các tệp cục bộ hoặc dữ liệu từ địa chỉ web.
- Lọc hoặc tìm kiếm các phần tử nhất định.
- Chức năng hoàn tác cho các hành động xử lý dữ liệu.
- Chuyển đổi dữ liệu hiện có hoặc để tạo dữ liệu mới.
3. App liên quan
IBM Analytics cũng là công cụ phân tích dữ liệu dựa trên công nghệ đám mây cho phép bạn khám phá tất cả mọi đặc điểm cho của dữ liệu, khả năng phân tích chuyên sâu đối với mọi nguồn dữ liệu, bên cạnh đó IBM Analytics còn giúp bạn tạo ra các biểu đồ trực quan để bạn thấy nhiều thông tin hơn về các dữ liệu được cung cấp.