FSpaceX là một nền tảng xử lý và phân tích dữ liệu dựa trên kiến trúc phân tán Hadoop.
FSpaceX là một nền tảng xử lý và phân tích dữ liệu dựa trên kiến trúc phân tán Hadoop. Nền tảng có thể cung cấp các chức năng dựa trên việc thu thập và lưu trữ dữ liệu không đồng nhất đa nguồn, làm sạch và lọc dữ liệu, xây dựng kho dữ liệu, ứng dụng thuật toán đa loại, trực quan hóa phân tích tích hợp và các chức năng khác để doanh nghiệp giải quyết các vấn đề về ứng dụng dữ liệu khác nhau được tạo ra trong tất cả các khâu của vòng đời sản phẩm, từ khách hàng đến sản xuất, để đạt được hiệu quả kinh tế và khả năng cạnh tranh của doanh nghiệp.
Công nghệ kiểm soát lực lượng có đội ngũ ứng dụng dữ liệu lớn chuyên nghiệp để cung cấp cho người dùng phân tích tổng hợp nhu cầu kinh doanh, sắp xếp các ứng dụng kinh doanh, thu thập dữ liệu, lưu trữ dữ liệu, tính toán xử lý dữ liệu, khai thác phân tích và lập kế hoạch giải pháp hiển thị trực quan, xác định mục tiêu xây dựng, thiết lập nguyên tắc xây dựng, xây dựng chương trình xây dựng và tiến hành phát triển nền tảng, thử nghiệm và triển khai. Sử dụng dữ liệu và kết hợp với các điểm đau sản xuất để không ngừng học hỏi tiến hóa, cải thiện mô hình quyết định, tối ưu hóa đề xuất quyết định.

Kiến trúc tổng thể của nền tảng dữ liệu lớn công nghiệp được chia thành ba tầng: nhà máy dữ liệu, công cụ thuật toán và trực quan hóa dữ liệu.
Nhà máy dữ liệu chủ yếu nhận ra việc thu thập, kiểm tra và lưu trữ dữ liệu không đồng nhất, thu thập dữ liệu có thể nhận ra sự hội tụ trên nhiều cơ sở dữ liệu không đồng nhất dựa trên cổng truyền thông công nghiệp, cơ sở dữ liệu thời gian thực, cơ sở dữ liệu nghiệp vụ quan hệ và các cổng khác; Kiểm tra dữ liệu chủ yếu là kiểm tra dữ liệu nhận được, cung cấp, giá trị null, loại dữ liệu và xác minh độ chính xác; Lưu trữ dữ liệu sử dụng phương pháp lưu trữ và phân tích dữ liệu được áp dụng bởi HBase, Greenplum, Redis và các tổ hợp cơ sở dữ liệu khác để xây dựng kiến trúc lưu trữ phân tán, có thể tự động tăng các nút lưu trữ, có khả năng mở rộng, nhiều bản sao, khả năng chịu lỗi cao, thông lượng cao và các tính năng khác.
Công cụ thuật toán cung cấp khung tính toán phân tán Spark, dựa trên cụm Hadoop để thực hiện việc sử dụng hiệu quả các nguồn lực, cho phép tính toán thời gian thực dữ liệu, khai thác phân tích dữ liệu khổng lồ. Hỗ trợ thư viện machine learning MLib, hỗ trợ các thuật toán học thông báo và các lớp công cụ bao gồm phân loại, phân cụm, lọc hợp tác, giảm chiều.
Trực quan hóa dữ liệu cung cấp các chức năng mô hình hóa như bộ dữ liệu, thành phần bộ giá trị động và tĩnh, lọc dữ liệu, chuyển đổi định dạng dữ liệu, hỗ trợ các chức năng như thao tác kéo và thả, biểu đồ phong phú, liên kết biểu đồ, khoan lên và xuống, typography cá nhân, thư hẹn giờ, GIS và tích hợp đa phương tiện.

-
Dữ liệu không đồng nhất có thể được truy cập, bao gồm dữ liệu về thời gian, hình ảnh, tệp, v.v.
-
Làm sạch dữ liệu, cung cấp khả năng làm sạch và xử lý dữ liệu đa dạng.
-
Lưu trữ dữ liệu, xây dựng kho dữ liệu doanh nghiệp và phương án lưu trữ dựa trên dữ liệu lớn.
-
Mô hình thuật toán AI, cung cấp các thuật toán thông minh như tối ưu hóa lập kế hoạch sản xuất (học máy, di truyền học, v.v.).
-
Làm phong phú các thành phần biểu đồ với các công cụ trực quan để phân tích đa chiều linh hoạt.
-
Phương án triển khai tư nhân hóa, đảm bảo tài sản dữ liệu cốt lõi trong doanh nghiệp an toàn đáng tin cậy.