FEA-让大数据分析变得简单

数据收集

  • 能够融合更多类型的数据来进行运算
    关系型数据源:Oracle、SQL Server、PostgreSQL、Mysql;
    Hadoop数据源:HIVE、IMPALA、SPARK、HBASE;
    数据文件:CSV、EXCEL、PKL;
    第三方数据源:阿里ODPS、阿里RDS;
  • 支持数据源与接口/格式的双向自定义机制
    表示各种复杂结构或LOAD和STORE各类数据源,都轻松无忧;

数据探索

  • 通过交互分析、数据处理、可视化分析等探索性分析手段,快速辨析并挖掘数据的模式与特点以及规律。
  • 【不似PIG,胜似PIG的分析原语】 原子输入,分析结果立等可取。
  • 【强大的数据处理能力】 正则表达式、Lambda函数、字符处理函数、矢量运算,保证数据的真实性,去除噪音数据。
  • 【可视化分析】 通过独有的数据透视算法,可分析海量数据,并延续行业专家通过EXCEL分析数据的操作习惯。

模型构建

  • 运用数理统计、机器学习等方法构建分析模型。
  • 【数理统计】 运行数学统计函数找出数据的内在规律性
  • 【机器学习算法】 线性回归、非线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树、KNN、Boosting、K均值聚类、层次聚类、主成份降维分析、Apriori关联算法、ARIMA时序分析、多维分析、均值漂移聚类、传播聚类、密度聚类、谱聚类......
  • 【用户自定义框架】 基于Python构建,支持用户自定义、添加模型算法

发布模型

  • 通过OpenFEA脚本、集群运算、调度控制相结合的方式来发布分析模型。
  • 【OpenFEA脚本】 贯穿整个分析过程,不需要用java、C重写算法,不需要用R语言、MATLAB等进行数据探索,不需重复分析场景
  • 【集群运算MR】 化大为小,分而治之
  • 【调度控制】 秒级调度,精度更高

可视化展示

  • 展示方式多种多样,提供面板设计、交互应用、多级交互等个性化工具。
  • 【可视化图形】 不需要接入BI工具,近300 种图形样式 , 既可以通过一个plot原语来生成 也可以在可视化界面通过手动选择绘图而成
  • 【DASHBOARD设计 构建复杂、多维可视化展示界面的必备组件
  • 【交互应用】 更关注分析师在数据交互与产品使用过程中的体验,实现有效信息的传递,达到展示的目的,直观、易操作、易理解
  • 【深度交互】 上弹下钻,层层钻取,主从联动,多屏互动

分析门户

  • 分析结果不仅要展现,而且要以美观的方式展现。
  • 【导航设计】 多种形态,搭配方式灵活,千人千面
  • 用户自定义导航(UDN)】 嵌入第三方页面,也可以被第三方嵌入
  • 门户模板】 四种以上的模板,可直接套用,皮肤切换秒级完成