1、數(shù)據(jù)訪問:
①連接到任何格式,任何比例的數(shù)據(jù)源
②比任何其他可視化設(shè)計(jì)平臺(tái)更多的數(shù)據(jù)連接器
③包括60多種文件類型和格式的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
④非結(jié)構(gòu)化數(shù)據(jù)訪問,加載和提取信息
⑤80種文本,網(wǎng)絡(luò)和多媒體挖掘和處理功能
⑥支持純文本,HTML,PDF,RTF等
2、數(shù)據(jù)探索:
①強(qiáng)大的統(tǒng)計(jì)概述,快速探索和了解您的數(shù)據(jù)
②圖形顯示屬性名稱和類型
③快速識(shí)別缺失值
④強(qiáng)大的圖表引擎提供了超過30種不同的可視化選項(xiàng)
⑤氣泡圖和三維散點(diǎn)圖
⑥網(wǎng)絡(luò)和樹狀圖,以及更多
3、數(shù)據(jù)準(zhǔn)備:
①提供大量的數(shù)據(jù)質(zhì)量,集成和轉(zhuǎn)換工具
②聚合、篩選和排序或連接數(shù)據(jù)的多個(gè)選項(xiàng)
③具備用于特征選擇,創(chuàng)建和提取的算子
④確定最佳影響因素或產(chǎn)生新因素
⑤高級(jí)屬性加權(quán)功能
⑥新屬性生成選項(xiàng)
4、數(shù)據(jù)清洗:
①提供多種高級(jí)數(shù)據(jù)清理方法
②識(shí)別和去除重復(fù)
③異常值檢測和刪除
④規(guī)范化&標(biāo)準(zhǔn)化
⑤衡量屬性影響的加權(quán)方案
⑥提供復(fù)雜的降維技術(shù)
⑦自組織映射(SOM)
5、建模:
①深度機(jī)器學(xué)習(xí)功能
②分類、回歸和聚類技術(shù)
③關(guān)聯(lián)挖掘,頻數(shù)集合和相似性計(jì)算
④集合和分層模型
⑤超過100個(gè)額外的建模算子
⑥無縫集成R,Python和自定義腳本
⑦流程控制功能
⑧優(yōu)化循環(huán)和分支
6、模型驗(yàn)證:
①可視化設(shè)計(jì)界面與可靠驗(yàn)證技術(shù)
②預(yù)處理模型
③交叉驗(yàn)證&分割驗(yàn)證
④視覺評(píng)價(jià)技術(shù)
⑤值得信賴的性能估算
⑥精確度,召回率,RMSE,AUC及其他
⑦計(jì)算顯著性檢驗(yàn)
7、云執(zhí)行:
①擴(kuò)展計(jì)算-按需
②并行提交多個(gè)作業(yè)
③彈性計(jì)算環(huán)境
④任何地方可進(jìn)行預(yù)測分析
⑤提供一個(gè)基于云的中央存儲(chǔ)庫
⑥支持敏捷開發(fā)