spss_modeler

SPSS Modeler - 数据挖掘预测性分析平台

相关文章            

 
 
 
 

数据挖掘、预测分析平台软件            

· 宣布 IBM SPSS Modeler 的新版本18.3

· IBM SPSS Modeler—数据挖掘、文本挖掘、预测性分析平台

·《IBM SPSS Modeler 18.0数据挖掘权威指南》        

 

 

SPSS Modeler 是数据挖掘、预测分析平台软件,拥有的图形界面和分析能力,发现结构化和非结构化数据中的趋势,使得分析师增加生产力,获得深入了解和预测,可在云端使用。很多的组织依靠IBM进行数据准备和发现,预测分析,模型管理和部署以及机器学习以利用数据资产获利。SPSS Modeler使组织可以立即使用算法和模型使组织能够利用数据资产和现代应用程序。它适用于混合环境以满足的治理和安全性要求,并且可以在IBM Watson Studio中使用。SPSS Modeler可帮助您:

  • 利用基于开源的,R或Python。

  • 使数据科学家具备技能,包括编程和视觉技能。

  • 探索一种混合方法- 在本地以及公共或私有云中。

  • 从小规模开始,然后扩展到整个范围的受控方法。

 

SPSS Modeler产品分为三个版本:SPSS Modeler Professional 、 SPSS Modeler Premium和 SPSS Modeler Gold。注:Japanese Language Extractor 许可要求使用 SPSS Modeler Premium 版。

 

核心亮点:

  • 访问数据源,如数据仓库、数据库、 Hadoop 分布或平面文件,以便从您的数据中发现隐含的模式

  • 在影响点即时向工作人员和系统提供具有预测性、资源敏感和战略的决策

  • 统计或分析背景如何,让可从分析受益的人掌握分析

  • 利用设计用于处理从的描述性分析问题到复杂的问题的单一平台, 解决业务问题

  • 利用数据库内性能和微小化的数据移动, 在更短时间内分析大量数据,同时充分利用现有 IT 投资

  • 利用可在大多数环境中部署并与 IBM 解决方案的开放平台,弥合分析和行动之间的差距。

 

SPSS Modeler Professional 和 Premium 版共同特点

 

数据理解:

  • 通过自动协助创建广泛的交互式图形。

  • 使用可视化链接分析查看数据中的关联。

  • 通过在图表上选择地区或项目并查看所选的信息来与数据进行互动;或选择用于分析的关键数据。

  • 从 SPSS Modeler 界面直接访问 SPSS Statistics 图形和报告工具。

 

数据准备:

  • 通过 zDb2 和 IBM Classic Federation Server 访问来自 Cognos Business Intelligence、IBM Db2、Oracle、Microsoft SQL Server、Informix、IBM Netezza、mySQL (Oracle) 和 Teradata 数据源的运营数据以及大型机数据

  • 导入带分隔符的、固定宽度的文本文件、SPSS Statistics 文件、SPSS Data Collection 数据源、Excel、SAS 或 XML。

  • 从 SPSS Modeler 提供的多个数据清除选项中进行选择,删除或更换无效数据,自动填充遗漏值并减少异常值和数值。

  • 将自动数据准备应用到询问和条件数据工作中,这样用步骤便可进行分析。

  • 从 SPSS Modeler 直接访问在 SPSS Statistics 中执行的数据管理和转换。

  • 使用字段过滤、命名、派生、(binning)、重新分类、值置换和字段重新排序。

  • 应用记录选择、抽样(群集和分层抽样)、合并(内连接、全外连接、部分外连接和反连接)、排序、聚合和平衡。

  • 从选项中进行选择,进行数据重组、分区和变换。

  • 从广泛的字符串功能中进行选择:字符串创建、置换、搜索和匹配、空格删除和截断。

  • 应用 RFM 评分:聚合客户的截断,以提供近因、频率和货币值,并将其合并在一起,生成 RFM 分析。

  • 将数据导出到数据库、IBM Cognos Business Intelligence 软件包、SPSS Statistics、SPSS Data Collection、带分隔符的文本文件、Excel 表格、SAS 或 XML。

 

建模算法:

  • 异常检测 - 使用一种基于群集的算法检测不寻常的记录

  • Apriori - 带有评估功能的流行关联发现算法

  • 贝叶斯网络 - 图形概率模型

  • C&RT、C5.0、CHAID 和 QUEST - 决策树算法,交互树构建

  • CARMA - 关联算法,多个结果

  • Cox 回归 - 计算某个事件的可能发生时间

  • Decision List - 交互式规则构建算法

  • Factor/PCA、Feature Selection - 数据简化算法

  • K-Means、Kohonen、Two Step、Discriminant、向量机 (SVM) - 群集和分割算法

  • Logistic 回归 - 用于二进制结果

  • 神经网络 - 多层感知器,带有逆向传播学习法和径向基本函数网络

  • 回归、线性、GenLin (GLM)、广义线性混合模型 (GLMM) - 线性方程建模

  • 自学响应模型(SLRM) - 带增量学习功能的贝叶斯模型

  • Sequence - 顺序关联算法,用于对顺序敏感的分析

  • 向量机(Support Vector Machine) - 建模广泛数据集的高等算法

  • 时间序列 - 生成并自动选择时间序列预测模型

 

建模和评估:

  • 采用具有高等功能的广泛数据挖掘算法,通过您的数据获得的结果。

  • 使用自动分类(二进制和数值)和群集功能来选择各个算法。

  • 使用交互式模型和方程浏览器查看高等统计输出内容。

  • 使用交互式模型和方程浏览器查看高等统计输出内容。通过可变性图表显示数据属性对预测结果的相对影响。

  • 在地理地图上可视化分析结果。

  • 合并多个模型(整体建模)或使用模型分析模型。

  • 使用 SPSS Modeler 组件扩展框架 (CLEF) 自定义算法。

  • 通过 SPSS Statistics ,使用 R 来扩展分析选项。

 

 

部署:

  • 使用 SQL 或 PMML(预测模型的基于 XML 的标准格式)导出模型。

  • 利用 IBM SPSS 协作和部署服务实现分析管理、流程自动化和部署功能。

 

 

SPSS Modeler Premium

数据准备:

  • 使用实体分析来合并或分隔记录,从而得到更整洁的数据用于建模。

  • 识别数据中的群组,并通过 Group 分析识别群组。

  • 使用改动(churn)信息确定改动器可能影响的人,以便与扩散分析相结合。

  • 于文本的了解和准备工作

  • 从文件、运行数据库和 RSS 源(即博客、web 源)提取文本数据。

  • 为荷兰语、英语、法语、德语、意大利语、葡萄牙语、西班牙语或日语选择本机语言提取器选项,或使用第三方翻译软件翻译几乎语言的内容。

  • 提取于域的概念,如单项、表达式、缩写、缩略语等。

  • 使用复杂的语言算法和嵌入式或用户指定的语言资源计算同义词。

  • 按人、组织、术语、产品、地点和用户定义的类型来命名概念。

  • 提取非语言实体,如地址、货币、时间、电话号码和社会保险号。

  • 使用并自定义预构建的模板和库,从而进行情感分析、CRM、安全和智能、市场情报、生命科学和 IT。

  • 利用常见业务应用的预打包文本分析包 (TAP),或创建自己的分析包。

  • 使用概念群集算法并根据术语共现来创建群集,提供主要主题及其关联方式的一览子视图。

  • 使用文本分类算法并根据内容对文本文档和记录进行智能分组。

  • 在预测建模中使用高等概念选择和取消选择功能。

  • 使用基于文本的可视化报告来查询概念关系、发生率、频率和类型。

 

文本链接分析:

  • 从荷兰语、英语、法语、德语和西班牙语文本中识别并提取情感因素信息(如喜欢和不喜欢)。

  • 识别人和事件或疾病和基因之间的链接与关联。

  • 通过URL从博客内识别并提取内容。

  • 在可部署的预测模型中观点、语义关系和链接的事件。

  • 通过交互式图表揭示复杂的关系,显示两个概念之间的多个语义链接。

 

SPSS Modeler 服务器版

 

  • 使用数据库技术,通过数据库内挖掘在数据库中创建模型,并充分利用高性能的数据库实现。

  • 通过 SQL 推回功能来推动数据转换,并将建模算法直接选入到运行数据库中。

  • 通过 IBM SPSS Modeler Server Scoring Adapter 在数据库内对数据评分,提高性能。

  • 利用高性能硬件( IBM System z 机器)更快实现解决方案,通过并行执行流和多个模型实现更好的 ROI。

  • 通过安全套接字层 (SSL) 加密,在 SPSS Modeler 客户端和 SPSS Modeler 服务器之间安全地传输敏感数据。

  • 具有 IBM InfoSphere 的数据库内挖掘算法:关联、群集、决策树、Logistic 回归、Naive Bayes、回归、序列、时间序列。

  • 具有 IBM Netezza 的数据库内挖掘算法:Bayes Net、决策树、分群法、广义线性、K-Means、KNN、线性回归、Naive Bayes、PCA、回归树、时间序列。

  • 具有 Microsoft SQL 服务器的数据库内挖掘算法:关联规则、群集、决策树、线性回归、Naive Bayes、回归、神经网络、序列群集、时间序列。

  • 具有 Oracle 的数据库内挖掘算法:自适应贝叶斯、Apriori、人工智能 (AI)、决策树、线性模型 (GLM)、KMeans、Naive Bayes、非负矩阵分解、O-Cluster(正交分区群集)、向量机。

 

SPPS Modeler Gold所的内容:

SPSS Modeler Gold扩展了SPSS Modeler Premium的功能,以提供基于服务器的预测分析建模和部署平台。SPSS Modeler GoldSPSS协作和部署服务平台,可以实现整个中关键分析资产的共享和治理,以及模型评分,与IBM产品和操作系统的等。

 

软件分类

新闻资讯

技术文档

首页    数据分析软件    SPSS Modeler - 数据挖掘预测性分析平台

相关产品