邵珠庆の日记 生命只有一次,你可以用它来做很多伟大的事情–Make the world a little better and easier


1610月/11

免费数据分析工具(插件)

发布在 邵珠庆

总结推荐22个免费的数据可视化和分析工具。列表如下:

数据清理(Data cleaning)

当你分析和可视化数据前,常需要“清理”工作。比如一些输入性列表“New York City”,同时其他人会说“New York, NY”。因此你需要标准化这些工作,使看到统一的样式。下面的两个工具被用来帮助使数据处于最佳的状态。

1.DataWrangler

斯坦福大学可视化组(SUVG)设计的基于web的服务,以你刚来清理和重列数据。点击一个行或列,DataWrangler会弹出建议变化。比如如果你点击了一个空行,一些建议弹出,删除或删除空行的提示。它的文本编辑很cooool。

Free data analysis

2.Google Refine

Google Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一 个CSV文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。。。但是这些其实都代表了同一个属 性,Google Refine 的作用就是帮你把这些不规范的写法迅速统一起来。

Free data analysis

统计分析(Statistical analysis)

有时,你需要你的数据的图形化的表达。

3.R项目

R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可比美GNU Octave甚至商业软件MATLAB。

Free data analysis

可视化应用与服务(Visualization applications and services)

这些工具提供了不同的可视化选项,针对不同的应用场景。

4.Google Fusion Tables

Google Fusion Tables被 认为是云计算数据库的雏形。还能够方便合作者在同一个服务器上分享备份,email和上传数据,快速同步不同版本数据,Fusion Tables可以上传100MB的表格文件,同时支持CSV和XLS格式,当然也可以把Google Docs里的表格导入进来使用。对于大规模的数据,可以用Google Fusion Tables创造过滤器来显示你关心的数据,处理完毕后可以导出为csv文件。 

Google Fusion Tables的处理大数据量的强大能力,以及能够自由添加不同的空间视图的功能,也许会让Oracle,IBM, Microsoft传统数据库厂商感到担心,Google未来会强力介入数据库市场。

Free data analysis

5.Impure

Impure,允许点击、拖曳来连接模块,由西班牙分析公司Bestiario创建。 

6.Tableau Public

Free data analysis

7.Many Eyes

Free data analysis

Free data analysis

8.VIDI

Free data analysis

9.Zoho Reports

Free data analysis

10.Choosel

Free data analysis

11.Exhibit

12.Google Chart Tools

Free data analysis

13.JavaScript InfoVis Toolkit

InfoViz

14.Protovis

15.Quantum GIS (QGIS)

Free data analysis

16.OpenHeatMap

Free data analysis

17.OpenLayers

18.OpenStreetMap

19.TimeFlow

Free data analysis

20.IBM Word-Cloud Generator

21.Gephi

Free data analysis

22.NodeXL

IntroTutorial-Layout-v2_GraphImage-2.png

 

 

 

数据挖掘有什么用途?数据挖掘和数据仓库之间有什么样的联系?数据挖掘和市场调研、数据分析又有什么样的联系?…… 

   

一  扫盲篇

    研究结果表明,企业处理的数据每5年就会成倍增长,导致企业数据过度的重复和不一致,如何在这些数据中获取有利信息就促进数据挖掘技术发展。

1、数据挖掘的相关概念

   谢邦昌教授在《数据挖掘 clementine应用实物》一书中提到,数据挖掘是指寻找隐藏在数据中的信息(如趋势、特征及相关性)的过程,也就是从数据中挖掘信息或知识KDD(knowledge discovery in databases)。

   数据挖掘可以说汇合了以下六个领域:

  a 数据库系统-数据仓库和联机分析(OLAP)

  b 机器学习

  c 统计与数据分析方法

 可视化

  e 数学规划

  f 高性能计算

   

    数据挖掘和数据仓库有什么样的联系?我个人的理解是数据仓库的建立是数据挖掘的前提条件,因为数据仓库里的数据通常是整理过的数据,也就是我们通常所说的Clear Data,而从这些有用的数据中找出我们感兴趣或是有价值的信息的过程就是数据挖掘。

 

2、数据挖掘的应用领域

   数据挖掘对每个公司来说都是一个重要的策略性计划,因而将它设为高度机密,所以要调查各公司用数据挖掘到底做什么样的事相当不容易。这里简单的说说数据挖掘的几个常用领域:

   客户档案管理方面,通常公司都希望找出客户的一些共同特征,希望能借此预测哪些人可能成为他们的客户,以帮助营销人员找到正确的营销对象,以降低营销成本,提高成功率

   购物篮分析,通常用来帮助零售从业人员了解客户的消费行为,譬如哪些客户会一起购买,哪些客户会购买某种产品后隔段时间会购买另外一种产品,利用数据挖掘,零售从业人员可以更有效的决定进货量或库存量,商品如何排放等等

   客户关系管理,公司通常可以分析,原本一些属于自己的客户,后来却转变成竞争对象的客户,分析这一部分群体的特征,再根据这些特征到现有客户数据中找出有 可能转向的客户,然后设计出相应的方案来留住这一部分客户群体(毕竟找一个新客户的成本要比留住一个原有客户的成本高的多)

    除此之外,数据挖掘还运用到其他许多行业,如金融业、电信业、零售业、互联网等等,其常用情况汇总如下:

 

 

数据挖掘的应用

以客户为中心

以操作为中心

以研究为中心

终身价值

购物篮分析

档案细分

保留

目标市场

采集

知识门户

交叉销售

活动管理

电子商务

盈利能力分析

定价

欺诈检测

风险评估

投资组合管理

员工离职

现金管理

生产效率

网络性能

制造工艺

组合化学

遗传研究

流行病学

 

 

 

3、数据挖掘的进行步骤及常用分析方法

   每个人数据挖掘过程都不一样,但可以肯定的一点是他们大部分时间都花在准备数据阶段,而其他步骤也只是这样一个大致流程:

   1)理解数据与进行的工作

   2)获取相关知识和技术

   3)整合与检查数据

   4)去除错误与不一致的数据

   5)发展模型与假设

   6)实际数据挖掘工作

   7)测试与验证所挖掘的数据

   8)解释与使用数据

   数据挖掘分析方法是利用数据来建立一些模仿真实世界的模型,利用这些模型来描述数据中的模式以及关系,常用的数据挖掘分析方法主要有:

   1)用于分类聚类的分析方法,如:因子分析、判别分析、聚类分析等,除此之外还有决策树(常用分类方法为CART<classification and regression trees>及CHAID<chi-square automatic interaction detector>两种)

   2)推算预测分析方法,如回归、时间序列、神经网络等

   3)序列规则分析方法,如关联规则、序列规则等

 

4、主要数据挖掘软件

     目前市面上比较常用的数据挖掘软件有不下于30种(当然都是老外开发的,目前为止还没发现国人开发的此类软件),例如MLC++,Clementine,Darwin,Intelligent Miner,SAS data Mining,S-plus,matlab等等。下面简单的介绍几种:

1)SPSS Clementine,SPSS公司发行,此工具结合了多种图形用户接口分析技术,包含神经网络、关联规则及规则生成技术。

2)Oracle Darwin,甲骨文公司发行,其优点是支持多重算法,可在多种主从式架构上执行,服务器端可以是单处理器、同步多处理器或大量平行处理器,定位在中、大范围的执行

3)SAS Enterprise Miner,SAS公司发行,目前数据挖掘市场上的领导者,适用于企业在数据挖掘的发展及整个CRM的决策支持应用

4)IBM Intelligent Miner,IBM公司发行,是市场上最大容量及功能强大的工具,在顾客评定报告中它的整体效能是最好的,定位于企业数据挖掘解决方案的先锋。

 

二、数据挖掘与市场分析

   “统计分析给您以先机,分析报告给您后见之明,数据挖掘给您以洞察”这样一句话来形容市场分析与数据挖掘的关系再确切不过了。然而数据挖掘只是用来帮助业 务分析策划人员从数据中发现各种可能的假设,这些假设是否正确,是否有价值还有待确定,为了得到更加确定的答案,企业不得不花费一些时间和经历来验证这些 假设,从而导致企业提出调研目的,针对相关假设设计相应的调查问卷,根据调查结果,运用统计分析得出分析报告,从而推出一系列新的发展方案,发展新的客 户,回头又继续数据挖掘,形成一个数据挖掘--市场调研--统计分析的良性循环。

    除此之外,统计分析还给数据挖掘提高了许多新的分析方法,如神经网络技术应用中的---概率分析网(PLN),挖掘方法上的---贝叶斯网络,遗传算法中的---概率进化算法(PMEA)等等。

 

三、从事数据挖掘工作需掌握的相关知识

  1、数据库技术  数据挖掘是在大量数据中找出自己感兴趣或有用信息的过程,这其中涉及到数据库操作的相关功能,那么掌握一种数据库以上的知识就成了必然,这也是为什么目前国内许多企业数据挖掘从业人员是计算机专业的原因。

  2、相关行业知识  也就是前面数据挖掘步骤中有提到相关知识和技术,没有行业背景知识,纯技术做出来的分析报告就好像"无根"之水

  3、掌握一种以上的数据挖掘软件  其实许多的数据库也提供了相应的分析功能,比如前面提到的IBM、Oracle 数据挖掘软件

  4、相关统计及市场分析知识  没有这些知识做出来的报告可能犯下或多或少的错误,从而使分析结果出现严重的偏差

 

 

 

 

1610月/11

BI前端展示工具

发布在 邵珠庆

1       参评工具

参评的工具包括:MSTRBOCognosBrioSASCA

2       选择说明

对于本次选择的六类产品,除CABI产品外,其他五类都是在BI业界非常出名的公司的产品,从互联网上各类搜索引擎的搜索结果既可以看出。

其中:

² MSTR全称MicroStrategy为正在开发的电信经营分析系统,以下简称MSTR。评估数据来源于开发的经验和同系统支撑商的交流;

² BO为交流演示后,重点关注的产品,在中国有很好的市场。评估数据来源于同系统提供商的交流和互联网;

² Cognos应用于本人实施过的电信经营分析系统,评估数据来源于本人系统研发、实施经验;

² Brio应用于某电信经营分析系统,评估来源于本人对相关实施系统(电信领域)的调研、同维护人员的交流以及互联网;

² SAS属于在统计分析、数据挖掘方面全球一流的SAS公司的产品。评估数据来源于互联网;

² CA应用于某电信经营分析系统。评估数据来源于对系统的调研和互联网。

 

3       BI公司介绍

  20033月,Cognos公司并购软件公司Adaytum717Business Objects 并购Crystal, 724日,Hyperion并购Brio,世界的BI市场正在掀起并购风。

4       产品介绍

参与评估产品的介绍

1.1. MicroStrategy公司产品

1、公司简介

MicroStrategy公司由Michael J. Saylor创建于1989年,最初主要是作为一家决策支持领域的咨询公司,随后发展过程中,在1993年推出了第一个产品包:MicroStrategyAgent,随后相继推出一系列产品:MicroStrategy WebMicroStrategy BroadcasterMicroStrategy Telecaster等,现最新产品包称之为MicroStrategy 7,致力于提供面向个性化的电子商务智能解决方案。

2、产品介绍

MicroStrategy Intelligence Server——整个产品中核心产品,多层体系结构下的中间应用服务器,为各种前端应用提供中间应用层能力。

MicroStrategy Web——Web体系下的应用服务器,提供基于Web体系下的查询、电算表格和多维分析能力。

MicroStrategy Agent——数据挖掘、应用开发工具,提供API接口。

MicroStrategy InfoCenter——企业级报表,门户工具。

MicroStrategy Architect——商业对象抽象层设计工具。

MicroStrategy Desktop——MicroStrategy AgentMicroStrategy ArchitectMicroStrategy Administration Utility的集成化应用环境

 

1.2. BO产品介绍

桌面产品包括:

BusinessObjects Explorer Reporter 查看、刷新、计划、分发和打印全客户文档,创建新查询和文档,OLAP 的旋转和切片以及钻取功能。

Designer 允许universe 设计者创建、管理和分发universes. universe 用日常商业商业术语代表数据结构,属于语义层

Supervisor 允许管理员进行权限管理

BusinessQuery Excel 加载项,使用 BusinessObjects universe, 支持关系型和多维数据库(OLAP)

BusinessMiner 发现并处理数据中的隐含关系

企业级服务器产品包括:

Infoview

WebIntelligence (Reporter Explorer) BusinessObjects 基于WEB的决策支持系统。

Broadcast Agent 制定自动发布文档的定时机制。

1.3. Cognos的产品简介

Cognos公司的产品是由一系列的功能模块组合而成的套件,包括如下一些模块:

Powerplay Enterprise Server——PowerPlay企业级的服务器。由应用服务器和Web 服务器组成。可在Internet、广域网和局域网上发布Cubes并作为在线分析运行平台

Impromptu Web Report —— WEB界面的报表制作和发布的专业平台。

Scenario —— 系统提供的ETL工具。

4Thought—— 建模与预测模块,采用神经网络技术。

Impromptu—— 是企业级、交互式数据库查询和报表生成工具提供查询、报表功能,针对关系型数据。

Powerplay—— 提供OLAP分析功能,针对多维数据PowerCubeCognos的多维数据结构)。在Powerplay中可以钻取到Impromptu中。这是Cognos公司的集成平台。

Transformer——是一个OLAP服务器。主要用来创建模型,帮助你组织数据,将不同数据源的数据整合到PowerCube当中,形成多维数据源。

Cognos Upfont  —— 网络集成的门户

Upfont Access  —— 负责权限的设置与验证

1.4. Brio 产品介绍

美国Brio Technology是一家纳斯达克上市公司,其集中精力于OLAP的前端展示,不提供OLAP的数据整理和重组功能,没有OLAP分析引擎。

主要产品:

Client/Server方式的客户端

BrioQuery Designer TM ——(供开发人员、数据库管理员和系统管理员使用)查询、分析及报表制作,具有数据库管理功能、安全性、审计和共享库设置

BrioQuery Explorer TM ——(供高级用户使用)查询、分析及报表制作,直接访问数据库表和共享库

BrioQuery Navigator TM ——(供需要业务即时信息的分析人员使用)查询、分析及报表制作,访问共享库中预先定义好的数据模型和报表

Web方式的客户端

Brio.Insight TM —— 基于Web 浏览器的查询、分析及报表。根据报表信息和用户的属性而设定不同层次的报表分析功能(供活跃的分析人员和报表用户使用)。

Brio.Quickview TM  —— 基于 Web 浏览器的报表查看和数据视图更新(供报表查阅者使用)。

Brio.Enterprise的服务器产品

OnDemand 服务器  —— Web 应用服务器,用户可通过Web进行查询,实现客户端零管理,提供报表级安全性及独特的可适应性报表技术

Broadcast 服务器  —— 广播服务器,可按预定时间表进行自动查询处理,通过电子邮件、网络、打印机及 Web发送报表,其执行情况可通过电子邮件反馈给用户

 

1.5. CA公司产品

CA也提供非常齐全的产品线:

CleverPathTM Predictive Analysis Server 数据挖掘工具

CleverPathTM OLAP OLAP分析的应用工具,是一个包括C/SB/S网页的

CleverPathTM Forest & Trees 提供查询处理功能

CleverPathTM Aion Business Rules Expert数据组织及元数据管理

CleverPathTM Reporter C/A结构下的报表制作工具

CleverPathTM Portal 定时调度工具

CleverPathTM Enterprise Content Manager 信息分发共享工具

 

5       产品对比

 

项目

MSTR

BO

Brio

Cognos

产品功能

独立的应用服务层

基于组件的应用服务器Intelligence Server,功能强大,附属工具丰富

应用服务器为WebIntelligence

负责数据的交互,功能较简单,性能依赖于OLAP的性能

Brio.Enterprise OnDemand

负责数据的交互,功能较简单,性能依赖于OLAP的性能

PowerPlay Enterprise server

负责数据的交互,提供基础的服务器调优和负载平衡的调整,监控能力较弱

安装难易程度

客户端无任何安装;

服务端的安装全程自动化,没有专用的设置参数的输入,较容易安装。

安装前需要改区域设置和本地安全策略,容易安装失败,并且不支持

COGNOS类似

安装需要经过指导,安装后的配置较烦琐,容易安装失败

兼容性

Microstrategy不能连接第三方的OlapServer (它有自己的Rolap

生成的分析模型数据也不能被第三方工具共享,只能自己使用

BO5中文版不能在B/S方式下对Essbase进行自由钻取

brio 同震荡波补丁冲突(KB835732 出现Shift重复字符

Cognos连接ESSBASEUNIX下有版本限制,6.2以后的就不行了

Cognos不支持复合数据,不支持“多对多”关联

Web架构

是纯WEB架构

不过最近为了加强报表的制作,添加pdf显示功能

不是,需要下载OCX插件,

报表样式不丰富

QuickView:不能与数据库交互,类似离线分析,客户端需要下载插件。

Insight:能够与数据库进行交互,Server端为Ondemand Server,客户端需要下载插件。

不是,需要下载OCX插件,

报表样式不丰富

OLAP部分是,报表部分需要PDF插件。

现在新推出的ReportNe可以通过纯WEB方式来制作类似水晶报表一样的复杂格式报表,这样就形成全套的WEB解决方案

数据容量

100G以上

单个数据模型6070GESSBASE

单个数据模型6070GESSBASE

10G以下

应用平台的支持

操作系统:WIN2000SERVER;

WIN2003SERVER;

UNIX

数据库系统:主流的RDBMS

MSTR

MSTR

MSTR

能否钻透到详单级

可以,

由于时基于ROLAP架构的数据分析,在模型设计上就能直接支持详单的钻透,实现方便。但也要受到系统查询速度的限制。

直接在工具中创建查询列表对象,并且对象可以是详单也可以是有数据关联的表,实现起来较方便。

BO的基于桌面 cube方式先天地受到cube中包含的数据量和在有限的数据集上进行的分析的限制。

在用户的钻取操作发生后并没有提供相应的数据限制,因此在查询详单时,数据承爆炸式的增长。

需要二次开发才能做到统计报表向详单的钻透,工作量较大。

可以,但是详单的显示数据量较小(10条左右),并且需要转到PDF格式。

大数据量解决方案

特有的ROLAP引擎,针对1G以上数据模型有专项优化,支持100GB以上的数据模型分析

支持到TB级的数据分析,对大数据量的SQL提供优化。

技术人员可以通过调整VLDB属性进一步优化

根据OLAP服务器的性能决定,搭配essbass时支持10G左右数据模型,无OLAP服务器时,显示效率较低。

根据OLAP服务器的性能决定,搭配essbass时支持10G左右数据模型

对大数据量的模型无法支持,最高数据量为3GB左右

产品线的完整程度

缺乏ETL和数据挖掘工具

缺乏数据挖掘工具,ETL工具刚开发完毕,未投入使用

缺乏ETL和数据挖掘工具,

拥有全部的BI产品线,功能较丰富

产品集成情况

集成度高,提供集成的数据连接、模型制作、报表发布、权限管理的界面。

集成度中等,web功能同传统C/S模式差距较大

集成度中等,web功能同传统C/S模式差距较大

集成度低,每种应用都对应单独的使用界面

信息分发

信息分发由Narrowcast组件完成,功能强大,可发手机短信、邮件、传真,可以包含声音文件,需另外购买

报表分发需要二次开发

MicroStrategy Narrowcast组件可以实现信息的主动分发,将信息分发到邮件、手机、传真等平台;

内部支持报表订阅机制,用户主动订阅报表信息;

内部不支持报表发送,需要二次开发实现。

报表的分发的实现较为方便

也有消息分发的组件

有报表分发功能

有发邮件的接口

有报表分发功能

有发邮件的接口

SDK开放程度

开放程度很高,提供全面的sdk开发包,

较少,功能封装在OCX中,支持纬度参数的输入等二次开发函数,尤其不提供权限接口,提供数据更新、启动服务等简单操作的命令行模式

有,但较少,功能封装在OCX中,支持纬度参数的输入等二次开发函数,提供数据更新、启动服务等简单操作的命令行模式

极少,许多功能二次开发无法实现,但提供初步的用户功能权限操作的函数,提供数据更新、启动服务等简单操作的命令行模式

所提供的web API非常有限,而且没有真正的web客户化能力,也不能嵌入到现有应用系统中。

易于二次开发整合

工作量较大,但理论上可以重新开发除了服务器和部分功能权限外的任何功能。

开发量主要集中于基本功能的应用上

开发量主要集中于界面的美观程度

开发量主要集中于界面的美观程度

开发量主要集中于界面的美观程度

多数据源的支持

支持多种类型的数据源。但在一个项目中只能使用一个数据源

BUSINESSOBJECTS 允许在同一报表中合并来自不同源的数据。比如单个excle表,支持混合显示,较强大(C/S下支持)

部分支持(模型中只支持单一数据源)

部分支持(模型中只支持单一数据源)

模型快速开发(前提是经过培训并有经验)

有相应的快速开发模板,不过数量较少

有丰富的快速开发参考模型,实现一般性的需求较容易

有丰富的开发参考模型,但模型的开发和发布工作量大

有较丰富的快速开发参考模型

快速用户新建报表的能力

最终用户完全可以通过web界面新建自己需要的报表。同样在Desktop中新建的报表无需任何设置就可以在前台使用。

可以按照模版创建新的报表,在现有报表上创建适合用户自己的新报表。

由于有获得了专利的语义层 用户可以快捷地写出功能强大的财务、销售和其他含有表格、图表、超级连接和图像的报表。

可以制作基于分析的报表

可以在分析的基础上添加表头构成报表,B/S下可对分析结果作为报表保存。

良好的权限机制,易于整合、同步

提供完善的权限机制,分功能权限和数据权限,权限的二次集成度高,但开发量也大

提供完善的权限机制,分功能权限和数据权限,但只提供简单的用户权限操作的二次集成能力

提供完善的权限机制,分功能权限和数据权限,

权限的二次开发量很小,但只能实现用户管理和单一度量数据过滤功能(实现功能同BOBrio一样,但工作量小)

支持的数据库和OLAP

主流数据库

只使用自己的OLAP服务器

主流数据库和主流OLAP服务器(不支持cognosMSTR

主流数据库和主流OLAP服务器(不支持cognosMSTR

主流数据库和主流OLAP服务器

元数据管理

具有统一的元数据库。元数据通过Desktop集成界面进行管理,可以方便的实现元数据的迁移、复制等工作。

有元数据库存用户信息,但必须在C/S模式下制作unv文件和rep报表文件实现,在web方式下保存为wqy则可以编辑,但功能弱。

采用文件(bqi)方式,不易管理

采用文件方式,不易管理

操作易用性

报表展现方便,但OLAP操作感较差

由于采用OCX的插件方式,OLAP的显示方式较象excel,操作较直观,给用户的初次印象较好,但报表感较差

单一界面可以满足查询、报表和分析;通 INFOVIEW BI 接口单一进入点,BUSINESSOBJECTS 还让用户快速、简单地存取报表。

BO相同

OLAP功能很强大,操作反应速度也是最快的,然而初次上手较难,

WEB页面访问条件查询报表时操作不便。

旋转、切片、钻取操作

提供旋转、切片、钻取、自定义小计等OLAP分析。

 

都支持

都支持

都支持,WEB方式下分析功能最强大,但用户较难接受,使用熟练后可做的分析很多,支持任意角度的分析操作。

Web端的功能

分析结果就是一个初步的报表,根据SDK框架生成HTML(内嵌javascipt ),实现相关的旋转、钻取等操作,功能基本与c/s结构操作起来相当(速度较慢)

分析和报表制作功能WEB下明显弱于C/S模式

BO

分析功能同C/S模式相当,但报表制作功能WEB下明显弱于C/S模式

定时更新报表数据

提供定时更新的工具,也提供SDK函数控制更新

提供调度机制。可以按照灵活的时间设置或者事件触发报表刷新数据。

在调度的基础上,可以实现用户订阅的功能。将用户感兴趣的内容定期发送到用户的个人报表文件夹中。

命令行方式更新(用第三方调度程序调度)

命令行方式更新

提供定时更新的工具,也有相应的命令行程序更新

多种文件导出格式

常用的格式都支持

MSTR

MSTR

MSTR

报表展示的形式

支持列表、交叉表、图表(90多种)

图表样式较少

图表样式较少

图表样式较少,OLAP模式不能制作列表

多文档界面的支持

支持多文档的同时显示,提供灵活的制作界面,可以制作真正的带分析说明的综合报表,只是对文档的制作人有一定的要求

多文档的制作非常方便和快捷,不过不能添加文字描述

图表混合需要二次开发,提供专用的编辑器

OLAP方式不提供(7.X不清楚)

只支持表格同图表的同步显示

ReportNet支持多文档报表

灵活的查询参数设置

通过使用提示(Prompt) 可以让用户输入不同的查询条件,可以灵活在已有的报表中增加实体,筛选

承诺在8.0加入直接构造的入口以提高查询的效率和灵活性。

参数设置较为烦琐,属于条件过滤性质,查询界面也非常不友好,这方面是需要重要的提高方面。

在新的6.x版本下查询时可构造较复杂的SQL语句,并且能包含动态的查询函数,但6.x还未推出中文版

查询通过设置传入参数的方式的到相应的结果,brio提供专用的开发界面

只能进行简单条件的过滤,无法进行web页面的复杂查询

报表Web界面的用户订制

界面操作较烦琐,虽然声称通过web页面的拖拉拽方式生成报表,但仍然不太好用。

不支持,只能通过OCX组件生成分析结果报表,生成方式较简单

灵活格式的正式报表报表必须由熟悉数据库知识的人设计,在C/S下制作。

BO

所有Brio 报表必须由熟悉数据库知识的人设计。

在分析状态下只能生成分析结果报表,可以选择PDF和纯WEB表格两种模式。

报表的WEB制作必须切换到REPORTNET系统下定制。

计算列功能强大易用,丰富的统计函数

提供很强大的统计运算函数功能,可以用拖拉拽的方式新建计算列,也可以用写公式的方式新建计算列。用户可以开发自定义的统计函数

Cognos类似

Cognos类似

计算函数也很丰富,提供一百多个计算函数,C/S下提供拖拉拽的方式新建计算列,也可以写公式

根据条件进行数据凸现,比如红色代表异常数据

功能完善,支持异常数据自定义阀值和颜色的显示,可以以各种方式包括小图片来显示异常数据

一般只能针对异常数据的值进行文字显示格式的改变来达到突出显示的目的,在WEB方式下能通过二次开发设置异常数据的阀值,工作量较大

BO类似

BO类似,在WEB方式下不能设置异常数据的阀值

个性化定制

按虚拟的目录结构创建个人文件夹,文件夹的权限设置在BI展示工具中是最强大的:个人文件夹中的内容其他任何用户包括管理员都无法浏览。

但相应的权限操作函数公开的不完整,使得二次开发受到一些限制,并且开发量也较大。

处理模式同cognos类似

处理模式同cognos类似

有个人的工作空间,但是个人拥有的报表是复制的一个单独文件拷贝,维护较麻烦,不易维护。

是否提供建模工具(是否包含OLAP服务器)

提供Architect作为建模工具(该工具已集成到管理和报表制作工具DESKTOP中),另外在应用服务器Intelligence Server中可以提供智能立方体,提高复杂的OLAP分析操作的效率。

不过实体(制定处理逻辑的数据纬度)会生成很多,提升了管理的难度。

不提供,需要单独购买OLAP

BO

提供Transform作为建模和生成可分析立方体的工具,OLAP服务器为Enterprise server,制作的立方体效率很高,分析立方体的数据经过压缩,容量为同条件下的ESSBASE420分之一

 

 

 

 

 

产品性能

报表刷新的速度

提供报表缓存机制以提升效率。

有缓存时访问速度在1分钟以内;无缓存时,在SQL查询时间基础上增加1030秒(WEB处理和显示时间)

15秒~2分钟内

15秒~2分钟内

660秒(10万条数据以内)

负载平衡

支持多种层面的负载平衡,有Intelligence Server服务和Broad Cast的分布式负载平衡,并且提供相应的优化工具(另外付费),支持大量并发用户请求,并发数的处理效率很高高。

Cognos类似

Cognos类似

提供应用服务器的负载均衡,功能较弱

多处理器优化

支持

支持

支持

支持

OLAP分析的速度(10万条数据运算以内)

提供报表缓存机制以提升效率。

有缓存时访问速度在1分钟以内;无缓存时,在SQL查询时间基础上增加1030秒(WEB处理和显示时间)

15秒~2分钟内

15秒~2分钟内

660

多用户并发访问的支持能力

CPU可以支持50个并发操作用户

CPU最多支持25个并发操作用户(64Unix环境)

CPU支持5-15个并发操作用户

CPU最多支持20个并发操作用户

整个系统可维护性

元数据、权限集中管理。较容易管理维护,但新的实体的制作需要专门人员

 

对于报表和模型的修改需要由专人进行,界面有点象SQLPlus等开发工具

相对cognos只是权限和源数据连接及报表制作集成,但数据处理过程相似,因此也有cognos的弊端

由于涉及到多种工具,对初学者来说维护较难入手,维护的流程制定也很烦琐,模型为文件方式,较难管理

对硬件的要求

CPU支持50并发, 对内存的要求较低,1GMemory

1G

1G

6.6以前的版本,内存越高越好,起码1G6.61以后则1G以上

 

 

 

 

 

服务与支持

解决问题的时效性

解决方案较少,时效性较高,问题都能及时的解决,相关的管理层很重视,配合的工程师也很主动,解答问题很热心

BO的金牌代理有6家,对产品的支持程度参差不齐,我所联系的一家公司,人员的技术支持不够及时,厂家声称产品销售时,会有售前工程师来交流,但不提供售后的人员技术支持,打电话联系经常找不到人。

优点:由于进入国内时间较长,解决方案的积累较多

时效性一般,大多都是二次开发问题,需要多看帮助,不过提供不少解决问题的方案

网上有专用的论坛

时效性较高,问题都能及时的解决,售后工程师很热情,解答问题也很热心

数据仓库之路的专题论坛的支持程度较好

解决问题能力的评价

能够提供开发和实施的强力支持,但经验不足,有做很多探索工作

不少情况下需要通过网络上的论坛解决问题

IBM联手,解决问题的能力有保障,不过本身的权限方面有不可克服的弱点

二次开发的余地较小,但问题基本上都能解决,

支持与培训

对于合作伙伴提供免费的培训和支持

对于合作商提供初级培训,高级培训5天收费14500/

一般作为IBM实施套件之一,IBMBrio都可以提供支持,现场解决问题收费

对于合作伙伴提供免费的培训和电话支持,一年内免费上门解决问题一次,提供最终客户5个名额为期5天的免费培训,

难解决的问题

 

权限控制很严,而权限接口未完整提供,有些基于权限的开发难以达到。

内核只是用单字节编译,中文版智能通过汉化,这样会在读数据、Web页面提交等情况下出现小的问题。

66 版:左拉窗口的后门;左上角的EIS能显示所有的窗口

8.0 版:如果在EIS的控件上加入了编程方法,比如你一个下挡框里面有程序代码,那当你在WEB方式访问报表时每触发一个事件,这个报表的WEB页面都会自动刷新一下,这个是Brio8web方式(瘦客户端)我觉得最大的缺陷,因为Brio并没有把这些代码转为HTMLjavascript而是使用web表单提交的方式解决,真的好烂。

WEB方式不能提供打印功能

安全方面较差,会泄漏分析的数据内容

无法支持大数据量

 

           

 

 

308月/11

Mockingbird: 纯JS在线产品原型设计工具

发布在 邵珠庆

Mockingbird: 纯JS在线产品原型设计工具

 

4085137667 b77831672c o Mockingbird: 纯JS在线产品原型设计工具  By Web2.0 盗盗

Mockingbird 是一款基于 Cappuccino 开源框架下的产品原型设计工具,能够模拟桌面软件给予设计人员更快速的上手和实践。

Mockingbird 是一款类似于我在此前介绍的 MockFlow 产 品,它为用户提供了完全基于浏览器窗口的产品原型设计服务,由于Mockingbird 采用了Cappuccino开源框架,能够较为逼真的模拟 Axure 这类桌面软件,给用户极大的亲切感。Mockingbird  内置了常用的各种Web控件,包括Text, Link, Button, Image, List, Box 等等,鼠标拖拽便可添加至画布中;支持中文。

287月/11

php调试工具你用过几个 (锦集)

发布在 邵珠庆

PHP现在已经是使用最为广泛的开源服务器端脚本语言之一,当然PHP并不是速度最快的,但它却是最常用的脚本语言。PHP100出品的 EclipsePHP Sutdio 也曾收到广大PHPer好评,但不可能每个人的习惯是一样的,尤其是对与探索的朋友,所以今天PHP100就在这里介绍50个有益的PHP工具,可以大大 提高你的编程工作,希望大家转载此文章时候注明来源

调试工具

测试和优化工具

文档工具

安全工具

图形处理

代码优化

版本控制系统

有用的拓展,使用工具和类

  • SimplePie :PHP RSS 解析程序
    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流
  • HTML Purifier :可以用来移除所有恶意代码(XSS),而且还能确保你的页面遵循W3C的标准规范。
  • TCPDF :一个用于快速生成PDF文件的PHP5函数包。
  • htmlSQL :一个是你可以方便的对HTML和XML内容方便的使用类似SQL语句进行检索的PHP类。
  • The Greatest PHP Snippet File Ever (Using Quicktext for Notepad++)
  • Creole :用PHP5编写, 是一个基于真正意义的OO的层,API接口以JDBC为基础。
  • PHPLinq用SQL语法操作PHP数组。
  • PHPMathPublisher:作者是一位法国中学数学老师。


    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流

  • phpMyAdmin :可以通过互联网在线控制和操作MySQL。
  • PHPExcel :相当强大的MS Office Excel 文档生成类库。
  • Phormer :一个轻量级,强大的PHP在线相册。
  • xajax PHP Class Library :一个开源的PHP 类库,用来构建WEB上的Ajax 程序。
  • PHP User Class :用户管理。
  • PHP-GTK :为了证明PHP是一种远远超越网络应用程序的有效的工具而开发的。使用PHP-GTK你可以建立独立的GUI(用户图形界面)应用程序。

在线工具和资源

  • Minify! :使用 PHP5 开发的用于合并压缩 js/css 文件的应用程序。合并压缩之后的结果可通过 HTTP gzip/deflate 及一些相关头,优化客户端缓存。
    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流
  • HTTP_StaticMerger:自动“合并”CSS和JavaScript文件。
  • PHP Object Generator :一个开源的PHP代码生成器。它能够为你的PHP4/PHP5应用程序生成简洁和可测试的面向对象代码。

    gotAPI/PHP

    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流
     

 
koders :开放源代码搜索。
 
PECL :含有PHP 开发组提供的不同扩展库的信息。

浏览器中的工具(Firefox插件)

  • FirePHP :是基于Firebug的一个扩展,可以用来在Firebug的console中方便的输出php的调试信息又不影响php程序的正常运行
  • phpLangEditor :是一个用来翻译各种PHP变数的工具.


    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流

  • PHP Lookup :是一个内置的搜索栏,以帮助您快速查找引用的PHP语法。
  • PHP Manual Search :一个方便的搜索栏,从您的Web浏览器中搜索官方PHP文档

PHP框架

  • Dwoo :一个PHP5 的模板引擎。
  • CodeIgniter :帮助你编写Web 应用程序的敏捷开源PHP 框架。

    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流

  • YII Framework 一个高性能的基于组件的PHP框架。
  • Solar


    symfony :一个开源的PHP Web框架。目的是加速Web应用的创建与维护。 php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流
  • PEAR  
  • Propel :是一个适用于PHP5的OR映射(Object Relational Mapping)框架。它允许你使用对象代替SQL来读写数据库表格中的行。
  • {{macro}} template engine

    php调试工具 (锦集) - a138s - 晴风博客 QQ158441281欢迎交流

  • Zend Framework :是一个开放源代码的PHP5 开发框架,可用于来开发web 程序和服务。
  • Qcodo :是一个适用于敏捷开发基于PHP5采用MVC架构与CRUD代码生成功能的框架。
  • SAJAX :Sajax 是一种制作 Ajax 应用程序的模块化方式,通过预定的、动态的函数调用,使得应用程序的开发过程更加平滑。
  • Smarty : 用PHP实现MVC开发模式的逻辑层和表示层的模板引擎。
  • CakePHP :是一个开源的PHP on rails的full-stack框架。
  • Savant2 :是一套直接使用PHP function,但是做了合理的限制的PHP模板引擎。
  • PHPSpec :PHPSpec是一个简单而直观的PHP框架。

IDEs 和 Editors

  • PHPEclipse相当强大的一个Eclipse下开发PHP的插件,包括的功能有:PHP语法分析,调试,代码格式化,大纲视图,代码模板定制等。
  • PhpED :内部调试器。


  • phpDesigner :针对PHP 网页的编写所设计的程序。


  • Zend Studio :一个屡获大奖的专业PHP 集成开发环境,具备功能强大的专业编辑工具和调试工具,支持PHP语法加亮显示。


  • Aptana PHP :一个开源的IDE ,主要致力于浏览器端的开发。
  • PDT :一个开发工具框架,致力于在Eclipse平台之上提供一个功能完整的PHP集成开发环境。
  • VS.Php :通过安装这个插件,我们可以在Visual Studio .Net这个市场中最流行的IDE中编译、编辑、配置PHP程序。
  • PHPEdit :这款IDE软件提供用于突出语法显示、代码提示、代码识别,一个集成的PHP调试器以及一个帮助生成器工具。

补充资源

137月/11

Excel:数据分析工具名词解释

发布在 邵珠庆

数据分析

  • 如果显示“数据分析”对话框,请在“分析工具”下单击要使用的工具,然后单击“确定”
  • 在所选工具对应的对话框中输入适当的数据并单击相应选项,然后单击“确定”

    有关每种工具的说明以及如何使用每种工具的对话框的信息,请单击下面列表中的工具名:

 

注释

  • 该数据分析功能一次只能应用于一张工作表。如果对组合的工作表进行数据分析,计算结果只会显示在第一张工作表上,其余工作表上将显示带格式的空白表格。若要对其余工作表进行数据分析,分别在每张工作表上运行一次分析工具即可。
  • 有关提供用于创建 Microsoft Excel 统计工具和功能的统计方法或算法详细信息的书籍列表,请参阅统计方法和算法的参考书目

xl 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 使用什么方法能够分析统计信息? 双因素方差分析 双因素方差分析 双因素方差分析 双因素方差分析 双因素方差分析 数据分析结果错误 数据分析结果错误 数据分析结果错误 数据分析结果错误 数据分析结果错误 比较方法 比较方法 比较方法 比较方法 比较方法 自动散点图 自动散点图 自动散点图 自动散点图 自动散点图

17月/10

博客工具入门之Google Analytics

发布在 邵珠庆

要保证博客的生存与发展,Blogger需要了解博客当前的访问状况及一定时间区间内访问状况变化的趋势,需要对博客访问者进行必要的基本分析,如 博客内的哪些内容是用户欢迎的而哪些内容用户则根本不感兴趣,找出用户如何发现您的博客 及以怎样方式浏 览您的博客的基本规律,从而有的放矢地改进博客网站的建设与推广策略等。这都要求Blogger为博客配置一款有效的访问统计及分析系统,不管怎么说,数 据是最客观的,数据反映出的规律远远比blogger仅凭个人主观的臆测更真实、更有价值。

相对于日志型的访问统计软件,Google Analytics对大多数博客网站而言最大的吸引力在于其不需进行服务器设置,简单入手即可使用,毕竟,很多虚拟主机并不提供或不免费提供诸如 AWStats、Webalizer之类的网站分析软件,也不给予用户自行安装该类软件的服务器操作权限。当然,入手简单并不意味着功能上存在缺 憾,Google Analytics可提供丰富的访问统计分析数据,如访问数、综合浏览量、访问入口网页、来源及至具体的页面跳出率、用户停留时间、地理位置等等。

本文我们将介绍Google Analytics的基本使用。

如何开始?

帐户与登录

同我们之前介绍的Google 网站管理员工具 一样,要使用Google Analytics ,同样需要您拥有一个Google帐户,比 如在Gmail、Google Reader、 Adwords、AdSense、iGoogle等中使用的帐户。

如果确实没有,可至Google帐户 免费注册。

添加网站配置

登录Google Analytics后,首先做的肯定是要添加网站配置了。

输入您的博客Url——同样地,根据博客设置的首选域,选择正确的含“www”或不含“www”的版本,如博客学堂 在此便应输入“blogsdiy.org”而不是 “www.blogsdiy.org”——设置正确的时区,一般而言,您有两个选择,根据自己所在位置或主要目标用户群体所在位置,视乎您更看重哪方面而 定,当然,对大多数中文博客而言,答案都是“中国”。

第一次使用Google Analytics的话,接下来会要求您输入联系信息以及同意Google Analytics条款的确认。然后,即至跟踪代码的页面,内中提供待插入到网页中的跟踪代码。

<script src=”http://www.google-analytics.com/urchin.js” type=”text/JavaScript”>
</script>
<script type=”text/javascript”>
_uacct=”UA-xxxx-x”;
urchinTracker();
</script>

这时,返回Google Analytics主页面,可以看到相应网站的状态为“未验证”

在博客中插入Google Analytics跟踪代码

要记录网站的访问状态,需要您将Google Analytics提供的跟踪代码插入到网站的页面中去。一般而言,应该是网站的全部页面,除非您网站中存在部分不欲被Google察觉同时也不需要分析 的页面。

简单地说,跟踪代码可放置在网页中 </body>之前的任何位置,包括网页的 <head>…</head>中,不过,考虑到JavaScript代码 可能引起的网页加载延迟 问题,建议将其置于html比较靠后的地方,如恰好在 </body>之上,除非极少数特殊情况,比如说使用网页调用如 utmLinkPost() 等需要在网页加载前便进行定义的函数。

换言之,对基于WordPress的博客,一般修改footer模板,找到</body> 的位置,在其上粘贴拷贝的跟踪代码即可。

加入代码后等上一段时间,即可看到相应网站后的“状态”显示由“未验证”改变为“接收数据”。

控制台

在要检查的网站栏点击“查看报告”链接,即可看到网站访问状态的基本数据摘要。——注:控制台显示内容可定制,即您可根据自己的需要调整出现在控制 台上的内容,以更好地提高日常操作中的效率。

在默认设置下,这里显示的是过去一个月以来的网站访问数据分析结果。——除非您的跟踪代码安装时间少于一个月,或者,您希望更有针对性地检查网站访 问情况,调整了日期范围。日期范围的调整方式如下图:

该页显示的信息相当丰富,其中绝大多数可点击查看更详细的数据。下面简单介绍其显示的内容

折线图

在右侧在面板的最上方,以图表的方式直观地显示网站的访问情况,您可以一目了然地对网站的当前状态发展趋势,是象道哥那样“处于事业的上升期”  还是不幸处于下降期,有个最基本的把握。

可查看的项目包括:

  • 访问量 (Visits) : 与标准意义上的Unique Visits 还是有着一定区别的。Google Analytics 判断 Visits 的标准是一个会话周期(半个小时)内的新用户即为一个Visit,即如果一个用户相隔31分钟访问了您博客的两个页面,则会被计作 2 Visits。
  • 综合浏览器 (Pageviews) : 这个不必解释,用户浏览的网页数量。
  • 每次访问页数 : 用户在您的博客每次查看几页,由PageViews / visit 得出。同下面的跳出率一样,可以让您简单地判断博客内容是否与访问用户的意向相一致。过低的每次访问页数,只能证明您的博客也许具有将用户引来的能力,但 却无法“粘”住用户,需要在博客粘度 上 下点功夫。
  • 跳出率 (Bounce Rate) : 至您的网站后仅查看一个网页便离开的用户比例。这是衡量博客/网站质量的重要指标,跳出率较高显然表示用户对您的内容不感兴趣——不管其是通过什么渠道来 到您的网站。
    需要注意的是,跳出率高并不是绝对意义上的坏事,特别对单个的网页而言。比如说,如果您的某个页面目标本来就是希望用户点击广告、购买产品离开的,那么, 这个页面的跳出率高正说明您实现了预期中的转换效果。
  • 网站平均停留时间 : 如果用户打开您的博客网站后马上离开,停留时间只有几十秒,那么显然说明其对您的博客不感兴趣。
    但这个指标具有很大的迷惑性,有时网站平均停留时间高仅仅因为用户打开页面而忘了关闭而矣,特别是随着IE7也支持标签浏览后情况更是如此:许多用户往往 同时打开无数标签页,什么时候看甚至会不会看都只有天晓得。
  • 新访问次数所占百分比 : 过高则说明用户对您的博客忠诚度不够,而过低则说明您的博客在招徕新用户即博客推广方面仍需更上层楼。

网站使用率

上述6项的统计数据,可分别点击相应项查看详细的每日记录

访问者概述

将上述访问者一项单列出来,可点击查看报告打开访问者统计页面

地图覆盖图

以世界地图的方式访问者的地理来源,查看报告可分析来自特定区域的用户数据,如访问次数、每次访问的综合浏览量、转换率等。

点击量来源概述

给出用户通过什么渠道到达您的网站的信息,以及不同的访问来源如搜索引擎、推介网站等在总体访问量中所占比例。

点击查看报告即打开“点击量来源”页。

内容概述

显示网站内访问量居前的网页,也即用户到达网站的主要入口。可分别查看相应网站的具体访问信息。

访问者

在这里可得到与访问者有关的绝大多数数据。包括:

  • 访问者趋势 :注意这里的绝对唯一访问者人数,基本相当于UniQue Visits,其表示表示不重复(仅计数一次)的网站访问者人数,而不管用户在统计期限内是否在不同日期或不同会话周期内的多次访问。
  • 访问者忠诚度 :一个用户忠诚度不足的博客显然发展动力有限,但是,博客的忠诚度过高恐怕也未必是好事,也许正 说明您在吸纳新用户方面的不足。这里主要通过忠诚度、新近度、访问时长以及访问深度几项指标衡量。
  • 浏览器功能 :访问用户的操作系统、浏览器、屏幕分辨率等的统计结果。可以让您有的放矢地调整网页显示状况,比 如说,如果您的网页基于1024 x 768 设计,但访问量记录显示大部分访问用户的屏幕分辨率仍为 800 x 600 ,那么,也许您需要针对这部分用户修改一下。
  • 网络属性 :包括网站位置、主机名、连接速度等。虽然大多数朋友对这部分数据并不太关心,但有时其还是具有相当 意义的。比如说主机名,指用户查看您的内容时使用的连接域名,以博客学堂为例,主机名应该是“blogsdiy.org”,但是,您也许会在该项统计中看 到许多其他的域名或IP,这时也许您就需要检查一下到底怎么回事了,是否在合理范围内,以及,使用AdSense的博客,也许要考虑一下是否应针对某些引 用量大的主机调整 AdSense的域名保护列表以避免更多的损失 (在清楚相应风险的前提下)等等。

点击量来源

Analytics访问量来源数据

提供为您的博客带来访问量的各种来源的记录,包括概述与详细信息。这也是您对自己博客建设及推广特别是博客推广策略及方法是否合适是否最佳化进行分 析的主要依据。Google Analytics将访问量来源分为三类,分别为:

  • 直接点击量 : 通过书签来访或直接在浏览器中键入网址的用户访问次数;
  • 搜索引擎 : 在搜索引擎结果页点击网站的访问者的访问次数,并可进一步查看在不同的搜索引擎中,用户通过怎样的搜索关键词找到您的博客的,如果您重视SEO 的话 :P ,进而总结经验规避缺点;
  • 推介网站 : 从其他网站点击您的网站的访问者的访问次数;需要注意的是,Google Analytics将自身不能识别的其他搜索引擎也标记为“推介网站”,在中文领域,这类小型搜索引擎名目繁多,如电信的114、soso等。

当然,如果您使用了Google AdWords,则可与Google Analytics相结合,监控您的 AdWords 广告系列和关键字的收益率。

其他

将内容与目标两项列入其他,并不意味着这两项不重要或不值得关注,事实上,这两项也许才正能体现出Google Analytics的核心价值,让您更有针对性地优化网页及内容。只不过对这么一篇面向入门使用的介绍文章而言不太合适,也无法说得清楚。

简要地介绍一下吧:

内容

检查博客/网站内最主要的入口页面、出口页面、目标页面及其访问量构成细节,以及网站覆盖图。

通过对这些页面的具体分析,您可进而更明确地发现博客自身的优势与不足,比如说,某个网页大受欢迎,那么,为什么?其他网页与其相比存在哪些不足? 如何改进?等等。

目标

不管怎么说,博客总希望用户至网站到访后完成某个特定的目标,无论该目标是获得更多的 RSS订阅 还是更多的广告点击或者销售更多的产品。那么,从这个角度说,相对于访问量,目标转换的情况更为重要,一个不能完成预期目标的网页是失 败的。

通过设置相应的目标与渠道路径,您便可使用Google Analytics来您监控访问用户的转换过程并实际情况,这对博客/网站的价值实现而言,意义显然是无论怎样高估也不过份的。

小结

如上所言,Google Analytics是一款非常有用的工具。在您博客网站建设与推广中,您可以通过Google Analytics得到所需的各类信息与数据。

当然,要把Google Analytics用好,挖掘出其全部功能还是需要花费不少功夫的。从某种程度上,我们甚至可以可以用最常见的应用软件如Word与其类比:任何人只要会 打字便可使用Word,但很多人在Word中恐怕也只是打打字、调整字体字号、进行基本的版面调整,而事实上,Word的潜力要远比这些强大得多,甚至可 以说,对像我这样的懒人而言,可以永远都不会知道如何发挥出Word的全部能力,它的有些功能可能我根本都不知道存在。

184月/08

JSP开发工具的选择(3)

发布在 邵珠庆

Jrun

Allaire公司的JRun是一个具有最广阔适用性的Java引擎,用于开发及实施由Java Servlets(JSP)和JavaServer Pages编写的服务器端Java应用。JRun是第一个完全支持JSP 1.0 规格书的商业化产品,全球有超过80,000名开发人员使用JRun在他们已有的Web服务器上添加服务器端Java的功能。其中Web服务器包括了Microsoft IIS,Netscape Enterprise Server,Apache等。
JRun是开发实施服务器端Java的先进引擎。如果你希望在你的Web应用中添加服务器端Java功能,那么JRun将成为你的正确选择。
你可以使用JRun运行Java Servlets -- 运行Java Servlets有2种方法,扩展你的Web 服务器或是使用内置JRun的Web服务器。通过在整个环境中将servlets作为一个可扩展的,完整定义过的Java部件模型来使用,你就可以更加方便、快速的开发、实施复杂的应用,维护起来也更加经济
JRun目前有3个版本,它是第一个支持JavaServer Pages(JSP)规格书1.0的商业化产品。JSP是一种强大的服务器端技术,它是用于创建复杂Web应用的一整套快速应用开发系统。
JRun可以使你开始开发并测试Java应用。它最多接受5个并发的连接并且:
包括全部Java Servlet API
支持JavaServer Pages(JSP)
支持所有主要的Web servers和计算机平台
JRun Pro能够在生产环境下承受大访问量的负载,帮助你实施应用、服务或Web站点(包括内联网)。JRun Pro 支持无限量并发式连接运行多个Java虚拟机,包括多个并发的Java虚拟机(JVM)。
提供一个远程管理applet以及一个远程可再分布式的管理applet。JRun Pro Unlimited包括了所有JRun Pro的功能,除次以外,还可以运行无限量的,并发的JVM。

Allaire JRun一个适用性广泛的引擎,用于开发及实施使用JavaServer Pages(JSP)及Java Servlets开发成的Java应用。利用Java技术,你可以在现有的Web server之上添加服务器端Java功能,JRun所支持的Web服务器包括Microsoft IIS和Personal Web Server,Netscape的Enterprise或FastTrack,Apache, O´Reilly公司的WebSite以及StarNine公司的WebSTAR。

JRun依靠其内置的JRun Web Server可以单独运行。使用服务器端Java,用户可以开发出复杂的商业应用系统。最重要的一点是,由于servlets的平台独立性,以及更加简单的开发、更快速的实施、更经济的维护成本,它是CGI(Common Gateway Interface)或Perl scripts的极佳的替代产品。
主要功能:
JRun 2.3可以全面实施最新Java Servlet API。同时,JRun还可以利用Java Web Server中的许多先进功能。一些JRun2.3的重要功能列举如下:
? 全面支持Java Servlet API version2.1
? 全面支持JavaServer Pages(JSP)1.0 draft spec
? 动态 taglets
? 提供现成模板
? 页面编辑
? dynamic-servlet重载 ? Servlet-initialization属性
? Servlet 串联及过滤
? 多个宿主(虚拟主机)支持 ? <servlet> tag支持
? 任务跟踪
? 安装向导
? 复杂的Swing-based管理应用
? 100%纯粹Java以及完全跨平台
? 可运行于任何Java Virtual Machine ? 最多运行于5台Java Virtual machine(JRun Pro) ? 可运行于无限多个Java Virtual machine(JRun Pro Unlimited)
? 远程管理(JRun Pro)
技术优势
Java Servlets是由Java Servlet API--Java平台的一部分,编写成的独立跨平台的服务器端程序。Java Servlets拥有“一次编写,随处运行”的强大力量,同时具备网络传递安全性以及对服务器端应用提供了良好伸缩性。Servlets可以替代传统的由Perl,C/C++或其他语言编写的服务器端应用及扩展程序。用户将Servlet作为一个可扩展的,定义良好的跨平台环境来运用,能够更加方便的开发、快速实施服务器端复杂的应用,并节省维护成本。(可以在廉价的Windows NT机器上部署servlets)

在现有的成熟的服务器技术,例如Web 服务器中结合servlets,当编写复杂的应用时,就可以避免特定服务器配置中平台的局限性及复杂性。使用Servlets,开发人员就不必再顾虑服务器的内部工作方式。servlets API内在的classes能够控制Form 数据,server header,cookies等一切物质。

现有服务器端应用和servlets的最大区别就是性能。在服务器中运行一个独立的JVM,servlet一旦被呼叫即被载入。直到servlets改变时才会被再次载入。无须重新启动服务器或应用,一个被修改过的servlet就可以被自动加载。由于servlet永远驻留在内存中,它的加载速度极快。静态或永久信息可以通过多个激活的servlet 达到共享,并且允许多个用户之间共享信息。Servelet也是模块化的,它们即可以单独的完成一项特定任务,同时也可以结合在一起工作。 servlets彼此可以互相对话。

JRun支持的Web Server? Microsoft´s Internet Information Server (IIS) and Personal Web Server (PWS) ? Netscape´s Enterprise and FastTrack Servers
? Apache ? O´Reilly´s WebSite Pro
? StarNine´s WebSTAR
? Novell Netware 5 (Novonyx)

174月/08

JSP开发工具的选择(2)

发布在 邵珠庆

Jbuiler

JBuilder 软件的目标定位是代码开发人员而不是高级设计人员,所以JBuilder中包含了大量的向导程序和其他针对中间层的快速开发工具。JBuilder性能稳定、使用方便,特别适用于创建Java 组件。此外该软件还提供了很多JSP功能。

JBuilder本身通过内置的Java和Swing(Java的GUI程序框架)技术支持跨平台的软件开发:它可以运行在WindowsLinux和Solaris操作系统之上,操作界面和工具完全一致。这种所谓的“all-Java”策略意味着软件运行JBuilder的内存不会太多。128MB是系统最小需求,我们推荐装备256MB内存以获得更好的性能。

和早期版本一样,JBuilder 4 IDE设计得更富于效率性和功能性。你可以在同一开发环境下很方便地查看Java、 HTML和JSP文件、建立Sun推出的新型JDK 1.3 HotSpot虚拟机(这种新型虚拟机优化了Java代码)。JBuilder具有了相当出色的响应界面。在多种令人注目的特性之后,我们特别喜欢方便的自动补充功能(auto-completion wizardry),该功能不仅支持即时帮助还支持键入JBuilder Enterprise版更提供了对Enterprise Java-Bean组件开发的支持。在Jbuilder中,可以更容易的创建(create)配置(deploy)企业JavaBean。提供了一系列的向导来进行创建,处理,配置企业JavaBean的流程。把IAS的配置描述编辑器集成到Jbuilder的开发环境中(不过,并没有把IAS4.1内置到Jbuilder4中,需要另外下载安装)。Jbuilder还支持BEA的WebLogic Server 5.1。

Jbuider4的一个新的特性就是EJB Group功能。每一个EJB Group都代表了一个可配置的JAR文件。通过EJB Group,可以对已有的EJB在EJB Group之间进行移植。一个project工程中可以有多个EJB Group。
Entity Bean Modeler可以创建一个映射到现存表的实体Entity Bean。可以产生所有必须的Java代码,更新EJBGroup中配置描述。
在Jbuilder中,可以:
1、用EJB 向导创建Session Bean和Entity Bean
2、用Entity Bean Modeler将Entity Bean映射到现有的table中。
3、通过EJB Group向导创建EJB Group。这样,就可以在一个应用程序里面放多个的Enterprise JavaBean。
4、可以将一个Enterprise JavaBean从一个EJB Group移植到另一个EJB Group
5、一个应用程序里面可以有多个的EJB Group。
6、用Make和Rebuild就可以自动的创建可配置的JAR文件。
7、可以在node viewer中查看JAR的内容。
8、通过Test Client wizard可以在本地的容器或者与EJB1.1兼容的应用服务器中测试Enterprise JavaBean。
9、运行或调式EJB的时候会自动的配置EJB。 JBuilder支持EJB 1.1,由于采用了灵活的XML解决方案,软件还准备支持EJB 2.0。目前用户可以自动地生成基于后端数据库表的EJB Java类。JBuilder同时还简化了EJB的自动部署功能。此外它还支持CORBA,相应的向导程序有助于用户全面地管理IDL(分布应用程序所必需的接口定义语言interface definition language)和控制远程对象。

JBuilder的本地开发依赖于软件中所包含的轻度Java数据库,这种数据库被叫做JDataStore。软件包含的JDataStore Explorer和JDBC Explorer 可以让用户管理JDataStore和任何遵守JDBC标准的数据源。增强了数据库工具功能,也更加容易使用了。
JdataStore:更快,更灵活了。其底层的连接池的性能有显著的提高。Jbuilder4对支持JTA的支持使JdataStore连接可以利用标准的XA接口参与分布式的事务处理。
JdataStore Explorer可以用图形化的界面创建和操作table。可以创建表的索引。现在JdataStore支持交叉连接,内连接,外连接,左,右连接。
在现在的发行版本中,是通过“natural”或 “using”关键字来指定连接的域。JdataStore现在也支持SQL-92的连接序列,支持分级的子查询

JBuilder 处理同时也建立在中间层的EJB之上的事务可谓得心应手。尽管用JBuilder创建默认的JSP非常容易,你还是可以用基本的HTML表单而不是WebSphere Studio中的工具来完成该项工作。JSP本身对JBuilder而言还是一种很新颖的技术,你可以用简单的JavaBean 技术来管理JavaServer Page。

JBuilder 4 Enterprise包含了300多种组件,其中,大多数组件都属于JavaBean和Swing控件,这对建立客户端小程序和独立运行的Java应用程序是很有用的。此外软件还包括16种名为InternetBeans的特殊控件。不过,这些控件都是专用于JSP和servlet的。这些组件封装了Web表单中采用的控件,其范围不仅包括了简单的按钮也包括表这样的高级特性。

这些对象都将HTML和后台的JSP/servlet代码分割开来,这样Web设计人员在无须Java程序员修改底层代码的情况下就可以单独修改HTML。这种解决方案对我们很有吸引力,有了它也就拥有了未来扩展的足够余地。事实上,同类组件还可以让用户生成用于无线设备的WML代码,你只需要将模版改为WML,这些InternetBeans就会动态地填充用于WAP设备的数据。在真实的应用环境中,我们完全可以采用自己喜欢的HTML工具从事HTML编辑工作。Jbuilder支持Web应用程序的开发,增加了对XML的支持,提供了更好的Servlet和JSP的支持。通过InternetBeans Express和一些组件,能够在Java和html之间进行无缝数据转换。 Jbuilder内置了Tomcat3.1,可以动态的调试Servlet和JSP程序。 每一个Servlet都有一个别名(Servlet-name)和init()初始化函数的参数,能够离开SHTML独立执行。  Jbuilder提供了增强的JSP支持,很容易的就可以直接调试JSP源代码。提供了XML的支持。能够简单快速的编写XML文件。XML关键字的高亮度显示很容易的对整个XML文件的结构了如指掌。 通过InternetBeans Express控件,可以动态的产生WEB页面的内容。

JBuilder还针对团队开发推出了CVS版本控制功能,该技术已经被我们的程序员用于建立测试应用程序。采用CVS,开发队伍就可以方便地跟踪项目开发全过程了。
工程文件(*.jpr和*.jpx)可以分为两部分,private和shared。Windows, watch, breakpoints保存在private私有部分,而libraries和编译选项保存在公有shared部分。

版本追踪和控制:Jbuilder4对每一个版本都提供更改的支持。要查看一个文件的版本信息,单击底部的histroy标签,里面有每个文件的历史修改记录。Jbuilder自动的保持着文件的备份。可以设定备份的个数。Histroy页面就用这些备份来管理着历史的修改记录。可以访问上一个版本文件。也可以查看两个版本之间做了哪些修改。Jbuilder4的企业版还提供了CVS(Concurrent Versions System并发版本系统)JBuilder漂亮的IDE环境充分展示了Inprise和Borland开发人员的一贯喜好,JBuilder将继续获得Java程序员的青睐。这一装备了获得好评的帮助程序和服务器端EJB工具的软件在总体水准上是一款相当成熟和优秀的Java开发环境。但是Jbuilder4也还是它的不足:

1. 和中文系统有冲突。至少和Win2000的中文系统有冲突,它的菜单总是触发中文输入条。
2. 速度不够快。还是要求高配置。
3. 由于需要Application Server,而且要求装在同一机器上,开发EJB要求的硬件环境太高
4. 缺乏WebGain Studio里的一些有用工具,如StructureBuilder。缺乏和Rose等工具的高效集成
5. 支持的工具,如版本控制的工具比较少

164月/08

JSP开发工具的选择(1)

发布在 邵珠庆

JSP引擎搭建起来后就可以着手使用开发工具进行JSP的编程了,现下流行的JSP开发工具主要有IBM VisualAge,JBuilder,NetBeans,JRun,Urledit,Dreamweaver,editplus等,这里我们主要介绍IBM VisualAge,JBuilder, Jrun三种工具的一些基本情况,大家可以参照其各自的特点,结合自身开发环境进行开发工具的选择。

IBM VisualAge for Java

IBM的Web开发产品可谓同类之中的庞然大物:体积庞大,功能众多;使用对象是整个开发团队;而设计目标则是搞定视野里能看到的一切!

IBM WebSphere软件平台(全套的集成电子商务解决方案,包括VisualAge for Java 1.2版)是电子商务应用构架的关键部分,该构架是IBM在同一编程模型上开发的统一的端对端体系结构。作为公共编程模型,EJB规范得到了行业范围内的广泛支持,它也是电子商务应用构架的集成部件模型。VisualAge for Java是提供了向导功能的第一个Java IDE,它可以生成大量的EJB基础结构代码,从而简化了EJB开发过程。另外,对话和实体beans的创建向导、把beans映射到现有关系数据存储以及先进的测试环境极大地减少了创建、测试和部署EJB所花的时间。

VisualAge for Java持续性工具能让开发人员把EJB映射到现有的关系数据库结构。利用对对话和实体beans(CMP)的支持,开发人员能从现有的数据库表生成EJB或从现有的EJB生成数据库结构。VisualAge for Java还能提供把对象模型映射到数据模型的手段,从而把数据库管理员和Java开发人员联系在一起。另外,VisualAge for Java 3.5版还支持IBM DB2 S/390和Sybase,以及支持IBM DB2通用数据库和Oracle。

如果在VisualAge for Java中主机运行IBM WebSphere测试环境(WTE),开发人员还能在把EJB和servlet部署到远程服务器前对它们进行预测试。由于开发人员能启动和停止服务器和应用程序,并能在VisualAge for Java IDE中任意改变应用,所以开发人员不必远程部署和测试代码,从而节省了大量时间。

生成测试客户机能让开发人员测试他们服务器端的EJB而无须编写一个用户界面或等待图形制作人员给出的强制性界面。另外,当用户界面完成时,它还能作为一个测试工具,决定问题是存在于应用程序的客户机部分还是服务器部分。

VisualAge for Java还简化了把EJB添加到现有应用程序中的过程。通过生成AccessBeans,VisualAge for Java隐藏了EJB的远程和本地接口并把它融合到JavaBeans编程模型中。这提供了到EJB的简化的JavaBeans接口,简化了企业beans与servlet或JSP间的编程接口,得到了所有Java开发人员的普遍认可。另外,AccessBeans引入了先进的EJB属性本地缓存功能,减少了远程调用的次数,提供了对EJB的快速访问能力。

现在,IBM为建设Web站点所推出的WebSphere Studio Advanced Edition及其包含的VisualAge for Java Professional Edition软件已全面转向以Java为中心,这样,Java开发人员对WebSphere全套工具的感觉或许会好了许多。Studio所提供的工具有:Web站点管理、快速开发 JDBC页向导程序、HTML编辑器和HTML语法检查等。这确实是个不错的HTML站点页面编辑环境。Studio和VisualAge集成度很高,菜单中提供了在两种软件包之间快速移动代码的选项。这就让使用Studio的Web页面设计人员和使用VisualAge的Java程序员可以相互交换文件、协同工作。

Studio提供了建立Java Server Page的完整前端开发环境。许多向导程序可以帮助用户以更快捷、更难以出错的方式实现特定的开发任务。比如说,SQL向导程序就可以让我们在测试所用的Oracle 8i 数据库中浏览各表、执行多种SQL任务(比如增加连接、限制带约束的查询以及在存储结果之前查看查询结果等等)。

IBM新增加的标签可以让JSP访问数据的工作变得更加方便,比如 <tsx:repeat> 标签就负责遍历查询中各行而无须增加处理数据库的Java代码。这些标签表明IBM正在逐步采用以标签为中心的数据访问解决方案(就象ColdFusion所采用的方案那样)。

在编辑页面的时候,我们面前有好几个工具可供选择,包括一个图形界面的所见即所得页面编辑器、一个可以显示页面层次结构的纲要视图以及HTML源代码编辑视图。不过我们发现这些编辑工具之间存在整合方面的一些问题,相比之下还是Dreamweaver 或者ColdFusion做得好一些。

Studio提供了代码补充特性,但是很令人失望??该特性只能用于VoiceXML文件,不能用于 HTML或者JSP文件。不过,它对VoiceXML和WML这样的Web技术,其支持力度还是处于市场领先的地位。

Studio和VisualAge都包括了JavaServer Page调试器。因为JavaServer Page在执行前采用预编译方式运行,所以IBM为其预编译表单所提供的页面调试方式值得关注,这种方式并没有在服务器上实际运行Java 源代码表单。有了VisualAge的Java Server Page调试器,我们就可以在页面调试的时候从输出窗口中查看HTML显示。不过在编译JavaServer Page之后,编译器的输出却只列出错误结果而不自动地标记那些出现错误的源代码。

VisualAge for Java支持团队开发,内置的代码库可以自动地根据我们做出改动而修改程序代码,这样我们就可以很方便地将目前代码和早期版本做出比较。Studio本身并不提供源代码版本管理的支持,它只是包含了一个内置文件锁定系统,当我们编辑项目文件的时候可以防止其他人对这些文件的错误修改。软件还支持诸如Microsoft Visual SourceSafe这样的第三方源代码控制系统。因为Studio对多服务器和多阶段项目部署都提供了完整的可定置支持,所以开发完应用程序之后,在测试服务器和产品服务器上的应用部署都很快。

WebSphere Studio Advanced Edition 3.5 和VisualAge for Java Enterprise Edition 3.5对开发团队而言都是可供选择的优秀开发环境,他们提供了对单一项目下多个开发人员的内置支持。但是这两套产品的界面和编辑缺陷使得IBM产品成为最佳开发包的努力功亏一篑。