博文

BI 定义(2012-04-14 22:35:00)

摘要: 一、BI的定义 BI是Business Intelligence的英文缩写,中文解释为商务智能,用来帮助企业更好地利用数据提高决策质量的技术集合,是从大量的数据中钻取信息与知识的过程。简单讲就是业务、数据、数据价值应用的过程。用图解的方式可以理解为下图: 图(1) 这样不难看出,传统的交易系统完成的是Business到Data的过程,而BI要做的事情是在Data的基础上,让Data产生价值,这个产生价值的过程就是Business Intelligence analyse的过程。
如何实现Business Intelligence analyse的过程,从技术角度来说,是一个复杂的技术集合,它包含ETL、DW、OLAP、DM等多环节,基本过程可用下图描述。
图(2) 上 图流程,简单的说就是把交易系统已经发生过的数据,通过ETL工具抽取到主题明确的数据仓库中,OLAP后生成Cube或报表,透过Portal展现给用 户,用户利用这些经过分类(Classification)、聚集(Clustering)、描述和可视化(Description and Visualization)的数据,支持业务决策。 说明:
BI 不能产生决策,而是利用BI过程处理后的数据来支持决策。哪么BI所谓的智能到底是什么呢?(理清这个概念,有助于对BI的应用。)BI最终展现给用户的 信息就是报表或图视,但它不同于传统的静态报表或图视,它颠覆了传统报表或图视的提供与阅读的方式,产生的数据集合就象玩具“魔方”一样,可以任意快速的 旋转组合报表或图视,有力的保障了用户分析数据时操作的简单性、报表或图视直观性及思维的连惯性。 我想这是大家热衷于BI的根本原因。 二、BI的诞生 随 着IT技术的进步,传统的业务交易系统有了长足的发展,已经实现了业务信息化,每一笔业务数据都记录在数据库中,星转斗移,累积了以TB为计量单位的业务 数据记录。也许你会问:这么多数据,占用了很多存储设备,耗费存储成本,却又不经常访问,留着它有什么用处?可以给你肯定的回答,留着......

阅读全文(1203) | 评论:0 | 复制链接

windowxp 定时命令(2011-11-22 20:07:00)

摘要:开始/运行/输入      at 21:30 /every:M,T,W,Th,F,S,Su shutdown -s -t 120
说明:at ××:××(时:分)                                       120表示关机到记时间 用法: shutdown [-i | -l | -s | -r | -a] [-f] [-m \\computername] [-t xx] [-c "comment"] [-d up:xx:yy]         没有参数                显示此消息(与 ? 相同)         -i                      显示 GUI 界面,必须是第一个选项         -l             &nb......

阅读全文(1127) | 评论:0 | 复制链接

TPCC计算原则(2011-11-15 16:23:00)

摘要:不管是TPC-C还是SPECjbb2000,计算结果都只能作为一个横向比较的参考。在实际应用中,决定系统性能的因素除了硬件、系统软件外,与应用软件的设计也是有很大关系的,此外,基于系统可扩展性的考虑,更多时候也倾向于一次性的采购。
从长远考虑,以政府信息化主管部门的角度考虑,建立一套评估机制是非常有用的,这其中包括:
1、 通过对各单位业务系统运行情况的调查,进行历史数据的收集分析,按分类建立基准指标库。收集的信息包括:服务器的配置、并发用户数(每天业务量)、CPU负荷等;
2、 由厂商定期提供基准值,更新基准指标库;
有了基准指标库的信息参照,不仅可以用于评估项目建设方案中服务器选型,也可以对各部门进行系统架构设计的优化提供指导。如以下是一些指导原则:
1、 数据库服务器选型:采购两台相同配置的小型机,进行虚拟分区和并行处理,以提高系统资源的利用率;日后扩容时采取垂直扩展的方式进行升级;
2、 应用服务器:采用负载均衡的方式提高并发处理能力,一般可配置2台以上,每台的硬件配置完全可以不同,应首先考虑使用旧的数据库服务器(利旧),如需采购新的服务器,应采用水平扩展的方式逐步升级;
3、 WEB服务器,可以考虑采用刀片服务器,提高扩展性和可管理性。 2参考:某项目计算实例 参考1 为了方便计算数据库服务器的造型,我们约定:
" 系统同时在线用户数为1500人(U1);
" 平均每个用户每分钟发出2次业务请求(N1);
" 系统发出的业务请求中,更新、查询、统计各占1/3;
" 平均每次更新业务产生3个事务(T1);
" 平均每次查询业务产生8个事务(T2);
" 平均每次统计业务产生13个事务(T3);
" 一天内忙时的处理量为平均值的5倍;
" 经验系数为1.6;(实际工程经验)
" 考虑服务器保留30%的冗余;
服务器需要的处理能力为:
TPC-C=U1*N1*(T1+T2+T3)/3*3*经验系数/冗余系数
则应用服务器的处理性能估算为:
TPC-C= 1500*2*(3+8+......

阅读全文(1164) | 评论:0 | 复制链接

字符,字节和编码(2011-11-08 09:11:00)

摘要:级别:中级 摘要:本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的内容涵盖了“中文问题”,“乱码问题”。 掌握编码问题的关键是正确地理解相关概念,编码所涉及的技术其实是很简单的。因此,阅读本文时需要慢读多想,多思考。 引言 “字符与编码”是一个被经常讨论的话题。即使这样,时常出现的乱码仍然困扰着大家。虽然我们有很多的办法可以用来消除乱码,但我们并不一定理解这些办法的内在原理。而有的乱码产生的原因,实际上由于底层代码本身有问题所导致的。因此,不仅是初学者会对字符编码感到模糊,有的底层开发人员同样对字符编码缺乏准确的理解。 回页首 1. 编码问题的由来,相关概念的理解 1.1 字符与编码的发展 从计算机对多国语言的支持角度看,大致可以分为三个阶段:   系统内码 说明 系统 阶段一 ASCII 计算机刚开始只支持英语,其它语言不能够在计算机上存储和显示。 英文 DOS 阶段二 ANSI编码
(本地化) 为使计算机支持更多语言,通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如:汉字 '中' 在中文操作系统中,使用 [0xD6,0xD0] 这两个字节存储。

不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下,ANSI 编码代表 GB2312 编码,在日文操作系统下,ANSI 编码代表 JIS 编码。

不同 ANSI 编码之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的文本中。 中文 DOS,中文 Windows 95/98,日文 Windows 95/98 阶段三 UNICODE
(国际化) 为了使国际间信息交流更加方便,国际组织制......

阅读全文(1360) | 评论:0 | 复制链接

IP划分(2011-08-20 11:31:00)

摘要:IP地址   A类: 0xxxxxxx(8bit网络部分) 24bit主机部分 1~126 0:特定用途,表示缺省路由 127:设备保留,loopback 地址   b类地址:10xxxxxx(16bit网络部分) 16bit主机部分 128~191   C类地址:110xxxxx(24bit网络部分) 8bit主机部分 192~223  ......

阅读全文(1728) | 评论:1 | 复制链接

路由器命令(2011-08-20 10:49:00)

摘要:路由器的常用命令   enable(进入特权模式) disable(退出特权模式) exit(退出上一个模式) end(退回到特权模式) = ctrl+2   configure terminal(特权模式下使用,,进入全局配置模式) hostname(全局配置模式下使用,配置主机名称) interface serial 0 (进入接口配置模式) interface ethernet 0   line con 0 (进入con 的线路配置模式) logging synchronous (开启日志同步功能) exec-timeout 00 (将con终端的超时时间设为不超时) login (设置con线路需要登录) password cisco (设置con线路的密码)   注意:con线路缺省时不需要登录   line vty 0 4 login (设置vty线路需要登录) password cisco (设置vty线路的密码) 注:vty线路缺省时需要登录,因此必须配置密码 enable password cisco (明文) enable secret cisco (进入特权模式密码--密文)......

阅读全文(1581) | 评论:0 | 复制链接