lovebugs -- 编程爱好者博客

BI 定义(2012-04-14 22:35:00)

摘要：一、BI的定义 BI是Business Intelligence的英文缩写，中文解释为商务智能，用来帮助企业更好地利用数据提高决策质量的技术集合，是从大量的数据中钻取信息与知识的过程。简单讲就是业务、数据、数据价值应用的过程。用图解的方式可以理解为下图：图（1）这样不难看出，传统的交易系统完成的是Business到Data的过程，而BI要做的事情是在Data的基础上，让Data产生价值，这个产生价值的过程就是Business Intelligence analyse的过程。
如何实现Business Intelligence analyse的过程，从技术角度来说，是一个复杂的技术集合，它包含ETL、DW、OLAP、DM等多环节，基本过程可用下图描述。
图（2）上图流程，简单的说就是把交易系统已经发生过的数据，通过ETL工具抽取到主题明确的数据仓库中，OLAP后生成Cube或报表，透过Portal展现给用户，用户利用这些经过分类（Classification）、聚集（Clustering）、描述和可视化（Description and Visualization）的数据，支持业务决策。说明：
BI 不能产生决策，而是利用BI过程处理后的数据来支持决策。哪么BI所谓的智能到底是什么呢？（理清这个概念，有助于对BI的应用。）BI最终展现给用户的信息就是报表或图视，但它不同于传统的静态报表或图视，它颠覆了传统报表或图视的提供与阅读的方式，产生的数据集合就象玩具“魔方”一样，可以任意快速的旋转组合报表或图视，有力的保障了用户分析数据时操作的简单性、报表或图视直观性及思维的连惯性。我想这是大家热衷于BI的根本原因。二、BI的诞生随着IT技术的进步，传统的业务交易系统有了长足的发展，已经实现了业务信息化，每一笔业务数据都记录在数据库中，星转斗移，累积了以TB为计量单位的业务数据记录。也许你会问：这么多数据，占用了很多存储设备，耗费存储成本，却又不经常访问，留着它有什么用处？可以给你肯定的回答,留着......

阅读全文(2616) | 评论:0

windowxp 定时命令(2011-11-22 20:07:00)

摘要：开始/运行/输入 at 21:30 /every:M,T,W,Th,F,S,Su shutdown -s -t 120
说明:at ××:××(时:分) 120表示关机到记时间用法: shutdown [-i | -l | -s | -r | -a] [-f] [-m \\computername] [-t xx] [-c "comment"] [-d up:xx:yy] 没有参数显示此消息(与 ? 相同) -i 显示 GUI 界面，必须是第一个选项 -l &nb......

阅读全文(3850) | 评论:0

TPCC计算原则(2011-11-15 16:23:00)

摘要：不管是TPC-C还是SPECjbb2000，计算结果都只能作为一个横向比较的参考。在实际应用中，决定系统性能的因素除了硬件、系统软件外，与应用软件的设计也是有很大关系的，此外，基于系统可扩展性的考虑，更多时候也倾向于一次性的采购。
从长远考虑，以政府信息化主管部门的角度考虑，建立一套评估机制是非常有用的，这其中包括：
1、通过对各单位业务系统运行情况的调查，进行历史数据的收集分析，按分类建立基准指标库。收集的信息包括：服务器的配置、并发用户数（每天业务量）、CPU负荷等；
2、由厂商定期提供基准值，更新基准指标库；
有了基准指标库的信息参照，不仅可以用于评估项目建设方案中服务器选型，也可以对各部门进行系统架构设计的优化提供指导。如以下是一些指导原则：
1、数据库服务器选型：采购两台相同配置的小型机，进行虚拟分区和并行处理，以提高系统资源的利用率；日后扩容时采取垂直扩展的方式进行升级；
2、应用服务器：采用负载均衡的方式提高并发处理能力，一般可配置2台以上，每台的硬件配置完全可以不同，应首先考虑使用旧的数据库服务器（利旧），如需采购新的服务器，应采用水平扩展的方式逐步升级；
3、 WEB服务器，可以考虑采用刀片服务器，提高扩展性和可管理性。 2参考：某项目计算实例参考1 为了方便计算数据库服务器的造型，我们约定：
" 系统同时在线用户数为1500人（U1）；
" 平均每个用户每分钟发出2次业务请求（N1）；
" 系统发出的业务请求中，更新、查询、统计各占1/3；
" 平均每次更新业务产生3个事务（T1）；
" 平均每次查询业务产生8个事务（T2）；
" 平均每次统计业务产生13个事务（T3）；
" 一天内忙时的处理量为平均值的5倍；
" 经验系数为1.6；(实际工程经验)
" 考虑服务器保留30％的冗余；
服务器需要的处理能力为：
TPC-C=U1*N1*（T1+T2+T3）/3*3*经验系数/冗余系数
则应用服务器的处理性能估算为：
TPC-C= 1500*2*（3+8+......

阅读全文(3786) | 评论:0

字符，字节和编码(2011-11-08 09:11:00)

摘要：级别：中级摘要：本文介绍了字符与编码的发展过程，相关概念的正确理解。举例说明了一些实际应用中，编码的实现方法。然后，本文讲述了通常对字符与编码的几种误解，由于这些误解而导致乱码产生的原因，以及消除乱码的办法。本文的内容涵盖了“中文问题”，“乱码问题”。掌握编码问题的关键是正确地理解相关概念，编码所涉及的技术其实是很简单的。因此，阅读本文时需要慢读多想，多思考。引言 “字符与编码”是一个被经常讨论的话题。即使这样，时常出现的乱码仍然困扰着大家。虽然我们有很多的办法可以用来消除乱码，但我们并不一定理解这些办法的内在原理。而有的乱码产生的原因，实际上由于底层代码本身有问题所导致的。因此，不仅是初学者会对字符编码感到模糊，有的底层开发人员同样对字符编码缺乏准确的理解。回页首 1. 编码问题的由来，相关概念的理解 1.1 字符与编码的发展从计算机对多国语言的支持角度看，大致可以分为三个阶段：　系统内码说明系统阶段一 ASCII 计算机刚开始只支持英语，其它语言不能够在计算机上存储和显示。英文 DOS 阶段二 ANSI编码
（本地化）为使计算机支持更多语言，通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符。比如：汉字 '中' 在中文操作系统中，使用 [0xD6,0xD0] 这两个字节存储。

不同的国家和地区制定了不同的标准，由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这些使用 2 个字节来代表一个字符的各种汉字延伸编码方式，称为 ANSI 编码。在简体中文系统下，ANSI 编码代表 GB2312 编码，在日文操作系统下，ANSI 编码代表 JIS 编码。

不同 ANSI 编码之间互不兼容，当信息在国际间交流时，无法将属于两种语言的文字，存储在同一段 ANSI 编码的文本中。中文 DOS，中文 Windows 95/98，日文 Windows 95/98 阶段三 UNICODE
（国际化）为了使国际间信息交流更加方便，国际组织制......

阅读全文(4052) | 评论:0

IP划分(2011-08-20 11:31:00)

摘要：IP地址 A类： 0xxxxxxx(8bit网络部分) 24bit主机部分 1~126 0:特定用途，表示缺省路由 127：设备保留，loopback 地址 b类地址：10xxxxxx(16bit网络部分) 16bit主机部分 128~191 C类地址：110xxxxx(24bit网络部分) 8bit主机部分 192~223 ......

阅读全文(3545) | 评论:1

路由器命令(2011-08-20 10:49:00)

摘要：路由器的常用命令 enable(进入特权模式) disable(退出特权模式) exit(退出上一个模式) end(退回到特权模式) = ctrl+2 configure terminal(特权模式下使用，，进入全局配置模式) hostname(全局配置模式下使用，配置主机名称) interface serial 0 (进入接口配置模式) interface ethernet 0 line con 0 (进入con 的线路配置模式) logging synchronous (开启日志同步功能) exec-timeout 00 (将con终端的超时时间设为不超时) login (设置con线路需要登录) password cisco (设置con线路的密码) 注意：con线路缺省时不需要登录 line vty 0 4 login (设置vty线路需要登录) password cisco (设置vty线路的密码) 注：vty线路缺省时需要登录，因此必须配置密码 enable password cisco （明文） enable secret cisco (进入特权模式密码--密文)......

阅读全文(4407) | 评论:0

博客介绍