WEB分析工具概述
1.挑战
在竞争日益激烈的网络经济中,只有赢得用户才能最终赢得竞争的优势。作为一个网站,你知道用户都在你的网站上干什么吗?你知道你的网站哪些部分最为用户喜爱、哪些让用户感到厌烦?什么地方出了安全漏洞?什么样的改动带来了显著的用户满意度提高、什么样的改动反而丢失了用户?你怎样评价你的网站广告条的效率、你知道什么样的广告条点击率最高吗?“知己知彼,才能百战不殆”,你真的了解自己吗?
2.机会
所有客户行为的电子化(Click Stream),使得大量收集每个用户的每一个行为数据、深入研究客户行为成为可能。如何利用这个机会,从这“无意义”的繁琐数据中得到大家都看得懂的、有价值的信息和知识是我们面临的问题。
3.我们能做什么
3.1 基本分析
流量分析
随时间的变化,网络流量怎样变化?每一张网页、每一个目录、每一个内容模块的流量分配情况怎样。
广告分析
我们做的哪些广告给我们带来了最大的访问量?投资收益比是多少?我们自己网站上的广告又有多少点击率,什么位置上的广告点击率最高?
网站出入口分析
用户在哪里进入网站。每次都经过首页?还是通过搜索引擎直接进入感兴趣的页。用户在哪一页过后跳出了网站?有多少人是这样出去的?
访问路径分析
用户的访问路径都是什么样的?他们怎样进入某一特定内容?我们吸引用户进入一个特定目标的措施效果如何?
用户来源分析
我们最重要的用户都来自哪里?什么国家、地区,从哪个网站过来?那个ISP对我来说是最重要的,在来源上我们的用户有哪些特征?
浏览器和平台分析
用户都用什么样的浏览器、什么操作系统访问我的网站?在设计网站时具体要做哪些权衡和优化。
3.2 智能分析(数据挖掘)
网页相关性分析
哪些网页具有密切的关系,如果很多人具有a.html' b.html' c.html这样的访问模式,则我们可以认定a.html和c.html之间有一定的关系,是否考虑在a.html上直接加上c.html的链接?
用户访问模式分析
有哪一些网页,用户只要访问了其中的一页,则可以断定他也要访问其他的网页?即按不同的用户访问模式,把网页分组,得到一个一个的兴趣点。哪些用户所访问的网页组成比较类似(具有类似的兴趣),即根据用户行为的相似性,把用户按行为模式分类。
用户归类
通过用户填写的信息如何把用户归入某一特定的类别?然后可对同一类别中的用户提供相似的服务。
4.用户可以得到什么
对网站的修改更加有目的、有依据,稳步的提高用户满意度。
发现系统性能瓶颈,找到安全漏洞。
查看网站流量模式,找到网站最重要的部分。
发现用户的需要和兴趣,对需求强烈的地方提供优化。
根据用户访问模式修改网页之间的连接,把用户想要的东西以更快且有效的方式提供给用户。
在正确的地方正确的时间把正确的信息提供给正确的人。
测定投资回报率
测定广告和促销计划的成功度。
找到最有价值的ISP和搜索引擎。
测定合作和结盟网站对自身的价值。
提供个性化网站
对大多数Web应用来说,让用户感到真个网站是完全为他自己定制的个性化网站,是Web站点成功的秘诀。针对不同的用户完全按照其个人的兴趣和爱好(数据挖掘算法得到的用户访问模式),向用户动态的提供要浏览的建议,自动提供个性化的网站。
典型商业问题
网站的访问量增加了吗?在什么地方?为什么?
用户对我们的新的应用(功能、内容)反映如何?
我们的新一轮宣传攻势效果如何?
怎样评价我们做的某一项广告?
访问我们网站的都是一些什么人?
用户是否要经过复杂的步骤才能得到他想要的东西?
哪些应用(内容)占据了大部分的网络流量?
哪些用户在使用网站上体现了相似的行为?
5.技术问题
数据处理
如何得到分析和数据挖掘所用的数据,主要采用两种方法,一是直接使用Web Server的log文件,二是用网络监听的办法,在数据包中提取出HTTP请求和应答。最后两种数据源都要转换成固定的格式存放在数据库或数据仓库内,供统计分析和数据挖掘使用
统计分析
在数据库的基础上,针对不同的数据运行各种统计函数。
数据挖掘
数据挖掘技术是实现智能分析,得到隐藏在大量繁杂数据内部知识的关键。通过对用户访问网站的历史数据(即我们通过数据处理得到的数据)应用各种数据挖掘技术,得到高层知识,提供给用户作决策支持,或利用这些知识动态生成网页,为用户提供访问建议。
关联规则(Association Rules)
发现server session中请求网页的相关性。
可用于:优化网站组织,网络代理中的预取功能。
聚集(Clustering)
使用分组(usage clusters)把具有相似浏览模式的用户分成组。
可用于:电子商务应用中市场分片(market segmentation)和为用户提供个性化服务。
网页分组(page clusters)按内容的相似性把网页分类。
可用于:搜索引擎和Web浏览助手(Web assistance providers),为用户提供推荐链接。
归类(Classification)
根据用户的个人资料,将其归入某一特定的类。
可使用:决策树、naive Bayesian classifiers、k-最近邻居等算法。
序列模式(Sequential Patterns)
发现一个session内部的网页间的时间相关性。
可用于:预测用户的访问,而提供建议。
决策支持系统综述
决策支持系统(DSS,Decision Supporting System),是以管理科学、运筹学、控制论和行为科学为基础,以计算机技术、仿真技术和信息技术为手段,针对半结构化的决策问题,支持决策活动的具有智能作用的人机系统。该系统能够为决策者提供决策所需的数据、信息和背景材料,帮助明确决策目标和进行问题的识别,建立或修改决策模型,提供各种备选方案,并且对各种方案进行评价和优选,通过人机交互功能进行分析、比较和判断,为正确决策提供必要的支持。
DSS的概念是70年代提出的,并且在80年代获得发展。它的产生基于以下原因:传统的MIS没有给企业带来巨大的效益,人在管理中的积极作用要得到发挥;人们对信息处理规律认识提高,面对不断变化的环境需求,要求更高层次的系统来直接支持决策;计算机应用技术的发展为DSS提供了物质基础
1、DSS的构成
DSS的概念结构由会话系统、控制系统、运行及操作系统、数据库系统、模型库系统、规则库系统和用户共同构成。
DSS运行过程可以简单描述为:用户通过会话系统输入要解决的决策问题,会话系统把输入的问题信息传递给问题处理系统,然后问题处理系统开始收集数据信息,并根据知识机中已有的知识,来判断和识别问题,如果出现问题,系统叫过会话系统与用户进行交互对话,直到问题得到明确;然后系统开始搜寻问题解决的模型,通过计算推理得出方案可行性的分析结果,最终将决策信息提供给用户。
DSS的技术构成包括:
1)接口部分,也就是输入输出的界面,是人机进行交互的窗口。
2)模型管理部分,系统要根据用户提出的问题调出系统中已有的基本模型,模型管理部分应当具有存储、动态建模的功能。目前模型管理的实现是通过模型库系统来完成的。
3)知识管理部分,集中管理决策问题领域的知识(规则和事实),包括知识的获取、表达、管理等功能。
4)数据库部分,管理和存储与决策问题领域有关的数据。
5)推理部分,识别并解答用户提出的问题,分为确定性推理和不确定性推理两大类。
6)分析比较部分,对方案、模型和运行结果进行综合分析比较,得出用户最满意的方案。
7)问题处理部分,根据交互式会话识别用户提出的问题,构造出求解问题的模型和方案,并匹配算法、变量和数据等,运行求解系统。
8)控制部分,连接协调系统各个部分,规定和控制各部分的运行程序,维护和保护系统。此外技术构成还包括咨询部分、模拟部分、优化部分等。
2、DSS的特点
DSS的主要特点有如下几方面:
1)系统的使用面向决策者,在运用DSS的过程中,参与者都是决策者。
2)系统解决的问题是针对半结构化的决策问题,模型和方法的使用是确定的,但是决策者对问题的理解存在差异,系统的使用有特定的环境,问题的条件也不确定和唯一,这使得决策结果具有不确定性。
3)系统强调的是支持的概念,帮助加强决策者作出科学决策的能力。
4)系统的驱动力来自模型和用户,人是系统运行的发起者,模型是系统完成各环节转换的核心。
5)系统运行强调交互式的处理方式,一个问题的决策要经过反复的、大量的、经常的人机对话,人的因素如偏好、主观判断、能力、经验、价值观等对系统的决策结果有重要的影响。
3、决策支持系统的开发方法
决策支持系统的开发方法一般采用目标导向法(object Oriented)和原型方法(Prototyping)相结合的方法。具体步骤是先研制一个个DSS的技术部件(应用原型法),然后按照一般系统的结构和系统生成方法组合成DSS的开发工具和开发环境(应用目标导向法)。
从开发一个系统的角度来分析,DSS可以分成三个不同的技术层次:DSS工具,即DSS的基本技术部件;DSS的生成器,即组织DSS的通用框架;专用的DSS,即针对具体决策问题由DSS生成器生成的实际应用系统。
最基层的设计工作由专业软件人员完成,用户是最高层的使用者。从最基层到中间层的构造过程是系统工程师的任务;中间层是面对DSS建造者的,中间层到最高层的设计过程是系统分析设计人员的主要任务。
DSS的开发过程通常是针对具体目标,分为问题分析、可行性研究、开发方法和开发决策的选择、开发系统和支持决策五个阶段。在开发过程中,决策者必须参与其中,因为决策者是系统设计的直接使用者,他的需求就是系统所要达到的目标。
各阶段的基本工作如下:
问题分析阶段。该阶段对所面临的问题进行实际调查和分析,达到明确求解问题的目标。
可行性研究阶段。依据前一阶段的分析,从实际系统开发在技术方面、可能性方面、方案的有效性方面,以及经济和社会效益方面来研究确定系统开发的可能性。
开发方法和开发策略的确定阶段。该阶段要明确系统开发的组织问题和采用何种开发方式进行,并且明确在开发过程中,所采用的工具、方法、手段和具体实现的途径。开发系统阶段,指开发一个针对实际问题领域的专用DSS,包括DSS结构的确定、建立数据模型知识方法的结构、确定评价标准和指标体系等。支持决策阶段,指系统开发完成后的实际运行阶段,包括运行结果分析的方法,支持决策的形式,以及反映系统运行结果有效和实际效果的信息反馈数据的采集等。
4、DSS的应用举例
一个商业企业基本的业务过程可以概括为进一存一销。所谓进是指商品的采购;存是指商品的存贮,即商品的库存:销是指商品的销售过程,即顾客的购买过程。如果经营者为防止市场的价格波动(主要来自两方面:采购环节、销售环节),在一定时期内保证经营成本在预先确定的范围内,或是保持营业利润在预先确定的范围,则要通过DSS的应用确定在现货市场采购。商品销售的决策,如果范围更广一些,可以涉及期货市场。企业决策的制定与市场中许多不确定因素有关:
首先,决策者要对形势做出自己的判断,如预计商品采购价格会上升,则可通过期贷市场作一个套期保值的期货合同,锁定经营成本。
其次;决策者对市场信息采用的定量化分析方法和所得出结果,对决策过程有影响。
另外,还与决策者对经营管理和现货、期贷市场的知识背景,以及经营者自身素质有关。
系统运行的过程如下:
1)决策者对市场价格波动的趋势和幅度做出估计判断,并选择技术分析模型二系统根据决策者输入的信息,通过推理,对趋势作出定性判断,并给出各种相关分析和预测算法来支持决策者在此基础上讨论的方案,并确定选取本次决策的模型。
2)系统对不同方案进行技术分析,得出预测结果和相关可性分析,以支持决策者对市场发展趋势的判断。同时,系统还根据决策者个人对投资风险的态度计算出各种方案可能带来的结果。
3)决策者此时可以得到一个是否有利于作出决策的参考意见,经过权衡作出最终的决策。
群体决策支持系统
群体决策支持系统(GDSS,Group Decision Supporting System),是指在系统环境中,多个决策参与者共同进行思想和信息的交流,群策群力,寻找一个令人满意和可行的方案,但在决策过程中只由某个特定的人做出最终决策,并对决策结果负责。 群体决策支持系统从DSS发展而来,通过决策过程中参与者的增加,使得信息的来源更加广泛;通过大家的交流、磋商、讨论而有效地避免了个体决策的片面性和可能出现的独断专行等弊端。
1、GDSS的功能 群体决策支持系统的基本功能有以下几点:
1)通过加强通信,消除了差异:通过限制不必要的感情式的相互作用,控制、协调参与者的关系。
2)提高讨论者的地位和结论的公正性。
3)系统的实施可以是永久性的(稳定和正式的程序集合)或暂时性的(必要时才使用的系统)。
群体决策支持系统的技术功能主要有以下几点:
1)对决策过程中的数据信息交流的控制。
2)自动选择合适的群体决策技术。
3)对可行的决策方案进行分析计算和解释。
4)如果群体决策无法得出一致,则讨论个体决策差异或提出重新定义问题的建
2、GDSS的基本结构
一类典型的GDSS结构。
GDSS是决策支持领域的新的分支,对常规的DSS进行了扩充,扩充的内容包括:
1)增加了一个通信库(Communication Base),方便决策参与者之间进行交流。
2)加强了模型库功能,提供了投票、排序、分类评估等功能来实现达成一致的决策。
3)系统使用前能够快速准备和具有协调能力,如安排会议议程,事先让与会者熟悉相关数据文件和决策模型等。
4)扩充了必要的物理设备。
3、GDSS的分类
GDSS的类型在很大程度上取决于待决策问题的类型和问题所处的组织环境,因此,一般可将GDSS划分为四种类型:
1)决策室(Decision Room)。与传统意义相当的电子会议室,决策参与者集中到一间支持群体决策支持的特殊会议室,通过特殊的终端或节点,参与决策过程。在这种环境下的决策过程都有一定的时间限制。
2)局域决策网(Local Decision Network)。GDSS的参与者没有地域的限制,只要局域网上的中央处理器存储有公共的GDSS软件和数据库,参与者就可以通过局域网进行成员间以及成员与中央处理机之间的通信。
3)传真会议(Teleconferencing)。针对决策成员在地理上分散但必要时可集中决策的群体。在这种情况下,两个或两个以上的决策室通过视频和通信连接在一起,其方法与决策室相同,而且使用了传真会议。
4)远程决策(Remote Decision Marketing)。主要针对需要定期在一起作决策而又不能会面的决策成员。地理上分散的决策成员通过远程“决策站”之间的持续通信,完成决策的制定。 上面四种类型的GDSS,前一种属于集中性,而后三种是属于分散性的。
智能决策支持系统
智能决策支持系统(IDSS,Intelligence Decision Supporting System),是人工智能(AI,Artificial Intelligence)和DSS相结合,应用专家系统(ES,Expert System)技术,使DSS能够更充分地应用人类的知识,如关于决策问题的描述性知识,决策过程中的过程性知识,求解问题的推理性知识,通过逻辑推理来帮助解决复杂的决策问题的辅助决策系统。
IDSS的概念最早由Bonczek等人于80年代提出,它的功能是,既能处理定量问题,又能处理定性问题。 IDSS的核心思想是将AI与其它相关科学成果相结合,使DSS具有人工智能。
1、IDSS的信息结构
把AI技术引人DSS,主要是通过专家系统与DSS相结合,在DSS系统中加入推理机和规则库。由于在决策过程中,许多知识不能用数据来表示,也不能通过模型来描述,所以没有固定方式的专门知识和历史经验。IDSS引人的规则库可以存储这些知识,为决策提供重要的参考和依据。
IDSS可以有多种类型的信息库:文本库(TB)、数据库(DB)、方法库(AB)、模型库(MB)和规则库(RB)。其中文本库存储的是大量的自然语言书写的文档;数据库中存放的是事物关键因素的字段形式;模型库中存放的是反映信息本质关系的各种模型;规则库存放的是知识的最精炼的形式。从最初未加工的数据到经过加工的信息再到提炼出的知识,信息的这种演变关系被称为“演进链”。
2、IDSS的结构层次
依照系统层次的观点,IDSS从技术上可以划分为三个层次:
1)应用层,直接面向IDSS的使用者。在该层,决策者可以根据自己的需要,确定IDSS的状态和约束。决策者通过用户接口进行系统对话,输入相关信息,DSS则通过信息转换理解用户请求和命令,并进行系统推理运算,将结果通过输出界面反映给用户。整个过程对用户是透明的。
2)控制协调层,面向IDSS的总设计师。其基本单元是系统中餐库的控制协调模块,系统工程师通过各库的标准接口来建立它们之间的联系。
3)基本结构层,面向专业程序设计人员。专业程序设计人员通过该层对各库进行具体的实现,具体到定义各库的组织结构、通信方式等,以完成各库的内部管理和外部通信任务。
3、IDSS的特点
1)基于成熟的技术,容易构造出实用系统;
2)充分利用了各层次的信息资源;
3)基于规则的表达方式,使用户易于掌握使用;
4)具有很强的模块化特性,并且模块重用性好,系统的开发成本低;
5)系统的各部分组合灵活,可实现强大功能,并且易于维护;
6)系统可迅速采用先进的支撑技术,如AI技术等。
4、IDSS的运行效率
由于在IDSS的运行过程中,各模块要反复调用上层的桥梁,比起直接采用低层调用的方式,运行效率要低。但是考虑到IDSS只是在高层管理者作重大决策时才运行,其运行频率与其他信息系统相比要低得多,况且每次运行的环境条件差异很大,所以牺牲部分的运传效率以换取系统维护的效率是完全值得的。
认识DSS
管理的核心是“决策”。全球经济一体化的进程以及信息技术的发展,消除了许多流通壁垒。企业比以往任何时候都面临着更为复杂的生存环境,更难以形成并维护其竞争壁垒。竞争的压力对企业制定决策的质量、速度都有更高要求。
决策支持系统作为一种新兴的信息技术,能够为企业提供各种决策信息以及许多商业问题的解决方案,从而减轻了管理者从事低层次信息处理和分析的负担,使得他们专注于最需要决策智慧和经验的工作,因此提高了决策的质量和效率。
本文分析了现代企业决策所遇到的挑战,指出了当前管理信息系统的不足,然后阐述了决策支持系统的概念、功能、组件及应用,最后提出了决策支持系统的建设要点和中国企业的实施建议。
现代企业的管理决策
一、管理和决策制定
60年代末,明茨伯格(Mintzberg)对5位总经理的工作进行一项仔细的研究。他发现,管理者扮演着十种不同的但却是高度相关的角色。这十种角色可以进一步分为三方面:人际关系、信息传递和决策制定。在这三方面中,决策制定是管理最核心、最实质性的角色。所有的管理活动都围绕着决策。决策的整体质量对企业的成败有重大影响。
二、现代企业决策的挑战
在过去许多年,管理者制定决策是一门纯粹的艺术,是通过很长一段时间的经验所获得的一项天赋。管理之所以被看成一门艺术,是因为许多个体风格被用于处理并成功地解决了同一类型的管理问题。这些风格源于创造力、判断力、直觉和经验,而不是建立在科学方法基础上的系统化的定量分析方法。
但是,今天管理所面临的外部环境正在发生迅速变化。商业及其本身的环境也比以往更加复杂,而且这种复杂性日益增加。这些都对现代企业的管理决策带来了新的挑战:
1. 决策质量的要求更高
随着技术的迅速发展,客户获得产品和服务的渠道更为畅通,客户的选择余地更大。同时大规模生产使得产品出现了供过于求的状态。客户成为最稀缺的资源。这迫使企业必须采取“以客户为中心”的经营策略,努力提高产品和服务的质量。
2. 决策时要考虑的因素更复杂
随着经济全球化的趋势,尤其是中国加入WTO之后,无论是否愿意,企业都将面对全球的竞争者和全球范围的消费市场;随着环境的恶化、消费者权益意识的增强等,政府颁布了更详尽的法令和制度来约束企业的经营行为。企业管理者在进行决策时需要考虑更多、更复杂的制约因素,
3. 决策速度要求更快
随着通讯方式的发展、交通的便利以及金融体系的完善,企业更难以长久维持自己的竞争优势。企业必须不断地创新,从以规模取胜转变到以速度取胜。这些都要求管理者能够迅速做出正确的决策。
4. 决策失败的代价更高
企业中采购、生产、销售和服务等方面的联系日益紧密,企业的整个运作系统更加复杂和精密。某一环节的判断失误将产生链锁反应,造成企业重大的损失。
面对这些趋势和变化,管理者必须变得更加精明。他们需要新的工具和技术来帮助他们制定有效的决策。而传统的企业信息管理系统却不具备这样强大的分析功能。这体现在:
1. 分析工作量大
企业通常的运营系统只能提供面向交易的数据。因此,许多管理者要花费80%的时间进行数据的分析,真正用于决策的时间只有20%。而且对于许多大型企业,还必须为之配备庞大的专业分析队伍。
2. 分析结果滞后
由于分析时间过长,经理们经常无法及时拿到所需的报表,因此贻误了许多商业机会。
3. 无法按照商业习惯进行分析
传统的报表只能进行简单的汇总。管理者有时为了分析一个关键的商业因素,不得不在一大堆打印的报表中前后翻阅,极不方便。
4. 无法进行复杂的分析
管理者经常希望能综合多种因素来分析问题。如,石油价格的上涨、物价指数的波动对企业各方面的影响;如果现在采取降价措施,本年度末公司的市场分额、销售额和赢利是否有所增长;哪些客户对我们企业最关键,他们有什么特征,如何增加他们对我们企业的忠诚度;等。
5. 无法提供关键问题的解决方案
例如,对于大型零售企业,为了实现最高效率,如何在一个区域内设立自己的连锁店?如何制定有效的预算计划和现金流计划?如何防止客户的流失?传统的信息技术都无法提供这些关键性问题的解决方案。
6. 缺乏量化的衡定指标
随着企业规模的扩大和机构的日益复杂,管理者不能只依赖经验和直觉来评价企业的整体表现,必须借助一些关键的、量化的指标。但通常的MIS系统无法做到这一点。
一种基于知识规则推理的C++实现方法
1. 引言
决策支持系统(DSS)是一门新兴边缘学科,它不但能够有效支持结构化问题的求解,而且通过把人工智能关于知识表示和处理的技术应用到DSS,与专家系统相结合,从而形成了智能决策支持系统(IDSS),可以有效地支持半结构化和非结构化问题的求解。与单纯利用模型库的定量方法相比,IDSS的优越性突出的表现在其建立了知识库,存放有各种知识规则、因果关系和决策人员经过知识化抽象的经验,并且具有综合利用知识库、数据库和定量计算结果进行推理和问题求解的推理机。由此可见,一个组织恰当的知识库对于IDSS是至关重要的。
通常在IDSS知识库中进行知识表示的方法有:一阶谓词逻辑、语义网络、产生式规则、框架理论、面向对象表示等。其中产生式规则由于Post严格地理论证明,具有完备地理论基础;各产生式之间相互较为独立,修改与扩充都较容易,所以应用较广。本文提出了产生式知识规则的C++语言实现方法,并将推理机与知识表示相结合,构造出了一个简单高效的知识库。
2. 推理机制
每次推理,DSS都依次调用规则链中每个规则对象的Query方法(此即推理函数),直至推理结束,得到结论。在Query方法中,DSS从条件事实链中读取每一个条件事实,并在基本事实链中找相同事实,找到后,考察该事实对象的TorF字段。若为True,则表明条件事实链中的事实已经获得用户确认,则读取下一个条件事实;若为False,则表明条件事实链中的事实已被用户否认,则换一下条规则;若为Unknown,则与用户交互,由用户确认或否认该事实。若用户确认,则置TorF为True;若用户否认,则置TorF为False,并换下一规则。
这样,只有当某规则上的条件事实全部是被用户确认过的,才能得到结论,从而保证了推理的正确性。
3.代码实现
1) 定义基本事实类
class Fact // 基本事实类
{ int Number; int TorF; // 基本事实号,确认标志
public: Fact *Next; // 后继链接指针
Fact (int number) { Number=number; TorF=Unknown; Next=NULL; } // 构造函数
int GetNumber( ){return Number;}
int GetTorF( ){return TorF;}
void SetTorF(int torf){TorF=torf; }
};
2) 定义条件事实类
class List // 条件事实类
{ int Number; // 基本事实号
public: List *Next; // 后继链接指针
List (int number){Number=number; Next=NULL;} // 构造函数
int GetNumber( ){return Number;}
};
3) 定义规则类
class Rule // 规则类
{ int Number; List *pCause; int result; // 规则号,该规则的条件事实链头指针,结论号
public: Rule *Next; // 后继链接指针
Rule(int number, int a[ ]) // 构造函数
{ int i; List *l; pCause=NULL; Next=NULL; Number=number; i=0;
while (a[i]!=-1 && i<3){ l=new List (a[i++]); l->Next =pCause; pCause=l;} result=a[3]; }
~Rule( ) // 析构函数
{ List *l;
while (pCause){ l=pCause->Next; delete pCause; pCause=l;}}
int Query( ) // 规则查询推理函数
{ char c; List *l; Fact *f=fact; l=pCause;
for (; l != NULL; )
{ f=fact; for (;;){if (l->GetNumber( )==f->GetNumber ( )) break; f=f->Next ;}
if (f->GetTorF ( )==True) {l=l->Next; continue;}
if (f->GetTorF ( )==False) {return False;}
if (f->GetTorF( )==Unknown)
{ cout<
if ((c=='Y')|| (c=='y')){f->SetTorF (True); l=l->Next;} else
if ((c=='N')||(c=='n')) {f->SetTorF (False); return False;}}}
if (result<4){ for(;;) { if (result==(f->GetNumber( ))) break; f=f->Next;}
f->SetTorF(True); return False;} else
{ cout<<"\n"<
4. 应用实例
产生式规则:中年人是老练的。中年人是细心的。老练、细心且有驾驶经验是不会出交通事故的。
由于规则较少,这里用数组代替数据库实现基本事实库和规则库。其实现代码如下:
char *str[ ]={"中年人", "老练", "细心", "有驾驶经验", "不出交通事故","\0"};
int a[ ][4]={{1,2,3,4},{0,-1,-1,1},{0,-1,-1,2}};
int main( )
{ Fact *f; Rule *rule,*r; int i=0; fact=NULL;
while(str[i]!="\0"){f=new Fact(i++); f->Next =fact; fact=f;} rule=NULL;
for (i=0;i<3;i++){ r=new Rule(i,a[i]); r->Next=rule; rule=r;}
for (;;){ i=rule->Query ( ); if ( i==True) break; rule=rule->Next ;
if (rule==NULL) { cout<
}
5. 结论
本文所提供的IDSS中产生式规则知识表示、推理的实现方法是与DSS数据库相独立的,即用这样的方法产生的知识库是不依赖于数据库的。只要在DSS数据库中构造不同的基本事实库和规则库,系统就可以自动生成相应的知识库,因此具有很高的灵活性。
构建基于数据仓库的DSS
由于DSS(决策支持系统)的先天不足,它的横空出世并没有给业界带来多大的惊喜。然而,随着数据仓库的加入,DSS系统的尴尬处境正在逐步好转。
一.DSS的先天不足
决策支持系统(DDS)是在管理信息系统的基础上发展起来的,在数据仓库、OLAP技术和数据开采工具出现以前,DDS在实际应用开发过程中暴露出许多问题,主要有以下4个方面:
(1)DDS使用的数据库(DB)只能对原始数据进行一般的加工和汇总,致使决策所需信息不足,难以满足DDS的需要。DB中的数据还存在以下缺点:
①缺乏组织性从各个部门抽取的数据没有统一的格式标准,数据杂乱且不稳定;
②数据的利用率低由于数据缺少统一标准,而难以转化为有用的信息,原始数据定义的不一致性导致其可信度降低;
③数据存储不完整DDS只有对较长一段时间的完整数据进行分析才会有较高的预测率。
(2)由于决策本身的动态性和复杂性,针对不同的情况应有不同的处理方法,而模型库提供的分析能力有限,它所提供的模型独立于环境之外,决策者和模型交互很少,模型参数固定不变,不符合决策要求,DDS所作出的决策常被有经验的决策者一口否定,使决策者对DDS产生不信任感。
(3)在实际开发DDS过程中,人机接口部件占整个DDS开发工作量的一半,人的任何意图及系统对人的任何支持都要通过人机接口才能最终实现,因此它在整个系统中起着举足轻重的作用。现在人机接口开发得不理想,可以说是DDS实施中的一个瓶颈。
二.DSS因数据仓库而实现了突破
进入90年代后,信息技术界悄然掀起数据仓库和OLAP技术及数据采掘技术的研究和开发热潮,这为克服传统DDS存在的问题提供了技术上的支持,使DDS的发展跃上一个新的台阶,也为DDS开辟了一条新的途径。目前开发的综合DDS是以数据仓库(DataWarehouse)技术为基础,以联机分析处理(OLAP)和数据采掘(DataMining)工具为手段进行实施的一整套解决方案。
一般决策所需的数据总是与一些维数(每一维代表对数据的一个特定的观察视角,如地区、时间等)和不同级别(如部门、单位、地区和国家)的统计和计算有关。以多维数据为核心的多维数据分析是决策的主要内容,数据仓库的多维特征满足DDS对数据的分析要求,并且克服数据库的数据组织性差、利用率低的缺点。数据库不具有多维特征,但却是DW构建的基础。在数据库多年的应用中已经积累大量数据,而且目前数据库的数量和规模还在迅速增加和扩大,从而出现“数据丰富、知识贫乏”的问题。因此,从庞大的数据库中抽出有用的信息已是当务之急,要成功地进行信息抽取首先要建立数据仓库。
三.如何建立数据仓库
数据仓库的实现主要以关系数据库(RDB)技术为基础,因为关系数据库的数据存储和管理技术发展得较为成熟,其成本和复杂性较低,已开发成功的大型事务数据库多为关系数据库,但关系数据库系统并不能满足数据仓库的数据存储要求,需要通过使用一些技术,如动态分区、位图索引、优化查询等,使关系数据库管理系统在数据仓库应用环境中的性能得到大幅度的提高。
数据仓库在构建之初应明确其主题,主题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域,针对具体决策需求可细化为多个主题表,具体来说就是确定决策涉及的范围和所要解决的问题。但是主题的确定必须建立在现有联机事务处理(OLTP)系统基础上,否则按此主题设计的数据仓库存储结构将成为一个空壳,缺少可存储的数据。但一味注重OLTP数据信息,也将导致迷失数据提取方向,偏离主题。需要在OLTP数据和主题之间找到一个“平衡点”,根据主题的需要完整地收集数据,这样构建的数据仓库才能满足决策和分析的需要。
建立一个数据仓库需要经过以下几个处理过程:①数据仓库设计;②数据抽取;③数据管理。
(1)数据仓库设计
根据决策主题设计数据仓库结构,一般采用星型模型和雪花模型设计其数据模型,在设计过程中应保证数据仓库的规范化和体系各元素的必要联系。主要有以下3个步骤:
①定义该主题所需各数据源的详细情况,包括所在计算机平台、拥有者、数据结构、使用该数据源的处理过程、仓库更新计划等。
②定义数据抽取原则,以便从每个数据源中抽取所需数据;定义数据如何转换、装载到主题的哪个数据表中。
③将一个主题细化为多个业务主题,形成主题表,据此从数据仓库中选出多个数据子集,即数据集市(DataMart)。数据集市通常针对部门级的决策或某个特定业务需求,它开发周期短,费用低,能在较短时间内满足用户决策的需要。因此,在实际开发过程中可以选择在成功建立几个数据集市后再构建数据仓库这种策略。
这些数据定义直接输入系统中,作为元数据(metadata)存储,供数据管理模块和分析使用。元数据存储在元数据库中,它不仅是数据仓库的文档资料,供管理、维护人员使用,而且亦可供用户查询,使之更好地了解数据仓库结构,提高自己的使用水平。
(2)数据抽取模块
该模块是根据元数据库中的主题表定义、数据源定义、数据抽取规则定义对异地异构数据源(包括各平台的数据库、文本文件、HTML文件、知识库等)进行清理、转换,对数据进行重新组织和加工,装载到数据仓库的目标库中。在组织不同来源的数据过程中,先将数据转换成一种中间模式,再把它移至临时工作区。加工数据是保证目标数据库中数据的完整性、一致性。例如,有两个数据源存储与人员有关的信息,在定义数据组成的人员编码类型时,可能一个是字符型,一个是整型;在定义人员性别这一属性的类型时,一个可能是char(2),存储的数据值为“男”和“女”,而另一个属性类型为char(1),数据值为“F”和“M”。这两个数据源的值都是正确的,但对于目标数据来说,必须加工为一种统一的方法来表示该属性值,然后交由最终用户进行验证,这样才能保证数据的质量。在数据抽取过程中,必须在最终用户的密切配合下,才能实现数据的真正统一。早期数据抽取是依靠手工编程和程序生成器实现,现在则通过高效的工具来实现,如Ardent公司的Infomoter产品、SAS的数据仓库产品SAS/WA(WarehouseAdministrator)及各大数据仓库厂商推出的、完整的数据仓库解决方案。
(3)数据维护模块
该模块分为目标数据维护和元数据维护两方面。目标数据维护是根据元数据库所定义的更新频率、更新数据项等更新计划任务来刷新数据仓库,以反映数据源的变化,且对时间相关性进行处理。更新操作有两种情况,即在仓库的原有数据表中进行某些数据的更新和产生一个新的时间区间的数据,因为汇总数据与数据仓库中的许多信息元素有关系,必需完整地汇总,这样才能保证全体信息的一致性。
数据仓库规模一般都很大,从建立之初就要保证它的可管理性,一个企业可能建立几个数据仓库或数据集市,但他们可共用一个元数据库对其进行管理。首先从元数据库查询所需元数据,然后进行数据仓库更新作业,更新结束后,将更新情况记录于元数据库中。当数据源的运行环境、结构及目标数据的维护计划发生变化时,需要修改元数据。元数据是数据仓库的重要组成部分,元数据的质量决定整个数据仓库的质量。
四.数据仓库的DDS的支持
DDS对数据的使用是非结构化的,它的一次查询操作要涉及上百张表的上千行数据,复杂的表连接会严重影响系统的性能,而且用户仅仅在分析的时候才查找有关数据,查找条件是随机的,因此基于事务型数据库的DDS的数据分析能力很有限。目前,基于数据仓库的DDS的决策技术包括联机分析处理(OLAP)和数据挖掘(DataMining),在DDS环境中数据仓库直接为联机分析处理和数据挖掘提供数据能力。
1.联机分析处理(OLAP)
OLAP是针对特定问题的联机数据访问和数据分析而产生的一种技术,它满足DDS从多种角度对数据进行快速、一致、交互地分析,克服传统DDS交互能力差的弊病,使决策者能够对数据进行深入观察。OLAP服务器使用为用户预定义的多维数据视图对数据仓库的信息进行统计分析处理,为具有明确分析范围和分析要求的用户提供高性能的决策支持。OLAP将分析结果存储在信息库中,便于决策者通过对比多种分析结果作出更好的决策。此外,信息库中还存放决策准则、管理经验、常识。OLAP工具目前以多维分析/ROLAP为主,如InformixMetacube分析工具软件。
2.数据挖掘
数据挖掘是指从大量数据中发现潜在的、有价值的及未知的关系、模式和趋势,并以易被理解的方式表示出来。在DDS中通过进行数据挖掘用以发现数据之间的复杂联系以及这种联系对决策的影响。
在数据仓库基础上挖掘的知识通常以图表、可视化、类自然语言等形式表示出来,但所挖掘的知识并不都是有意义的,必须进行评价、筛选和验证,把有意义的知识放到知识库中,随着时间的推移将积累更多的知识。知识库根据挖掘的知识类型包括总结性知识、关联性知识、分类模型知识、聚类模型知识,这些知识通过相应挖掘算法得到。
五.基于数据仓库的DDS决策可以解决哪些类型的问题
DDS可以解决4个类型的问题:
(1)查询一组数据,可回答的问题如产品A的价格是多少?
(2)采用数理统计模型、运筹模型进行定量分析,预测趋势,可回答的问题如:某产品明年销售形势如何?
(3)采用OLAP方法,通过代数运算将有关信息抽取出来作为问题的答案,如:某月某公司的销售怎样?
(4)采用数据挖掘技术,通过对数据进行逻辑运算,找出它们之间内在联系,可回答的问题如:在某地影响某产品销售的因素是什么?
第1类和第2类问题在过去传统DDS中得到一定解决,现在的DDS重点解决第3类和第4类问题。这些问题的提出与回答通过可视化工具在问题综合与交互系统中实现,可视化工具提高人机接口开发质量和效率,使人机界面更加简洁、标准化。另外,可选用手写输入和声音输入工具软件,便于决策者提出问题。该系统根据对决策问题的判断,在知识库和信息库中查找解决方案,如查找到以直观易理解的形式呈现给决策者,如查找不到再根据问题的性质向下调用相应的决策工具。
决策支持系统:理性的信息化
随着全球经济一体化进程的加剧,信息技术的不断发展,企业面临着更为激烈的竞争。为了适应市场的各种发展,掌握信息,开拓业务,提高自身的竞争能力和地位,正确的决策和管理显得至关重要。
市场竞争的加剧对企业决策的制定有了更高的要求。决策支持系统作为一种新兴的信息技术,能为企业提供各种决策信息以及商业问题解决方案,从而减轻了管理者从事低层次信息处理和分析的负担,使得他们专注于最需要决策智慧和经验的工作,因此提高了决策的质量和效率。
发展 面临挑战
在过去的许多年,管理者制定决策是一门纯粹的艺术,是通过很长一段时间的经验所获得的。管理之所以被看成一门艺术,是因为许多个体风格被用于处理并成功地解决了同一类型的管理问题。这些风格源于创造力、判断力、直觉和经验,而不是建立在科学方法基础上的系统化的定量分析方法。
但是,今天管理所面临的外部环境正在发生迅速变化。商业及其本身的环境也比以往更加复杂,而且这种复杂性日益增加。这些都对现代企业的管理决策带来了新的挑战:
◆ 决策质量的要求更高
随着技术的迅速发展,客户获得产品和服务的渠道更为畅通,客户的选择余地更大。同时大规模生产使得产品出现了供过于求。客户成为最稀缺的资源。这迫使企业必须采“以客户为中心”的经营策略,努力提高产品和服务的质量。
◆ 决策时要考虑的因素更复杂
随着经济全球化趋势的加剧,尤其是中国加入WTO之后,无论是否愿意,企业都将面对全球的竞争者和全球范围的消费市场。而随着消费者权益意识的增强等,又使政府颁布了更详尽的法令和制度约束企业的经营行为。企业管理者在进行决策时需要考虑更多、更复杂的制约因素,
◆ 决策速度要求更快
通讯方式的发展、交通的便利以及金融体系的完善,使企业更难以长久维持自己的竞争优势。企业必须不断地创新,从以规模取胜转变到以速度取胜。这些都要求管理者能够迅速做出正确的决策。
◆ 决策失败的代价更高
企业中采购、生产、销售和服务等方面的联系日益紧密,企业的整个运作系统更加复杂和精密。某一环节的判断失误将产生链锁反应,造成企业重大的损失。
面对这些趋势和变化,管理者必须变得更加精明。他们需要新的工具和技术来帮助他们制定有效的决策。而传统的企业信息管理系统却不具备这样强大的分析功能。体现在:
◆ 分析工作量大
企业通常的运营系统只能提供面向交易的数据,因此,许多管理者要花费80%的时间进行数据分析,真正用于决策的时间只有20%。而且对于许多大型企业,还必须为之配备庞大的专业分析队伍。
◆ 分析结果滞后
由于分析时间过长,经理们经常无法及时拿到所需的报表,因此贻误了许多商业机会。
◆ 无法按照商业习惯进行分析
传统的报表只能进行简单的汇总。管理者有时为了分析一个关键的商业因素,不得不在一大堆打印的报表中前后翻阅,极不方便。
◆ 无法进行复杂的分析
管理者经常希望能综合多种因素来分析问题。如,石油价格的上涨、物价指数的波动对企业各方面的影响;如果现在采取降价措施,本年度末公司的市场分额、销售额和赢利是否有所增长?哪些客户对企业最关键,他们有什么特征,如何增加他们对企业的忠诚度等等。
◆ 无法提供关键问题的解决方案
例如,对于大型零售企业,为了实现最高效率,如何在一个区域内设立自己的连锁店?如何制定有效的预算计划和现金流计划?如何防止客户的流失?传统的信息技术无法提供针对这些关键性问题的解决方案。
◆ 缺乏量化的衡定指标
随着企业规模的扩大和机构的日益复杂,管理者不能只依赖经验和直觉来评价企业的整体表现,必须借助一些关键的、量化的指标。但通常的MIS系统无法做到这一点。
需求 日益广泛
对决策支持系统(Decision Support System, 以下简称DSS)一个经典的定义是:决策支持系统通过结合个人的智力资源和计算机的能力来改进决策的质量。它是一个基于计算机的支持系统,服务于处理半结构化问题的管理决策制定者。
处于以下状况的企业会对DSS产生迫切需求:
1.公司在不稳定的经济形式下运作。
2.公司所面临的国内和国外竞争的加剧。
3.公司在跟踪大量业务操作时面临的困难日益增加。
4.公司现存的计算机系统无法支持提高效率、收益率和进入可赢利市场等目标。
5.信息系统部门无法解决公司需求的多样性或者管理上特别的查询;现行的系统不具备商业分析功能。
企业采用DSS后可以感受到的收益有:更高的决策质量、沟通的改进、成本的削减、生产率的提高、节约时间以及客户和员工满意度的改善。这些可感受的收益与企业竞争的程度、行业特点、公司的规模以及DSS的用户友好性密切相关。
由于现代企业管理所面临的种种挑战,企业的管理者迫切需要一种计算机化的决策支持系统。虽然每个企业的状况和需求都不相同,但是共同的需求如下:
1.快速的计算:及时的决策在许多情况下非常关键,如股票交易、市场营销策略等。
2.克服人在处理和存储上的限制:人的智力受制于人处理和存储信息的能力。而且,人不可能无论何时,都能准确无误地回想起信息。
3.认知极限:当需要许多不同的知识和信息时,个人解决问题的能力将受限制。计算机系统能帮助人快速访问和处理大量存储的信息。计算机还有助于减轻工作组中的协调和沟通。
4.削减费用:计算机化的支持能削减小组的大小,并允许小组在异地相互交流,而且将提高支持人员的生产率(如财务或法律分析师)。提高的生产率就意味着更低的成本。
5.信息支持:通过计算机技术,管理者可以获得正确的、及时的和最新的信息来进行决策。
6.质量支持:计算机能提高决策的质量。例如,可以评价更多的备选方案,快速进行风险分析,以很低的代价迅速收集专家的意见。许多专业知识甚至可以直接由计算机系统导出。利用计算机,决策制定者可以执行复杂的模拟,检查各种可能的情况,快速经济地评定不同的影响。
7.有助于业务流程重组和员工授权:竞争不仅仅在于价格,还在于质量、及时性、产品的定制以及对客户的支持。决策支持技术,如专家系统,使得欠缺知识的人也能作出良好的决策。这样就可以进行有意义的授权。决策支持系统还可用于业务流程重组中,研究竞争者的活动、定制产品、优化生产流程等等。
市场营销决策支持系统概述
在现代市场经济条件下,企业面临的市场环境越来越复杂多变。在复杂多变的市场环境下,企业如何把握好航向,如何积极有效地开展市场营销工作,进行营销决策,这是一个需要认真研究和解决的问题。本文在分析市场营销系统及其特点的基础上,提出将DSS技术运用到市场营销决策上,开发MDSS(Marketing Decision Support System)的建议,并就MDSS的总体设计思想及研究方向作简要介绍,以明确系统的基本组成与结构。
一.何谓市场营销系统
市场营销以研究综合性市场营销活动及其规律为目标,它通过发现顾客的需求,并将其转化为对产品与服务的要求,再通过有效的促销、分销渠道和价格策略来最大限度地满足顾客需求。
市场营销作为由企业、顾客、相关的环境因素组成的系统,体现了企业和顾客在一定环境条件下的相互协调关系。
由于企业的市场营销所面临的环境是复杂多变的,因而市场营销决策系统是一种半结构化系统,这类系统的决策含有大量的不确定因素,缺乏程序化的工作范式。因此,在这种系统下企业如何有效地进行营销决策,如何更有效地开展营销活动,这一直是多年来市场营销决策理论研究的重点与难点。
二.市场营销系统有什么特点
从以上对市场营销系统的分析,我们可以看到市场营销系统因受到企业外部环境多方面的影响,具有极大的随机性和不确定性,因而也反映出市场营销系统有如下特点:
(1)“市场营销系统是一个动态的、有机地结合的系统。”市场营销系统运行过程中的诸多具体决策应该在企业总的营销战略指导下,有机地结合起来。各营销策略应在互相联系、互相配合、互相协调的基础上共同发挥作用。另外,企业的营销活动涉及到生产过程和销售过程。如果我们将两者割裂开来,往往会陷入生产观念、产品观念或推销观念的误区,生产的产品难于被市场所接受,造成产品的适销性问题,进而影响到企业的利润。因此,必须把企业在生产过程中的活动和销售过程中的活动作为一个系统,为满足已选定的目标市场顾客的需求而互相配合、协调一致。
(2)市场营销系统是一个灵敏的反应系统。市场营销系统涉及的因素很多,其中既有企业内部因素又有企业外部因素,而这些因素无一例外都在发展变化着。因此企业的营销策略及其组合应能随着企业内外环境的变化而适时作出相应调整。如果企业的营销策略的调整落后于环境的变化,必将带来企业营销工作的失败。
(3)市场营销系统运作的好坏对企业的发展影响很大。企业的经营目标决定了其发展方向,而营销系统所要实现的目标是达到企业经营目标的最主要的保证。市场营销系统目标包括销量、市场份额、销售收入、盈利等目标。这诸多的目标影响着企业人员和资金需求,研究开发以及日常运作的资金投入。因此,营销在企业的整个运作中有着举足轻重的地位,一个好的市场营销系统总体决策可以极大地提高企业赢利水平,保证企业发展目标的实现。
(4)面向市场营销系统的工作及决策具有极大的灵活性及突发性。由于市场竞争的加剧,市场环境的变化,常常会出现一些意想不到的市场营销问题,需要企业进行解决。由于这些问题往往含有大量的不确定因素,因而这些问题的解决必须在全面系统的分析基础上,采取灵活的对策加以解决。
三.打造市场营销决策支持系统
决策支持系统(DecisionSupportSystems---DSS)是70年代末期兴起的一种新的管理系统。它是计算机技术、人工智能技术与管理决策技术相结合的一种决策技术,它涉及到计算机软件和硬件、信息论、人工智能、信息经济学、管理科学、行为科学等学科,旨在支持半结构化决策问题的决策工作,帮助决策者提高决策能力与水平,最终实现提高决策的质量和效果的目的。
DSS技术应用于市场营销决策的研究始于90年代初,在市场营销决策中的应用目前仅限于市场分析方面。因此,建立系统的市场营销决策支持系统仍是目前需深入研究的问题。
1.市场营销管理过程分析
市场营销管理过程中各阶级的主要功能如下:
(1)分析市场机会。主要进行企业宏微观环境分析,从而找出与企业能力相适应的环境机会即企业机会,以及企业可能面临的威胁。
(2)研究与选择目标市场。针对存在的企业机会,根据顾客需求的差异性,划分并确定细分市场,进而选定适合于企业的目标市场并进行产品定位。
(3)制定市场营销战略。这里包括企业发展战略、企业业务发展规划及企业营销资源配置等。
(4)制定市场营销战略。这里主要进行的是营销四要素,产品(Product)、价格(Price)、销售渠道(Place)、促销(Promotion)的组合及具体实施方案。
(5)营销工作的组织、执行与控制。针对已制定的市场营销战略与策略,进行具体的组织、实施,并对营销计划的执行过程进行控制,以保证计划的有效实施。
2.市场营销决策支持系统的建立
广义地讲,人们的决策行动包括确定目标、设计方案、评价方案和实施方案四个阶段。
在确定目标阶段,主要是探查决策环境,进行数据和信息的搜集、加工、分析,确定影响决策的因素或条件。因此,在确定目标阶段实际上包含了问题识别和问题诊断两个内容。在设计方案阶段要理解问题,建立模型,进行模拟,并获得结论,提供各种可供选择的方案。评价方案阶段要根据确定的决策准则,从可行方案中选择出最优或满意的方案。实施阶段中将所选择的方案予以执行,对实施结果进行监测,并根据反馈信息对方案进行修正和调整。实际的决策过程并非如此简单,各阶段可能是相互重叠、交叉甚至跳跃进行的,最终形成的决策是各个阶段多次循环往复的结果。
采用快速原型法来开发市场营销决策支持系统,然后再周期性地改进、扩展、修改系统,这是常用而有效地方法。
对于MDSS(MarketingDecisionSupportSystem)总体结构形式基本采用层次型DSS。
针对市场营销实践活动,以下我们着重谈一下在MDSS系统结构中三库即数据库、模型库、知识库的具体实现及管理。
(1)数据库
DSS中的数据是和决策过程密切相关的,一切数据都要经过恰当的加工、浓缩。我们强调在MDSS中一定要面向模型,面向模型的生成与决策来设计数据库。在MDSS中,由于MDSS一般面向高层决策,所以决策过程除了需要企业内部数据外,还要应用到大量的外部数据,如市场需求量、市场价格、竞争情况等等。针对这种情况,我们采取了集成数据库即总数据库的方案,然后再利用数据库提取技术进行提取。当今市场环境已由卖方市场转为买方市场,市场需求多样化与多变性决定了营销工作必须具有即时性与动态性。为此,我们将数据库细分为静态数据库与动态数据库。象企业生产能力、企业资本、营销人员数量等一般较少发生变化的数据则放入静态数据库,而如市场价格、库存、市场环境等一类经常发生变化的数据则入放动态数据库。这样一来就可以大大的提高数据库的利用效率与效能,很好地适应外部环境的变化。同时,在MDSS数据库的设计中应注重企业内部的实际信息流,注意实践中数据传递的路径和方法。
(2)模型库
针对营销工作的特点,我们在模型使用上不仅要注重定量模型,而且还要注重定型模型。根据营销工作决策类型,我们基本上将模型分为预测类、投入产出类、优化类、决策类与不确定类等几大类模型。由于在MDSS使用中,每一个模型的生成与应用都需要大量的数据信息进行驱动,因此在MDSS中一定要强调模型管理与数据管理的结合,强调每一个模型都要从数据库提取输入数据及参数值,同时又将模型运行结果送回数据库。当数据发生足够的变化而要求模型变化时,模型也应能被修改。
(3)知识库
由于营销环境的多变性与营销工作的非结构性,在MDSS中必须大力加强知识库的运用。在MDSS中,知识库主要用来存放各种规划、因果关系、各类营销专家的经验与成功企业的营销经验。此外,在MDSS中还应有综合利用知识库、数据库和定量计算结果进行推理和问题求解的推理机,这方面主要涉及到专家系统在MDSS中的应用。
结合营销管理决策过程,在MDSS开发过程中基本采用模块化方式,即先按营销决策支持系统的子系统开发出各专用DSS,再在此基础上进行扩充,扩展到整个MDSS。这种模拟现实市场营销管理决策过程来建立MDSS,其优点是整个系统易于理解与实现,同时各子系统、子功能的划分也基本符合企业内的组织结构型态。我们给出MDSS的子系统及各自功能模块如下:
A 企业市场营销现状及机会分析
a 宏微观环境扫描与评价
b 市场机会分析
c 企业经营现状分析
d 存在问题分析
e 企业机会分析
B 研究与选择目标市场
a 市场细分
b 目标市场选定及市场覆盖战略
c 产品定位
C 市场营销战略与策略制定
a 制定营销计划
b 资源配置方案
c 产品决策
d 价格决策
e 销售渠道决策
f 促销决策
D 营销工作的组织、执行与控制
a 营销费用预算及控制
b 计划执行与控制
c 盈利率控制
d 正负反馈
其中子系统C中4P组合是营销工作的重点,其中的每一个都是一庞大的系统。我们之所以将它们放在市场营销战略策略制定子系统下而不让其自成体系,这是为了突出4P组合与营销战略相关的一个动态、有机、多层的组合。
市场营销是一个系统的、综合性的活动,强调营销因素即各子功能的相互配合和综合运用。而在这种模块化、分层系统中,各模块仅在市场营销整体功能的某一侧面为决策者提供支持,这样就易于造成各模块各自为政,实际上把最困难的综合决策问题留给了决策者。因此在子模块设计与模块集成过程中,必须注意模块间的协调与接口技术的应用。
四.驾驭市场营销决策支持系统
综合考虑市场营销与决策支持系统的特点,我们给出MDSS应具备的一些基本特征如下:
(1)为增强MDSS的实用性,完成预定的工作任务。MDSS应具备提供除给决策方案以外的支持功能,如信息服务、科学计算、决策咨询,即能支持企业各层决策。
(2)由于市场营销工作环境的多变性,市场营销决策经常面对突发性决策,因而MDSS应能支持这类决策,提供意向决策支持功能。而这十分强调人工智能知识库的运用。
(3)MDSS应能提供友好统一的人机交互界面,强调在决策过程中各阶段中决策者的介入,为决策者提供控制的权力,实现真正的人机交互系统。
(4)在目前已开发的DSS中,许多系统都过分注重于定量模型,而且这样一些定量的模型往往复杂而不适用。在MDSS中应能突出模型的适用性与定性模型的使用。
(5)由于市场营销决策中存在着大量的非例行决策,因而有条件的企业可采用决策支持中心的形式来提高决策的质量。
市场营销决策支持系统的开发是一项庞大的工程,涉及到多学科的综合交叉运用。在目前我国市场营销学蓬勃发展,营销应用日益普遍的情况下,提出MDSS的研究开发,有利于增强我国企业的营销意识,促进市场营销理论与决策方法研究的发展,提高营销决策的水平与效益。
实时挖掘企业信息数据
一.引言
近些年来,许多企业需要对信息系统数据进行深加工,以获得在何种经营、决策情况下的有效的结果和过程发展的趋势,以便于企业对现行发展进行决策。所以,以信息系统为基础的决策支持系统(DSS:DecisionSupportSystem)也正在从“不成熟期”向“成熟期”迈进。
在信息系统中有一概念就是数据的挖掘,从数据挖掘的概念上来讲,主要是历史的、有一段时间的、较为完整的数据进行分析、整理,得出企业的发展的规律以及在一定的历史条件下,采取什么样的措施得到其相应的结果,但是这样的概念似乎和信息的实时性相违背。这样的想法,未免不让想到是否应该有“实时数据挖掘系统”。
对企业信息系统中数据的挖掘,我们自然联想到数据仓库。数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。数据仓库在应用上符合DSS的需要,同时数据仓库也是DSS处理的基础。那么我们的实时挖掘信息系统的数据是否是从数据仓库中采集数据的呢?
既然是“仓库”必然和实时性相违背,信息数据需要深加工,现在唯一的解决方式方法就是进行数据仓库化处理,建立数据仓库的环境,进行数据快照,对数据进行抽取、集成和包装。实时信息系统是动态的系统,数据库也是动态数据存取,访问量大,变化快的东西不易做分析。我们挖掘企业信息系统什么信息,如何挖掘这些信息?
实时挖掘信息数据也是针对数据仓库的,仅仅在概念上数据仓库所囊括的数据性质有些变化,我们还是先从数据仓库入手,了解挖掘的原理再来分析挖掘实时信息数据。
二.非实时性数据仓库
在数据仓库中只有单一集成的数据资源,并且因为数据是可访问的,所以与传统数据环境相比,在数据仓库环境中DSS分析员的工作将要容易得多。
建造数据仓库有两个主要方面-与操作型系统接口的设计和数据仓库本身的设计。在某种程度上来说,“设计”并不能精确描述在启发式方式下建造数据仓库时发生了什么。首先,载入一部分数据,供DSS分析员使用和查看。然后,根据最终用户的反馈,在数据仓库中修改、增添一些数据。
这种反馈循环贯穿于整个数据仓库的开发过程。在设计数据仓库时,不能采用设计传统“需求驱动(CaseDrive)”系统同样的方法。在另一方面,那种认为不预测需求是好思路的想法也是错误的。在实际中,通常是介于两者之间的。
数据仓库的设计是面向主题域的,这个主题域的概念在性质上和对象一致,但是主题域是一个范围的概念,而对象是一个事物。目前面向对象的设计较为常见,似乎面向主题域的设计很难理解,从我个人观点来看,恰恰相反,面向主题域的设计很简单,但是若考虑主题域的数据“冒泡”,那么困难就来了。
作为非实时性数据仓库,就是现在人们常说的数据仓库(实时性数据仓库为性质上的区分),前人描述的已经太多了,在这里我描述的非实时性数据仓库的数据“冒泡”,什么是数据仓库的数据“冒泡”?数据冒泡就是多系统数据的整合时,比如中国电信的数据和中国联通的数据整合在一起来分析时,我们必然重新建立一套数据结构,那么从中国电信系统的数据如何导出到新建系统中?中国联通呢?
在数据仓库技术中,目前描述最多的是在同一数据库体系内数据整合,那么不同系统间同一类数据又如何整合?
当然,系统是根据用户的需求来完成的,是否有这样的一个机构有义务将该行业的不同系统内数据收集起来进行分析?我们在分析的时候,是否是将数据经过人工加工而得出分析数据,那么这样的数据有什么意义,那么下一次同样的数据如何来分析,还需要一次手工操作,这样不同系统的数据如何采用“冒泡”的形式,将数据冒到新建的分析系统中去。
设计含有主题域的数据仓库系统是简单的,如何设计不同主题域数据并进行冒泡是否为以后数据仓库系统的发展的一个方向?
企业实施ERP等系统之后,大量的信息被采集到了,这些看上去非常有用处的信息如何被处理?数据必须被深加工,得出企业用于决策的信息,这些信息一般都是在企业执行一项操作后,根据数据查看一下收益结果,并把这个结果作为下一次决策时的数据参考,当然社会在短期内对个别企业的反应在大体上是一致的,这样,企业根据这样的数据就可以进行短期的较为精确的预测。
三.实时性数据仓库
作为目前实施的ERP系统是集成模块的,我原先实施系统时曾称之为“BeanSoftware”(积木软件),这类软件采用原始的数据库结构,如果采用实时的数据仓库,则不适应系统,为此在我们也谈谈什么样系统对数据实时性分析存在意义,而什么样的系统对实时性数据分析没有什么意义。
我在AMT上也曾写了一篇关于电力行业ERP的文章,电力行业是一个特殊的行业,数据是实时采集到的,时时刻刻都在变化,目前的电力生产型系统已经达到在秒级保留系统各个环节的数据,数据量是庞大的,为此,针对这样庞大数据,电力进行有效的利用进行数据分析,比如说潮流计算、无功优化、负荷预测等,这些整合实时数据的应用给实时系统带来决策意义。
在电力行业这些数据从何处而来:电网调度系统,在电力行业称为SCADA系统。在这些生产型的系统中产生的大量的数据是分析电网稳定运行的确实的依据,也是当电网出现故障以后,这些采集到的数据经过数据重演的等手段,推断当初数据变动过程,以便在以后的操作中避免出现这样的结果。
在电力行业中,实时地采集并处理这些数据并在短时间内处理数据并给出电网运行情况是目前电力行业对电网调度系统一个要求,当然这个要求就是建立在电网监控系统数据分析之上的应用。这种分析目前还不能完全称为数据仓库的数据挖掘。
数据仓库在概念上是一个静态的概念,但是我们从实际操作的库存上来看,库存的商品可以进行进出,而这些进出的是符号实际原则的,那么可否设想一下,数据的仓库也为动态的,这里所有的多层数据加工并得出的数据目前和实时数据一并参与实时系统分析,那么就是将现有的数据仓库技术和实时数据分析技术集合起来,为快速的企业对数据分析的结果的需求作一次简单的满足。
我在这里提出系统间的结合,可能在很大程度上目前无法满足这个计算或处理的速度,但我认为今期数据和数据仓库中沉积数据一并参与实时分析,才能给出短计划、中长的合理计划,因为历史的规则和目前的趋势,都是影响决策的重要指标。
这样的例子不仅适合电力行业,还是金融分析(期货、债券)、证券投资、气象预测、生物养殖等等行业都有广泛的应用前景。
决策支持系统建立中的关键问题
决策支持系统的应用
决策支持系统(DDS)的概念提出20多年来,随着决策理论、信息技术、数据库技术、办公自动化、专家系统等相关技术的发展,DDS取得了长足的进展,在许多领域得到应用。DDS已成为许多行业经营管理中一个不可缺少的现代化支持工具。
本期专题介绍了银行、房地产、 企业等应用DDS的情况,包括如下文章:
1.决策支持系统建立中的关键问题--兼论云南玉溪卷烟厂信息管理与决策支持系统
本文以建立云南玉溪卷烟厂信息管理与决策支持系统为例,介绍了决策支持系统建立中的关键问题,包括决策支持与数据管理系统,模型、方法和知识管理系统及用户交互环境。
2.银行智能决策支持系统
面对激烈竞争和瞬息万变的金融市场,传统的银行决策方法已不能适应现代化银行发展的需要。本文探讨如何将计算机决策支持技术应用到银行高层决策,建立银行智能决策支 持系统。
3.地震预报智能决策支持系统的研制与应用
地震是众多自然灾害中对人类生存造成危害最为严重的一种灾害。为了科学、准确预报地震,减轻地震的影响,建立地震预报智能决策支持系统具有非常重要的价值。
4.智能房地产决策支持系统EID
柔性综合集成能够使系统按照当前运行状况,动态配置所需的计算机部件,以解决传统 专家系统表示和推理单一、难以融合异质计算部件等缺点。本文介绍在构建智能房地产决策支持系统中,采用基于任务归约和子任务联想的知识汤建模方法,对柔性综合集成作了初步的 尝试。
5.低成本CIMS成本管理决策支持系统
本文以特钢企业为背景,阐述了建立网络环境下低成本CIMS成本管理决策支持系统的基本思想,并提出CIMS环境下管理与决策的模型库、数据库、方法库和知识库的分析与设计,进而达到控制钢铁企业成本的目的。
决策支持系统是以日常业务处理系统的数据为基础,利用数学的或智能的方法,对业务数据进行综合、分析,预测未来业务的变化趋势,在企业发展、市场经营战略等重大问题上为领导层提供决策帮助的计算机系统。近年来企业(包括商业)部门业务处理以及信息管理系统的广泛使用,既为决策支持系统的建立提供了基础,也为它的应用产生了强大的推动力。
与此同时,计算机在理论与技术上的新进展也使决策支持系统的研究与应用水平不断提高,使它从早期的批处理方式演变成今天的联机分析处理方式,也带动了数据仓库、多维数据 库、数据挖掘等新技术的研究。
决策支持系统大体上由以下三个部分组成:
·对决策用的数据进行管理的决策数据管理子系统。
·决策知识、模型管理子系统。
·与用户进行对话、接收命令,提供决策结果的交互环境。
在建立决策支持系统中,以下几个问题显得尤为关键:
一、决策支持与数据管理系统
数据管理系统必须为决策支持的分析处理提供以下服务:
(1)根据主题需要,从OLTP数据库中抽取分析用的数据。为此在抽取过程中要对原始数据进行分类、求和、统计等处理,抽取的过程实际上是数据的再组织。
(2)在抽取过程中,完成数据净化,即去掉不合格的原始数据,必要时还必须对缺损的数据加以补充。
(3)在改变分析、决策的主题时,可以按主题进行数据查询与访问。
(4)采用脱机大容量存储、联机磁盘存储、内存存储的多级存储模式,解决数据量巨大及按照主题、粒度划分的数据组织问题。
今天,人们常把满足上述功能需求的数据管理系统称为数据仓库系统。数据抽取与净化、存储组织等,都是建立数据仓库的关键技术。除此之外,在设计数据仓库时,还应特别重 视数据的粒度与划分问题。
与传统数据库设计类似,好的数据仓库设计也采用概念模型、逻辑模型与物理模型的方法。所不同的是,数据仓库的数据模型是紧紧围绕前面所述的决策分析用的主题等范围进行的。
数据仓库系统可以在关键数据库的基础上建立。采用这一方法,开发人员把关系数据库当作一种存储结构,自己设计、实现数据仓库必备的功能。当然也可以利用关系数据库软 件厂家提供的某些工具。目前这类工具还比较缺乏。
实现决策用的数据管理系统的另一种途径是采用多维数据库。多维数据库中的维是指在进行分析预测时可以变化的角度。例如,一个企业在全国各地的产品销售,可以按时间逐年统计,也可以按地区或者产品分类统计,这里的时间、地区、产品就是不同的维。多维数据库为面向主题的分析决策提供了更大的灵活性。它支持对按总体统计的详略级别组织的数据进行特殊查询,从宏观的结果逐步向下跟踪产生这些结果的微观数据,或者反过来由底层微观数 据逐步向上得到高层的宏观结果。
对于较为简单的分析、决策应用而言,决策数据管理系统可以采用多维电子表格实现 。
这是在普通二维电子表格上的扩充,通过增加维数,可以满足面向主题的分析、决策的需求。
二、模型、方法和知识管理系统
采用数据仓库和多维数据库技术的数据管理子系统将数据进行整理(预处理)和净化之后,形成可靠的易于进行决策的“数据源”(即数据仓库或多维数据库),这个“数据源”的结构与 形式和决策支持系统所采用的模型与知识有关。决策粗略地分为结构化决策支持、非结构化 决策支持、半结构化决策支持。一个较好的决策支持系统必须完成这三方面的决策支持。
1.模型、方法和知识管理系统
在决策支持系统中,模型、方法和知识的管理是核心,它对依问题建立的模型库、方法 库和知识库进行管理。
模型、方法和知识管理系统的主要任务是:
(1)对模型库、方法库和知识库进行维护。模型、方法和知识管理系统必须有对三库的维护界面;可根据问题的需要对模型、方法和知识库进行增加、删除和修改,并保证三库的一致性;一是系统运行过程调用每个库时不发生矛盾,特别是对知识库的维护更为复杂;二是每种模型、方法和知识都能调用到。
(2)模型、方法和知识管理系统根据用户的要求和数据仓库提供的数据,能有效地 选择模型、方法和知识,经系统运行得到相应的结果,并将结果送给交互环境进行输出。
2.智能决策支持系统
智能决策支持系统一般是在模型、方法和知识管理系统的基础上增加专家系统和数据采掘与知识发现技术。目前虽然一般的决策支持系统得到了广泛使用,但随着数据量的增大,不确定因素的增多,专家系统技术和各种推理技术对提高决策支持的准确度十分必要,在人也无法描述出数据间的关系时,就提出数据采掘与知识发现技术。近年来数据采掘与知识发 现技术发展很快,已达到初步应用的程度。智能决策支持系统将会迅速发展。
分页
三、用户交互环境
用户交互环境是决策者或决策部门与决策支持系统打交道的界面,它负责接收用户发出的各种命令,根据这些命令调用不同的子系统,并获得处理结果,最后再将这些结果输出给用户。
用户输入的命令包括:对确定的主题进行分析、对比、预测等决策处理;对决策用的数据进行各种查询;其它特殊命令,如控制输出形式,要求对输出的结论进行解释等。
从内容上讲决策的输出主要是围绕决策主题产生的各种分析、综合与预测的结果。以市场分析、预测的主题为例,其内部就可以包括行情变化趋势,各种商品销售按时间、地区对比、排序,厂家竞争策略,未来销售预测等。
交互环境的好坏直接影响着用户对系统的使用。一个好的交互环境,其输入应当简单、易学、易用。其输出应当做到内容丰富、形式活泼。
在输入方法上可以采用先进的手写输入和语音输入,以及广为使用的多窗口图形化界面技术。
在输出形式上可以包括文字报告、图表、可视化图形、语音合成,这些方式相互配合,相得益彰,可以取得令人满意的效果。
良好的决策支持系统的交互环境很难直接从市场上购买到,常常要靠自己开发。我们以为云南玉溪卷烟厂开发的“信息管理与决策支持系统”(简称“玉烟系统”)为例来讨论交互环 境中的结果输出部分的关键技术。
“玉烟系统”的基本输出形式是具有标题、段落的文字报告。其内容较为丰富,包括市 场分析、预测等若干主题。当输出时,以实时生成的女声自然语音输出为主,同时配合以下手 段对输出内容进行补充:
·二维表格显示朗读的数据。
·三维直方图、饼图显示分析、对比结果。
·可以按省、地区变化颜色,在地区上显示立体柱图的三维中国地图。这种显示主要 用于描述全国市场的竞争态势。
·报告中所提到的某些对象的三维立体造型的动态显示。
输出过程可以随时暂停或继续。当暂停时,还可要求解释报告内容。以上述方式向用户输出分析、决策结果必须解决以下几个关键问题:
(1)首先要为用户提供一种手段来定义报告输出的结构、内容、多媒体输出的要求 。为此我们设计并定义了一种特殊的脚本语言。通过这一脚本语言,用户可以方便地表达他们希望输出的内容、文字报告的格式,以及前面提到的输出格式。
(2)在输出时要做到说的与显示的都反映同一个主题,即各种输出应当在内容上一 致,因此必须很好地控制多媒体输出的同步。在系统实现时,我们以语音输出为主,计算输出字符、分句同步等方法使这一问题得到解决。
(3)汉语的文语转换、语音合成、三维复杂实体造型的实时动态显示等技术。这些方面既有输出质量、也有输出速度的要求。
四、一个用于市场分析与预测的决策支持系统
我们以“玉烟系统”为例来说明一个具体系统的构成。
1.系统描述
“玉烟系统”从功能上分为以下五部分:
(1)数据规范化处理(DSP) 由于决策的需要,企业要尽可能地收集各种市场信息和 生产数据,因此也就存在原始数据来源多、结构混乱的问题。DSP的目标旨在对原始数据 进行一定的预处理,从而得到结构简单、格式规范、统一的规范化数据,供专家系统、分析、 预测和报告生成使用。同时也使系统数据具有独立性,系统工作从规范化数据开始。其实这 部分就是数据仓库的建立,规范化的数据放在数据库中就是数据仓库。
(2)专家系统(ES)通过长期的工作实践,有经验的企业管理人员和市场营销人员必然会对市场的变化和发展形成一套较为完整的看法,将这些知识总结成规则的形式,即可通过专家系统加以运用。ES的功能是运用已定义的经验性规则,基于实际的数据情况进行推理,以发现一些值得注意的问题。
根据随机性市场分析的特点,推理机制采用确定性的正、逆向混合推理方法。市场上可能会出现的突发事件类型由用户在建造知识规则库时用规则事先定义好。在推理过程中, 系统在这类规则的引导下,通过对规则集的匹配和数据查找,验证各类突发事件是否发生,这是一个逆向过程。当发生了某个突发事件时,则对其产生的背景和相关条件进行跟踪,找出该突发事件发生的原因和背景,这是一个正向的过程。
专家系统具有解释功能。系统提供了两种类型的解释: 一种是服务于系统维护人员的 ,它可以提供得出某项结论的推理路径、所用规则及内容,以及推理依据等内容。系统维护人员可以据此对知识规则库的正确性进行维护。这种解释是通常专家系统意义下的解释,只要在推理过程中记录推理路线和所用到的数据即可。
另一类解释是服务于生产决策人员的,他们关心的是某项突发事件产生的原因和背景 。
由于篇幅的限制,分析报告中不能包括所有突发事件的全部信息,当决策人员想知道某个突发事件的更详细的情况时,可以通过解释功能得到。由于该类信息量较大,在正常推理情况下并不保留这些信息,只有当用户要求对某项内容提供更详细情况时,系统才重新启动推理机,将有关更详细的情况报告给用户。
(3)市场分析模型和知识管理系统(MAS)有限的经验性知识无法覆盖可能出现的全部情况,因此,还需要从实际数据中发掘出知识中没有提到但有可能对企业行为产生影响的信息。在这种情况下,除了采用经验性知识进行分析推理之外,基于数学方法的统计分析是必不可少的。MAS包括运用几种常用的统计分析方法(因果分析、趋势分析等)以及一些经验性公式,在已有数据的基础上进行一定的数学运算,以得出一些决策者可能会关心的分析结果。
我们认为一个完整的市场分析框架应包含以下四个方面的内容:
·建立信息综合处理的数学模型,可以对一个市场对象各方面的属性进行整体性处理,得出其对市场的影响程度。
·提供一种定性与定量相结合的信息加工手段,可以从经济学的角度对自变量的数值及其变化情况作出定性解释。
·根据变量间的依赖关系,对有定性因果关系的变量的变化情况作出合理的推断。
·根据市场数据的变化,寻找影响变量的有关因素。
仅仅使用数学方法或类似专家系统的知识方法都是不充分的。需要用数学模型对市场对象进行合理的描述,并通过数学手段解决变量间的数值依赖。由于不仅仅关心变量数值的大小,更重要的是揭示其经济意义,所以在市场分析的实现中需要可控制的推理系统,不仅能处理显式的规则,而且可以进行基于定性因果关系的推理过程。
在整个框架的研究中,我们着重于定性定量相结合的推理机制,以有效的综合使用数学方法与知识方法。
(4)市场预测模型及知识管理系统(MFS), MFS的功能是在现有数据的基础上,对未来(主要是短期内)的基本经济情况、市场销售情况等作出预测,以便决策者在考虑下一步行动时借鉴。由于市场的多样性和复杂性,单纯使用数学上的预测方法难以收到满意的效果,因此,在本系统中我们引入了一种数学方法与经验知识相结合的综合性组合预测方法。
为了收到较好的预测效果,根据预测对象的不同,我们提出几种不同的预测方案,在各种方案中,充分衡量预测对象变化的条件以及可能变化的幅度,并采取相应的处理方法。本系统将预测对象分为两类:一类是对各地区的常规的经济状况(人口、人均收入、人均消费水平等)进行预测,一类是对某一产品的社会容量(需求量)进行专项预测。常规的经济状况的预测分别采用时间序列分析方法、因果回归分析法或者两者相结合的方法,而对某一产品社会容 量的预测则采用数学方法与知识方法相结合的组合预测方法。知识方法中,我们采用了分类和匹配方法。
(5)报告生成系统(RGS),RGS的功能是根据原始数据以及专家系统、分析和预测所得到的结果,生成市场分析和预测的文字报告,必要时配以辅助信息。在本系统中我们采用的是一种基于模板的文字报告生成方法。
2.系统流程及其框图
在运行本系统之前,一定的数据准备工作是必要的,所有需要用到的原始数据都应按照DSP所能处理的格式存放在数据库中。之后,即可通过一定的参数(如时间等)调用本系统。
系统的工作步骤如下所示:
(1)调用DSP,对原始数据进行规范化处理,得到规范数据;
(2)调用ES,在规范数据的基础上运行专家系统,得到规则结果;
(3)调用MAS,在规范数据的基础上进行分析,得到分析结果;
(4)调用MFS,在规范数据的基础上进行预测,得到预测结果;
(5)调用RGS,在上述结果的基础上生成相应的文字报告(以及必要的辅助信息)。
五、结束语
Internet特别是Intranet的出现,对决策支持系统的研究与开发提出了许多极富挑战性的问题。大型企业都把自己的生存与发展与网络联在一起,而越是这样的企业,越是需要决策支持系统。当一个企业是建立在Intraneet上时,就分析与决策而言,至少在以下两点上会发生很大变化:
(1)分析、决策用的数据不再集中于某一场地,而是分散到网络上的不同地区、部门。
(2)运行在Intranet环境里的分析、决策模型及知识处理方法会从一台机器上的集中式处理,变成在网络环境下的分布、或分布再加上并行的处理方式。 这些变化为我们研究分布式数据仓库、分布式决策处理提供了机遇。
初识商业智能
商务智能是20世纪90年代末首先在国外企业界出现的一个术语,其代表为提高企业运营性能而采用的一系列方法、技术和软件。它把先进的信息技术应用到整个企业,不仅为企业提供信息获取能力,而且通过对信息的开发,将其转变为企业的竞争优势,也有人称之为混沌世界中的智能。因此,越来越多的企业提出他们对BI的需求,把BI作为一种帮助企业达到经营目标的一种有效手段。
根据硅谷动力网在2001年底对103家企业的CIO所做的调查,在未来两年里,CIO们最优先考虑实施的信息化项目,排在首位的是商业智能(37.2%),位列信息存储和灾难恢复系统(33.5%)、客户关系管理(29.8%)和网络安全系统(28.7%)之前。既然商业智能被如此重视,究竟什么是商业智能呢?
什么是商业智能
商业智能(Business Intelligence,简称BI)的概念最早是Gartner Group于1996年提出来的。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。当时,Gartner Group预测说:到2000年,信息民主(注:指组织内信息共享的无差别性)将在具有前瞻性思维的企业中浮现。借助商业智能,员工、咨询员、客户、供应商以及公众能够有效地运用信息。其实,商业智能所涉及的技术与应用,在Gartner Group命名之前就有,起初被称为经理信息系统(EIS),在羽化成商业智能之前叫决策支持系统(DSS)。
目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商资料来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是数据仓库、OLAP和数据挖掘等技术的综合运用。
为此,把商业智能看成是一种解决方案应该比较恰当。BI的关键是从许多来自不同的企业运作系统的数据中,提取出有用的数据,进行清理以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。商业智能的这个基本过程如图所示。
因此,BI是涉及一个很宽领域的,集收集、合并、分析和提供信息存取功能为一身的解决方案,包括ETL软件、数据仓库、数据集市、数据查询和报告、多维/联机数据分析、数据挖掘和可视化工具。
商业智能的典型应用
经营分析
经营分析包括经营指标分析、经营业绩分析和财务分析三部分。
经营指标分析是指对企业不同的业务流程和业务环节的指标,如:利润率、应收率、销售率、库存量、单品销售情况及所占营业比例、风险采购和库存评价指标等进行搜集和分析。但这些指标只能反映局部的经营状况。为了解企业的整体经营状况,还需对这些指标进行科学的组织和分析,利用智能管理技术,形成一个能反映企业整体情况的数学模型。这样通过观察总指标并设置告警,才能获得整个企业的经营状况。
经营业绩分析是指对各部门的营业额、销售量等进行统计,在此基础上,进行同期比较分析、应收分析、盈亏分析、各种商品的风险度分析等等。经营业绩分析有利于企业实时掌握自身的发展和经营情况,有利于企业及时调整经营业务、化解经营风险。
财务分析是指对企业财务数据中的利润、费用支出、资金占用及其他具体经济指标进行有效分析。通过财务分析,可以及时掌握企业在资金使用方面的实际情况,为及时调整和降低企业成本提供数据依据。
战略决策支持
在经营分析的基础上,将各类数据、信息进行高度的概括和总结,然后形成供高级决策者进行战略决策时参考的企业经营状况分析报告,是商业智能的优势所在。
商业智能对战略决策的支持,分别表现在对公司战略、业务战略和职能战略的支持上。在公司战略决策支持层面上,可以根据公司各战略业务单元的经营业绩和经营定位,选择一种合理的投资组合战略;在业务战略决策支持层面上,由于商业智能系统中集成了更多的外部数据,如外部环境和行业信息,各战略业务单元可据此分别制定自身的竞争战略;在职能战略决策支持层面上,由于来自于企业内部的各种信息,源源不断地输入进来,相应地可以提供营销、生产、财务、人力资源等决策支持。
绩效管理
商业智能技术能够从企业各种应用系统中提取出各种基础绩效指标与关键绩效指标(KPI, Key Performance Indicator)。为了考核员工的绩效,企业可以先将希望员工要做的工作进行量化,然后借助商业智能工具,管理人员可以追踪、衡量和评价员工的工作绩效,引导员工的思想方向和行动与企业的整体目标保持一致。
与各种企业信息化系统的关系
商业智能作为一种企业信息集成解决方案,为企业不同的应用系统,如企业资源规划(ERP)、客户关系管理(CRM)、供应链管理(SCM)、办公自动化(OA)、电子商务(E-Commerce)以及外部环境扫描(Environmental Scanning)等系统之间架起了互通的桥梁。同时,这些信息化系统也为商业智能提供了数据源,离开了它们,商业智能就会成为无源之水,无本之木。但商业智能的价值又在这些系统之上,因为它可以发现数据背后隐藏的商机或威胁,获得洞察力,了解企业和市场的现状,把握趋势,识别异常情况,理解企业业务的推动力量,认清正在对企业的业务产生影响的行为及影响程度如何等。
商业智能的应用实施
企业在实施商业智能技术时,有两种方法可供选择。一种较稳妥的方法是从企业中某一个局部的商业需求开始,尝试着进行商业智能的实施。这种方法容易实现,回报快,三年ROI(投资回报率)较高。另一种方法则是在企业所有领域全面实施商业智能,以支持企业的所有业务过程,满足跨企业的决策支持。这种方法较前一种方法更具挑战性,三年ROI较低,收回投资的平均年限也较长。
无论采用哪一种方法,企业要建立自己的商业智能系统,都需要经历商业智能系统分析、系统设计和系统维护与管理三个阶段。
商业智能系统分析
商业智能系统分析,又可分为企业需求分析、信息来源分析、逻辑信息模型设计、商业智能系统结构设计等步骤。
企业需求分析可包含CRM分析、经营分析、产品组合分析、产品促销推广分析、财务风险分析与电子商务分析等等。
信息来源分析要对可能的信息来源进行调查,包括从顾客服务、商品销售、存货采购、会计财务、人力资源、推广促销、市场调查与电子商务等相关系统中考察可以收集的信息源。
逻辑信息模型设计主要的工作是从已经联机的信息系统中,找寻可用于信息分析的相关资料档案,并且与企业各项业务分析中的系统需求功能相比照,设计与汇集可符合企业需要的逻辑信息模型。
商业智能系统结构设计包括确定硬件与软件组成,设计信息从来源系统到商业智能系统数据库的处理流程。通常采用OLAP与数据挖掘工具进行分析预测,使终端用户存取数据更有效率。
商业智能系统设计
商业智能系统设计,包括实体数据模型设计、ETL(抽取、转换和装载)设计、数据挖掘方法设计、终端程序设计(OLAP或EIS)等步骤。
实体数据模型设计就是数据抽取 (Extraction)、转换(Transformation)与装载(Loading)的功能设计。商业智能系统必须具备抽取各种类型信息的能力,并且依照资料的特性与决策者的需求,能够自动、定时地到来源数据库中抽取信息。数据转换则是将不一致的数据,根据规则转换为具有一致性的数据。装载则在商业智能的转换程序服务器上自动进行。装载程序需要考虑自上一次资料抽取之后,来源数据库内发生改变的项目,并对装载时产生的错误进行处理。数据挖掘方法设计即根据系统数据的特点,选择适用的挖掘算法,如可采用货篮分析、时间序列分析、聚类分析、决策树方法、遗传算法等。终端用户应用系统设计用于确定以何种形式将联机分析处理、数据挖掘分析的结果呈现给用户。
商业智能系统维护与管理
商业智能系统维护与管理,包括商业智能整合性系统建立、数据库管理、安全管理与效率管理等步骤。这里涉及两个层面,第一是维持与管理商业智能系统与其支持结构(数据库管理、安全管理、效能管理)所需的基本功能。第二是从技术及商业的角度来探讨商业智能系统配置是否达到最佳。从技术的角度而言,包括检查逻辑与实体数据库设计,以及所需工作效率调整是否合适。从商业的角度而言,包括数据库稽核,亦即访问商业使用者,以考察他们的需求是否获得满足,以及获得的投资报酬。
为了使商业智能系统获得成功,组建数据库管理小组是关键。数据库管理小组要负责建立实体数据模型、数据存储的DBMS以及备份与恢复程序,还要负责安全管理和效率管理。
北京燕莎望京购物中心商业智能的应用
零售企业的信息系统每天会产生大量的数据。如果采用商业智能系统对这些数据进行分析,不仅可以获得商品的关联关系,还可以获得有关商品结构、销售状况、库存状况、供应商和顾客等决策支持所需的珍贵信息。1999年11月,燕莎望京购物中心对原计算机系统进行了改造升级,开始实施商业智能。新系统重新整合和规范了北京燕莎望京购物中心的原有业务流程,使得在管理上更加规范和通畅。2001年,燕莎望京购物中心在原基础业务管理系统基础上导入了商业智能系统。该系统基于IBM公司的DB2数据库,并采用了一系列新的开发思想。
燕莎望京实施的BI运用了数据仓库、在线分析和数据挖掘技术来处理和分析数据,进行数据抽取、清洗、聚类、挖掘、预测等处理,针对不同的“维”进行上下钻取、左右拖动及纵横旋转,通过连续的立体动态表来产生可透析的各种展示数据,直观地显示分析者所要探询的某种经营属性或市场规律。 该BI系统分为商业计划、商品配置、采购技术、销售技术 、库存技术、资金分析 、顾客分析 、人员绩效八大模块,采用三维(时间维、经营活动维、指标维)模型进行全方位的分析,从而得出科学准确的结论。具体来说,对于时间维,可以选择从一年到一天甚至可以精确到某一小时,几乎可以对任意时段的同比和环比指标进行分析比较;对于经营活动维,既可以按照商品的类别如品牌、产地、新商品、淘汰品、促销品、账期品、组包品、多包装品摆放位置、柜组、楼面、占用面积和体积、价格带、毛利带等划分,又可以按照角色如买手、供应商、CEO、部门经理、营业员、收银员、一般消费者、贵宾客户进行划分;对于经营指标维,则可以从进货、销售、调配、库存(毛利、毛利率、动销率、周转率、交叉比率)、资金占用比、库存数量、金额、客人数、客单价等多个角度进行详细的统计与分析。
燕莎望京启用商业智能分析系统之后,有效地解决了原来存在于企业中的内外部矛盾。通过对供应商在特定时间段内的各项指标,包括订货量、订货额、进货量、进货额、到货时间、库存量、库存额、退换量、退换额、销售量、销售额、所供商品毛利率、周转率、交叉比率等进行的分析,为供应商的引进、储备、淘汰(或淘汰其部分品种)及供应商库存商品的处理提供了可靠的分析依据。比如,在分析的过程中,可能会发现某些供应商所提供的商品销售一直不错,某个时间段里的结款也非常稳定,而这个供应商的结算方式是代销。分析显示出,既然这个供应商所供商品销售风险较小,在资金不紧张的情况下,为什么不考虑将他们改为购销来降低经营成本呢?
通过采用商业智能分析系统,燕莎望京确定了以分析结构为主线的分析思路,进而指导了购物中心商品结构的调整,增强了所营商品的竞争能力,商品配置也更加趋于合理,并为及时调整商品的品类和价格定位、调整和监控供应商的经营行为、及时订货补货等提供了科学的依据。通过顾客分析,可以了解到燕莎望京的商圈里消费者的居住区域、文化层次、年龄段、平均月收入等,为燕莎望京总体的定位提供强有力的说服性数据
网站流量分析改善营销活动
一旦你的网站被有效地纳入广告、公共关系和搜索引擎的综合性营销计划,你就希望能够检测执行效果,以了解你的营销计划是否可行。营销人都在寻找更好的营销活动反馈信息。
评估回报的一个好办法是检查你的网站日志资料,分析网站流量,寻找用户行为的线索。通过分析用户行为资料,可以调整网站,更好地为客户服务,增进收益。
知道你的网站访问者来自哪里以及他们喜欢和不喜欢的东西,这一点很重要。流量分析能够在两个重要的领域提供增进营销效果的信息:
(1)改进网站,让更多的访问者变成你的客户;
(2)改进你的营销活动以获得更好的投资回报率(ROI)。
分析
网络营销的妙处在于,你的网站可以收集到所有访问者的行为资料。你可以在你的网站日志上找到所有需要的信息,用以改进你的营销策略。
最好的营销活动应被设计成可监测、分析,并可不断得到改进。问题在于,大部分非专业人员不知如何就获得的信息进行分析,以及采取什么措施。要知道该监测些什么,以及为什么要作这些监测,并非易事。
流量分析资料
网站日志为用户提供网站流量的动态信息。分析网站日志将让你熟知访问者浏览你的网站的方式。你可以收集到如下基本信息:
·页面浏览总数
·每日单独访问者数量
·每小时单独访问者数量
·总访问数
·首次访问者数量
·重复访问者数量
·每日重复访问者
然后看看平均情况,如:
·每个访问者的平均页面浏览数
·每个访问者平均访问数
·平均访问时间长度
·该日内每小时平均页面访问数
·该日内每小时平均单独访问者数量
·该日每小时平均访问数
电子商务网站可获得如下评估统计情况:
·总收入
·总定单
·单独购物者总数
·最活跃和最不活跃的时间段
·购物车放弃率
·首次访问者转化为购物者的情况
·重复访问者转化为购物者的情况
·购物者浏览器使用情况
所有这些原始资料都存在于你的网站日志中,但如果不借助网站流量分析工具,将很难组织这些资料。北京蓝太平洋科技开发有限公司的WebEngine是一个很受欢迎的分析工具,以上的信息摘录自该软件所执行的前10位统计列表。在download.com中还可找到其它流量分析工具,包括一些低端工具如HitBox, LiveStats, Urchin,也有很多功能先进的高端工具。
改进网站以提高访问者的客户转化率
你需要监测些什么东西,据此对网站进行改进呢?这取决于你的网站的性质,取决于它是否是一个卖产品或服务的电子商务网站,是进行媒体发布的内容网站,还是纯粹的信息网站。每一个网站都有专门的目标。要判断你的网站有多大的吸引力,以及留住访问者使之转化为客户,达到这一目标的最好方法,是搞清楚一切可能让访问者访问你的原因,比如做如下工作:
·尽量收集有关产品/服务的深度信息
·找到邮件地址或通过电话联系询问有关产品/服务的问题
·订购产品/服务
·比较产品/服务的定价
·检查产品/服务的待办定单的情况
·获得更多有关已订购产品的使用信息或情报
·寻找客户服务帮助
·报告在线表格或购物车故障
·注册订阅新闻信、新产品信息、营销小册子、白页,等等
·研究下一代产品
·加入某网上社区
·阅读新闻标题、行业新闻、商业文章,等等
·研究已购产品/服务的附件信息
·检查新产品提供情况
·检修有关产品/服务出现的故障
一旦弄明白用户为什么访问你的网站,你就可以为访问者设置他们想要进行的活动项目,并在网站内跟踪他们的行踪,以此测定你是否成功地达到了你的目标。
如果你引导他们订阅免费新闻邮件,而他们没有去注册,你需要找出原因何在。你可能要求填入太多信息;填写的表格可能界面不够友好或功能欠缺;或许你的描述不够引人注目。明确障碍所在,采取一切必要的措施来加以改善。
路径浏览分析可为你提供需要的信息,你可以将浏览变得更方便,并调整或删除某些内容以迎合客户的需要。这些改变能够提高客户转化率,增强客户满意度。
评估活动效果
你可以利用几种手段来分析你的营销活动效果。每个公司有不同的目标,因而,其关键的效果测试手段也有所不同。以下是6种基本方法,你可以用来评估任何一个营销活动的效果。
·访问者总计--你的网站访问人数
·注册行为总计--网站内各种类型的注册加入者总数。各种注册行为取决于你的不同目的。它可能是注册以获取新闻邮件,或购买产品或服务,注册某一论坛,或订购一付费服务,等等。
·每个注册活动的成本--每产生一个注册行为所需要的成本。它的测量是通过注册活动数量除总注册活动费用。
·客户转化率--这是单独访问者完成注册活动的比率。它的测量是通过单独访问者总数除总注册数量。
·总收入--由专门的活动产生的总收入。
·投资回报率--从总收入中减去总成本,然后除以总成本,计算出每个活动的投资回报。一旦定义好了你的每个活动的价码,你就可以用访问者行为分析来测试你的营销信息或各种服务的效果。如果你想知道你的搜索引擎营销方法是否有效,你可以将各种策略进行比较:
·网站分析和优化
·网络之外发展
·链接策略
·付费项目
·付费排名
·人工登录搜索引擎(Inktomi, Google, Lycos, AltaVista)
·人工登录搜索引擎的检索目录(Yahoo!, Open Directory Project, LookSmart)
你可能发现付费排名会随着时间的流逝不那么有效,就可以从付费项目中将之排除,而采取人工登录的办法。通过使用网站分析,你可以把更多的访问者变为你的客户,降低成本,获得更高的投资回报率。
流量分析相关定义 网络营销与网站流量分析的关系
流量分析相关定义
1、什么是网站流量(traffic)?
通常说的网站流量(traffic)是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、总用户数量(含重复访问者)、网页浏览数量、每个用户的页面浏览数量、用户在网站的平均停留时间等。此外,网站流量还有一层意思,就是一个网站服务器所传送的数据量的大小(数据流量常用字节数/千字节数等指标来描述),在网络营销中所说的网站流量一般与网站的实际数据流量没有一一对应关系。
2、什么是网站流量分析?
网站流量分析,是指在获得网站访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。 统计实际被点击的网页数量。“页面浏览量”往往被用来衡量网站内容的受欢迎程度和被访问情况。页面浏览量统计除后缀名为gif,jpg,png,jpeg,css,js,class,ico,bmp,swf以外的全部文件的访问情况。
3、网站访问流量包括哪些主要统计指标?
网站访问统计分析的基础是获取网站流量的基本数据,这些数据大致可以分为三类,每类包含若干数量的统计指标。
(1)网站流量指标
网站流量统计指标常用来对网站效果进行评价,主要指标包括:
独立访问者数量(unique visitors)、重复访问者数量(repeat visitors)、页面浏览数(page views)、每个访问者的页面浏览数(Page Views per user)、某些具体文件/页面的统计指标,如页面显示次数、文件下载次数等。
(2)用户行为指标
用户行为指标主要反映用户是如何来到网站的、在网站上停留了多长时间、访问了那些页面等,主要的统计指标包括:
用户在网站的停留时间、用户来源网站(也叫“引导网站”)、用户所使用的搜索引擎及其关键词、在不同时段的用户访问量情况等。
(3)用户浏览网站的方式
用户浏览网站的方式相关统计指标主要包括:
用户上网设备类型、用户浏览器的名称和版本、访问者电脑分辨率显示模式、用户所使用的操作系统名称和版本、用户所在地理区域分布状况等。
网络营销与网站流量分析的关系
1、网站流量统计分析对网络营销有哪些作用?
在网络营销评价方法中,网站访问统计分析是重要的方法之一,通过网站访问统计报告,不仅可以了解网络营销所取得的效果,而且可以从统计数字中发现许多有说服力的问题。网站访问量统计分析无论对于某项具体的网络营销活动还是总体效果都有参考价值,也是网络营销评价体系中最具有说服力的量化指标。归纳起来,网站访问统计分析的作用主要表现在下列几个方面:
(1)及时掌握网站推广的效果,减少盲目性;
(2)分析各种网络营销手段的效果,为制定和修正网络营销策略提供依据;
(3)通过网站访问数据分析进行网络营销诊断,包括对各项网站推广活动的效果分析、网站优化状况诊断等;
(4)了解用户访问网站的行为,为更好地满足用户需求提供支持;
(5)作为网络营销效果评价的参考指标。
2、如何获得网站流量统计数据?
获取网站访问统计资料通常有两种方法:一种是通过在自己的网站服务器端安装统计分析软件来进行网站流量监测;另一种是采用第三方提供的网站流量分析服务。两种方法各有利弊,采用第一种方法可以方便地获得详细的网站统计信息,并且除了访问统计软件的费用之外无需其他直接的费用,但由于这些资料在自己的服务器上,因此在向第三方提供有关数据时缺乏说服力;第二种方法则正好具有这种优势,但通常要为这种服务付费,虽然也有一些免费网站流量统计服务,但由于在功能方面会有一定的限制,或者通常需要在网站上出现服务商的标识甚至广告,对于商业网站来说使用免费服务肯那个不太合适。此外,如果必要,也可以根据需要自行开发网站流量统计系统。具体采取哪种形式,或者哪些形式的组合,可根据企业网络营销的实际需要决定。
3、使用专业网站流量分析系统的好处?
科学统计、准确分析、提供可靠决策依据、合理减少人力,物力和成本投入、提高工作效率、将投资回报可视化。
(1)网站制作人员可以从评估系统得出网站的页面错误等情况,及时对错误作出修正,使网站的浏览正确率得到提高。判断网站用户喜好倾向性,在整体设计制作上真正满足用户的使用需求。
(2)网站运营人员可以从评估系统得出网站的运营状况,直观的看到网站整体的发展情况。及时对网站的运营状况作出良性的调整。例如:网站的知名度,网站用户的行为情况,网站各模块的受众度等关键要素。
(3)网站数据分析人员可以从评估系统得到可靠的数据,将数据根据需要作出合理的分析结果。将结果提供给网站发展决策人员,给决策人员提供科学合理的参考依据,避免决策的盲目性,对网站的发展作出更为合理的发展决策。