信息通信的概念(6篇)
信息通信的概念篇1
信息的概念成了“鸡肋”,问题还是出在老师们不知道怎么才能让学生弄明白“信息是什么”。如果真的把“信息的概念”当作纯粹的概念课、理论课来上,效果恐怕不会好。先不说对高中学生来说,信息概念中那明显的哲学味儿能否被理解,就是学生能理解,我们还需反问自己,我们真的搞清楚“信息是什么”了吗?
世界上的事情往往就是这样,我们越熟悉的,越密不可分的事物,反而越难以说清楚,越难下个定义,硬要给出个定义的话,没准越弄越糊涂。信息就是这样一个东西,它无处不在,充斥在我们周围,却又看不见摸不着。“信息是什么”这个问题就如同“人是什么”、“真理是什么”、“知识是什么”这类问题,看似简单,实则不然。有人管这一类“是什么”的问题叫“苏格拉底式”问题,对这类问题,不要以为我们看了书上的定义就能真正弄懂了,堆砌名词对更多处在感性认识阶段的高中生而言毫无意义。
如果直接从信息的定义入手,好像课本中为我们罗列的名家定义都有些似是而非,细细品味这些定义,并没有让我们从中增加多少对信息的理解。据说信息科学家、哲学家们已经给信息下了200多个定义,就拿我们最熟悉的三大定义来说:香农把信息定义为“用来消除不确定性的东西”,一看便知,香农讨论的信息是通信系统中的信息。这个过程中信息甚至可以用信号、波形来测度,“消除不确定性的东西”是完全可以度量的。但香农定义也仅限于此,当“信息论”如日中天之时,香农本人就多次告诫世人:“信息论肯定不是万能药,它是一个严格的数学分支,不适用于那些统计原理不能成立的场合。”现实世界中的许多信息问题就不能归结为数学问题,如同我们不能把粮食定义为“消除了的饥饿状态”,信息也不能简单地描述成“消除了的不确定性”。我国著名学者钟义信则把信息定义为“事物运动的状态和方式”,这个抽象的定义并没有告诉我们信息到底是什么,因为事物运动的状态有很多,而几乎任何现象都是事物运动方式的反映。最后,我们不得不搬出维纳的定义:“信息就是信息,不是物质也不是能量。”这等于干脆放弃给信息下一个定义了。
既然直接从信息定义入手频频碰壁,不少老师就绕个圈子,从信息的特征入手,通过对信息特征的了解,试图间接搞明白“信息是什么”。这里面最重要的特征就是信息的依附性,也就是探讨信息与载体的关系。因为信息必须依附载体而存在,不存在与载体无关的“裸信息”,如果我们能研究清楚信息与载体的关系,就能把握信息的本质了。可是在某些情况下,我们甚至对“信息必须依附载体而存在”这一铁律都可以提出疑问。比如,我们在生活中会遇到的一种状况,家里有人在外地打工,他有时候会给家里打电话,更多的时候家人得不到他的消息。当他没有打电话给家人的时候,家人会理解为他在外地平安无事,这正如一句俗语所说的“没有消息就是好消息”。但这个例子却给我们讨论的信息和载体的问题带来了麻烦,这等于说家人获得的平安无事的信息来自于一个“没有的信息”,由于没有信息,当然不需要任何载体,那么信息还必须依附载体而存在吗?
其实,试图定义“信息是什么”越来越被认为没有意义,早期那种追求大一统的信息定义的做法正逐渐被放弃。因为几十年来的研究表明,期望某一个单一的信息概念能够被大多数人满意的认可,几乎是徒劳的。
信息通信的概念篇2
Abstract:Inordertoenhancetherateofaccuracyandcoveragefractionintheinformationextractionprocess,ithasintroducedthedomainmainbodyintheinformationextractionretrievalsystem.Thispaperintroducedsomebasicconceptsaboutmainbody,domainmainbodyanddiscussedsomemappingrelationsbetweenthedomainmainbodyandtheinformationextractionandhasrealizedthehandsetdomainmainbodyinthisinformationextractionprototypesystemandhasappliedthisdomainmainbodyintheinformationextraction.
关键词:概念;本体;信息抽取;领域本体
Keywords:concept;mainbody;informationextraction;domainmainbody
中图分类号:TP391文献标识码:A文章编号:1006-4311(2010)14-0158-02
0引言
最近几年来,为了使人们能够按内容的语义表达需求,迅速准确地从成千上万的网页中过滤出自己感兴趣的内容,把本体广泛应用于各个信息领域中,同时已经成为目前信息科学研究的一个热点和难点,备受世界很多国家的重视。在信息检索和抽取[1]等领域中,本体发挥着越来越不可缺少的作用。信息抽取是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。这就是信息抽取的主要任务。基于领域本体的信息抽取系统,可以实现让用户得到具有个性化的信息服务,同时通过领域本体为信息源提供相应的语义标注,这样可使系统对本领域内的概念以及概念之间的联系有统一高度的认识,从而在一定程度上提高信息服务的查准率和召回率,实现为用户更有针对的信息服务。
1领域本体与信息抽取
1.1本体的基本概念本体论(ontology)是一个哲学上的概念,是指哲学中研究世界的本原或本性的部分。不少哲学家把本体论看作是西方传统哲学思想(从柏拉图到黑格尔)的主干或”第一哲学”。从本体论的基本概念出发,哲学上把本体论定义为”对世界上客观事物所进行的系统描述”。
1.2领域本体的概念领域本体(Domainontology)是用于描述指定领域知识的一种专门本体,它给出了领域实体概念及相互关系领域活动以及该领域所具有的特性和规律的一种形式化描述[2]。
1.3领域本体[3]在信息抽取中的应用基于领域本体信息抽取是新型的信息抽取方式,它利用领域本体而不是扁平结构的辞典与词表来识别抽取信息,领域本体信息抽取可以在语义层而理解抽取信息,同时可以通过领域本体实例对抽取信息内容进行语义标注,从而提高了信息抽取的查准率和召回率。
1.4信息抽取检索系统中领域本体的构建知识工程中的本体是人为设计的关于某个领域的概念模型的一种表示。目前己有的本体很多,出于对各自问题域和具体工程的考虑,构造本体的过程也是各不相同的。由于没有一个标准的本体构造方法,不少研究人员出于指导人们构造本体的目的,从实践出发,提出了不少有益于构造本体的标准。
2领域本体的构建
2.1领域本体的设计原则通过分析总结,本体的设计原则可以概括如下[4]:①明确性和客观性:即本体应该用自然语言对所定义术语给出明确的、客观的语义定义。②完全性:即所给出的定义是完整的,完全能表达所描述术语的含义。③一致性:即由术语得出的推论与术语本身含义是相容的,不会产生矛盾。④最大单调可扩展性:即向本体中添加通用或专用的术语时,不需要修改其己有的内容。⑤最小承诺:即对待建模对象给出尽可能少的约束。⑥最小编码偏差:本体的建立应尽可能独立于具体的编码语言。⑦使用多样的概念层次结构实现多继承机制。⑧尽可能使用标准化的术语名称。
2.2领域本体的构建步骤在实际的构建过程中,根据问题领域和具体工程的不同,形成多种构建本体的方法。目前,知识工程界比较成型的建模方法主要有:如骨架法[5]、企业建模法[6]等。参照这些构建领域本体的方法,结合信息抽取中的具体情况,并参考软件工程中的某些思想,领域本体的构建步骤如下所示。
具体如下:①确定领域本体的范围:明确构建的本体将覆盖的专业领域、应将本体的目的、作用以及本体的用户范围。②列出领域中的重要术语:列举出本系统想要陈述的或要向用户解释的所有概念。③建立本体框架:这时需要按照一定的逻辑规则把它们进行分组,形成不同的工作领域,在同一工作领域的概念,其相关性应该比较强。④设计元本体,重用已有的本体,定义领域中概念及概念之间的关系。⑤对领域本体编码、形式化。⑥领域本体的检验评价。
3信息抽取在手机领域本体的实现
根据以上关于领域本体的设计原则和实施步骤,本文在开发领域信息抽取原型系统时,主要使用手工和半手工的方式实现了手机领域本体,在系统的销售领域中起了很大作用。
3.1手机领域本体的框架设计基于领域本体的web页面信息抽取主要是利用本身的描述信息进行抽取,因此对网页结构的依赖较少。采用这种方法进行信息抽取,预先需要领域专家采用手工方式书写某一应用领域的本体(其中包括对象的常值、关键字的描述信息)。根据领域本体的概念、概念属性以及属性之间的关系需要建立相应的关系数据库。然后根据本体中常值和关键字的描述信息产生抽取规则。对每个无结构的文本块进行抽取获得各语义项的值,最后将抽取出的目标信息放入根据领域本体的描述信息生成的数据库中。那么,下面对比较重要的数据表及其作用进行各个说明如下。
①实体概念数据表用于保存手机领域中可能相关的实体概念。刚刚建成时,可以通过人工查找、识别出领域实体的一些概念,并保存到数据库中。在此以后,可通过计算机辩别出领域实体概念,并把它追加到数据库中手工进行检验。②实体概念特征词数据表,该表存储每个实体概念在文本中又可能出现的近义形式或术语。例如实体概念“手机”而言,在文档中有可能变成为“大哥大”、“手提”、“mobile”、“mobilephone”。③属性概念数据表用于存储手机领域中可能存在的属性概念。该表主要用于保存属性概念中在真实文本中有可能出现的近义术语或形式。④属性值概念数据表用于保存领域中可能的属性值概念。该表主要用于保存每个属性值概念在文本中出现的术语或形式。⑤概念关系表主要描述手机领域的实体概念之间存在的种种关系。
3.2领域本体中概念间关系的实现手机领域本体中概念间的关系的表示通过几个概念关系表和各数据表之间的关系来实现。该领域本体由多个数据表组成,它们不仅描述该领域的实体概念、属性概念、属性值和相对应的特征词,而且对实体概念之间的关系、实体概念、属性、属性值之间的关系进行描述。而实体概念关系表描述的是实体概念表中的两个实体概念之间的关系。实体概念、属性、属性值关系表描述的是实体概念、属性、属性值之间的相互关系,如表1所示。
3.3手机领域本体的具体应用本文的信息抽取原型系统的命名实体识别、实体关系抽取和任务抽取3个抽取任务,对显示器领域本体都有大量的应用,主要集中在如下几方面。
①命名实体是文本中基本的信息元素,是正确理解文本的基础。命名实体识别就是要判断一个文本串是否代表一个命名实体,并确定它的类别,即发现命名实体和标注命名实体。在命名实体识别阶段,领域本体可以提供许多语义信息。利用这些语义信息对本体中的实例进行实体和关系的抽取有非常重要的意义。基于领域本体的抽取检索系统可以利用本体中的实例进行实体和关系的抽取,并不试图运用规则来发现新实例,不对知识库进行丰富,其目标是抽取的精准率和效率。②信息抽取系统基本上主要采用机器学习算法来实现抽取任务,其目标是最大程度地实现关系的抽取。它实现的关键是算法在关系识别任务中的正确率和效果,适合应用于精粒度的信息抽取。③信息抽取系统基本上都是基于模式匹配的,即首先从文本中学习出事件抽取模式,然后再用抽取模式去发现新的事件。而领域本体的语义信息能够用于抽取模式的获取过程事件抽取模式的自扩展过程,能够对已有的抽取模式进行语义扩展。④此外,在进行文本或某些网页的段落中的一些重要概念提取时,领域本体起了非常重要的作用。
参考文献:
[1]万捷,滕至阳.本体在基于内容信息检索中的应用[J].计算机工程,2003,29(4):122-123.
[2]张志刚.领域本体构建方法的研究与应用[D].大连:大连海事大学,2008.
[3]肖敏.领域本体的构建方法研究[J].情报杂志,2006(2):70-72.
[4]郭嘉琦.领域本体的构建及其在信息检索中的应用研究[D].北京:北京邮电大学,2007.
信息通信的概念篇3
遍布全世界的主机和服务器,错综相联的超媒体资源,这是互联网为我们所构建的一个巨大而丰富的电子信息空间。它无疑是现代社会最重要的信息获取手段,但是它的开放性、分布性、无序性以及惊人的发展速度也为人们对信息资源的利用带来了困难。正如在大海中行驶的船只需要导航系统确定方位一样,要想在茫茫的信息海洋中有效获取有用信息,也必须拥有便捷有效的信息导航技术。一般来说,www网络中常用的信息导航方式有三种:一是利用门户网站的分类索引;二是利用网络搜索引擎;三是利用网站的相关链接。但是目前这三种信息导航方式的效果都不尽如人意。分类索引所覆盖的网络站点范围太小,更新较慢,难以适应网络的快速增长,而且分类标准的不统一和不规范常常影响到用户对站点所属的判断,造成导航失败。搜索引擎虽然是目前主要的网络信息检索工具,但是通过简单的逻辑运算检索到的结果往往是数量庞大且鱼目龙杂,充斥着大量的无用和重复信息。网站的相关链接是指符合当前网站内容主题的内部和外部信息资源的超链接,这种导航方式虽然简单直接,但是信息量非常有限,而且对外部信息的链接常常出现错链和假链,即使是内部信息,也常常因为组织和描述方式的影响,造成用户的“资源迷向”。
用户在信息空间中的“迷航”会使他们感到厌倦而丧失获取信息的信心,分析其原因,主要包括以下几个方面[1,2]:
(1)网络的巨大信息量使人们必须依赖于自动化的处理技术。但是目前因特网的各个网端的技术支持环境比较复杂,信息资源的内容范围、组织结构和存储方式各不相同,呈现出分散、无序、变幻多端的特点,这使自动信息处理技术的应用困难重重。因此要提高信息导航的效率和质量,必须先解决资源异构的问题。
(2)网络信息空间中的数据大多以半结构化和非结构化的形式存在,对信息资源的内容缺乏形式化的语义描述,而且大部分资源间的链接也没有反映语义关系,这使得机器很难对网络信息空间进行深层次的理解和处理,对信息的自动导航也无法像人工操作那样准确有效。
(3)目前的网络导航系统缺乏个性化的信息服务。由于知识背景的差异和一词多义等方面的原因,不同的网络用户之间、用户与系统设计者之间对于问题和信息内容可能会具有不同的理解与认识,当用户按照自己的思路查找信息时,他所选择的导航路径可能是错误的或者低效的。因此信息导航必须考虑具体用户的特殊性,有针对性地提供导航服务。
(4)网络导航系统的设计缺乏规范。门户网站各自依据不同的标准建立自身的分类导航系统,网站的划分随意性较大,常常引起用户的困惑。一些著名的信息搜索引擎也各自采用不同的检索规则,有些系统不能利用历史信息或者不提供二次检索,给用户的使用带来不便。另外,在网站内部的导航系统设计上,也存在着导航结构不合理,导航要素不完整,导航界面不统一等问题。这些都可能造成用户的导航障碍。
由此可见,造成信息“迷航”问题的主要原因在于缺乏信息空间的合理组织和有效的导航机制,这也是第二代web网络技术难以克服的困难。为此,人们正在研制第二代web网络——SemanticWeb,它以结构化信息表示为主,为网络导航研究开辟了新天地。
2SemanticWeb技术
TimBernersLee在1998年提出了SemanticWeb的概念。2001年2月,W3C组织正式推出SemanticWebActivity,使网络环境下的语义处理技术研究渐入佳境。SemanticWeb研究活动的目标是开发一系列可由计算机理解和处理的语义表示语言和技术,通过显式的语义表示和领域本体将网络信息空间编织成为一个巨大的机器可读的知识网络,以支持自动化的信息访问和知识管理,实现高质量的网络信息服务。目前关于SemanticWeb的研究主要集中在网络信息资源及其内容的语义和语义关系表征,基于语义的数据自动分析、理解和处理,不同应用领域和系统间的数据自动交换、转换和复用[3]。SemanticWeb虽然是现有web网络的延续,但在信息导航方面具有许多普通web没有的优势。SemanticWeb中的节点既可以代表物理页面,也可以代表知识实体;SemanticWeb中网页的内容不但可以被人理解,而且可以被机器理解;SemafiticWeb中的链接不再是任意的,而是遵循一定的语义关系。通过SemanticWeb技术,可以改变现有网络松散的数据结构,将信息资源结构化并赋予含义,使网络信息的整合和自动处理都变得更加容易[4]。
2.1本体
所谓本体(Ontology),实质上是描述特定应用领域知识的公认的术语集。关于奉体的定义,比较著名的观点是“本体是概念模型的一个显式的规格说明”和“本体是共享概念的一个形式化的规格说明”,其中,“概念模型(Conceptualization)”是指通过对某个客观现象的相关概念进行辨析和提取而获得的关于该现象的抽象摸型;“显式(Explicit)”是指对所使用的概念的类型,以及这些概念在应用上的约束都给予明确的说明;“形式化(Formal)”表示本体以计算机可读的形式存在;“共享(Share)”表示本体中反映的是共同认可的知识”[5]。
本体通常表达为一组对象(概念)、关系、函数、定理和实例。本体中的对象类按照等级关系组织成基本的结构体系。等级关系包括例化(is-a)关系、类属(kind-of)关系和整部关系(part-of)。上层的对象类为父类,下层的对象类为子类。对象类具有各自的属性,并可依据父子关系继承。对属性的取值对象、取值范围、取值基数等都可以加以限制,还可以对属性的交换性、对称性、传递性、唯一性等进行定义。除了等级关系,本体中的对象类间还可以具有其他语义关系,形成语义网络形式的概念模型。本体是机器自动推理和智能化高级信息服务的基础,对网络而言,一个简单的本体的典型例子就是网络的分类索引(如Yahoo!的分类目录)。本体的应用对于提高网络导航的精度和效率具有重要的意义[1,4)。
2.2RDF和RDFS
RDF是由W3C开发的元数据描述机制,其目的主要是为元数据在网络上的编码、交换和重用提供一个基础。它允许在XML的基础上以一种标准化的、互操作的方式对数据语义进行定义[4],提供了一个描述web资源的数据模型。RDF包含描述资源的属性和关系的声明。资源是任何用URl(UniformResourceIdentifier)唯一标识的实体对象。资源具有属性,属性则具有一定的值,该值可能是简单的字符串或数字,也可能是自身也具有属性的其他资源。这样,资源、资源属性和属性值构成了RDF声明中的三元关系模式,任何本体或描述性元数据都是这种三元关系模式的具体体现”[1,7]。
为了描述元数据元素间的复杂语义关系,W3C进一步定义了RDFS(RDFSchema)。它可以看成是一个本体定义语言,用来建立概念类体系结构、属性层次和类关系。
3基于SemanticWeb的智能导航机制
SemanticWeb的出现为网络信息导航提供了新的研究思路,SemanticWeb技术是解决无序网络空间中“迷航”问题的关键技术。基于SemanticWeb的智能导航是一种以结构化、语义化的概念知识网络为基础,自动形成个性化导航结构的方法。它分为两个方面,一是基于SemanticWeb的信息组织,即利用参考本体对各信息源进行语义描述和整合;二是基于SemanticWeb的个性化导航结构模型的构建,即在有序语义组织的基础上,构造用户语义模型,并据此建立导航结构。图1显示了基于SemanticWeb的智能导航机制的概念结构[8]。
3.1基于SemanticWeb的信息组织
基于SemanticWeb的信息组织的基本思想是,将来自于多个异构信息源中的数据整合到一个语义统一的参考本体中。参考本体是通过分析领域中的各个信息资源集合,提取公共概念、属性和关系而构建的本体,它为所有信息资源提供统一的概念集合和通用语义。
信息整合的方法是先分别将各个信息源中的数据转换为通用的数据模型,然后建立各个数据模型和参考本体之间的映射关系。网络中的信息源具有各种各样的数据格式,其中大部分是HTML页面,有的包含表格和列表。另外还有XML文档、RDF文档以及关系数据库文档等。为了解决分布式异构信息源的语法相异问题,需要将数据转换为公用的数据模型格式,例如RDF。对于非RDF格式的信息数据,可以利用外覆包(wrapper)技术将其自动地转换为基于RDF的数据模型。外覆包对特定格式的数据文档进行解析,并采用RDF声明对其内容进行标注。下面是三种常用的外覆包:
(1)HTML外覆包。由于HTML页面属于半结构化的信息数据,因此HTML外覆包采用的是半指导性的标注方法。即预先手工标注一组HTML页面,然后对新的HTML页面进行结构分析,将新页面与标注页面进行比较,从中提取相关信息。HTML外覆包还可以处理异构的XML文件[1]。
(2)XML外覆包。根据DTD和Schema所定义的XML文档的内容结构和内容元素,建立概念集与DTDSchema之间的映射关系,从而自动地将XML文献中的DTD内容元素标记转换为对应的概念集元数据标记。
(3)关系数据库外覆包。将关系数据库中的数据元素和二维数据关系映射到概念集中,形成语义基础,以便从关系数据库中自动创建RDF声明。
由于不同的信息提供者可能会使用不同的词表来标注数据,因此在建立通用数据模型后,还必须在信息数据源和参考本体之间建立概念和关系的映射,以消除语义差别。根据RDF声明,在参考本体中注册相关内容的来源,使参考本体成为一个知识内容的集成文件。另外,采用基于本体的元数据发现和漫游技术,探测相关的RDF声明,可以自动地添加新的信息资源[8]。
3.2基于SemanticWeb的个性化导航
通过建立参考本体以及进行信息整合,无序异构的网络信息数据通过语义概念及语义关系被组织到一起,形成一个有序的公共语义知识模型。但是对于具体网络用户的信息导航,并不直接在全部公共语义模型上进行,而是依据用户语义模型有针对性地进行。
3.2.1用户语义模型
用户语义模型是反映用户观点的概念集合和概念关系。概念集合的确定可以由用户直接提交或者根据用户的注册信息(用户的兴趣、爱好和知识背景等)按照一定的规则计算选择。而构建用户语义模型的关键步骤在于建立用户概念集合与参考本体间的语义映射,寻找参考本体中与用户相匹配的概念和关系。
为了将参考本体映射到用户语义模型,需要预先对参考奉体和用户概念集合进行数据训练,方法是为每个本体概念和用户概念各标注一定的相关资源作为训练数据,然后利用向量空间模型为每个概念生成向量,并计算其标准权重。
建立语义映射的过程通过计算用户概念集合中的概念向量uc与参考奉体中的每个概念向量间的匹配度来完成。假设在n维向量空间中,用户概念向量uc中第i项的权重为的匹配度为[9]:
首先将计算结果中匹配度高于阀值的若干概念向量与uc建立映射,形成从用户概念集合到参考本体的一对多的对应关系。如果参考本体的一些概念被重复映射,则需要选择其中匹配度最高的映射,以保证从参考本体到用户概念集合的一对一关系,即一个本体概念只能和一个用户概念相关,但一个用户概念可以和多个参考概念相关。在建立用户概念集合与参考奉体对应关系的同时,用户概念也继承了本体中的概念层次结构和其他语义关系,成为一个独立的语义模型。
原则上应该将参考本体中的所有概念都映射到用户语义模型中,但是由于用户语义模型是范围相对较小的概念集合,因此参考奉体中的概念实际上不可能被完全映射。为了保持映射的完整性,可以在用户语义模型中设立一个“其他”概念类,参考本体中的所有没有被映射的概念将成为它的子概念[9]。
举例来说,假设用户提供的信息表明其在体育领域感兴趣的概念为“足球”、“足球世界杯”、“足球亚洲杯”、“NBA”、“围棋”、“奥运会”,图2显示了这些用户相关概念经过映射后形成用户语义模型的过程。
用户概念集合中的每一个概念都在参考本体中找到了与之相对应的一个或多个概念,将这些概念从参考本体中提取出来,并根据其语义关系重新组合,就形成了用户语义模型的结构。例如:用户概念“NBA”的对应概念为“篮球”、“篮球赛事”和“美国篮球职业联赛(NBA)”,因此这三个概念都被包含在用户语义模型中,且它们之间的父子关系(即等级关系)保持不变。又如,虽然参考本体中的“其他赛事”概念和用户概念集合没有直接对应关系,但由于该概念和“足球赛事”与“篮球赛事”两个概念间有语义关系,且这两个概念均与用户相关,因此该概念也被包含在用户语义模型中。另外,“世界杯足球赛”概念实际上与“足球”和“足球世界杯”两个概念间都具有对应关系。但由于它与后者的匹配度比前者高,因此将它映射到后者。
3.2.2个性化导航结构模型
导航结构模型显示了导航系统组织、关联和显示信息内容的方式。站点地图就是一种最简单直接的导航结构模型。个性化导航结构模型是基于用户语义模型创建的针对特定用户的导航结构,是个性化导航服务的实现。
导航结构的设计需要考虑三个基本要素:卡片、页面和链接。一张卡片只包含一种类型的信息内容,是导航结构模型中的最小组成单元。页面与物理的web页面相对应,一个页面上可以包含若干个卡片。链接则用于连接各个页面中的卡片以形成整体结构[8]。通常,导航结构模型总是从一个缺省的根页面开始,每一级页面都包含了到下一级页面的链接,信息内容通过卡片和页面进行分类和聚合,导航通过链接来进行。在个性化的导航结构建模中,导航结构是根据用户语义模型来确定内容和链接关系的。图3显示了一个导航结构的部分示例,它是在图2中的用户语义模型的基础上建立的。
导航结构的建模过程就是对各级贞面中的卡片的内容、类型和表示样式的确定过程。卡片的内容根据触发点和用户语义模型来选择,不同的用户将获得不同的信息内容。
导航结构中的卡片被分为两种类型:静态卡片和动态卡片。静态卡片的内容独立于数据源,主要包含静态文本、图片等。导航结构中的根页面通常都包含静态卡片,具有预先定义的锚点,指向下一级的页面。动态卡片的内容视数据源而定,如果数据源改变,则卡片的内容必须重新计算生成。动态卡片还可以细分为四种类型,每一种都代表了对信息进行结构化的一种典型方法:
(1)列表型(List)卡片:显示实体的实例列表,每一条实例都可具有指向该实例具体内容的链接入口。列表中的实例可以按照某种属性排序或索引。图3中的页面P2、P3、P4、P5都包含了列表型卡片。
(2)事实型(Fact)卡片:详细地显示一个实例的具体内容,如图3中的页面P4包含的“新闻内容”卡片和页面P5包含的“赛事内容”卡片。
(3)幻灯片型(Slide)卡片:顺序显示一组实例的具体内容,每次一个实例,且具有浏览附近实例的超链接,待显示的实例可以按照某种属性排序或索引。图3中的页面P6包含该类型的卡片,其中每个足球俱乐部的相关信息将被依次显示。
(4)查询型(Query)卡片:要求用户先填写一组实体属性的值,然后查询符合该值的实例并显示,通常该类型的卡片用于导航系统中的信息检索,如图3中的页面P7包含的卡片[8]。
另外,不同的卡片具有不同的表示样式,表示样式描述各种表示元素的属性,例如字体、颜色、布局等。表示样式可以根据用户喜好确定。
个性化导航机制的导航方法采用用户语义模型的查找与语义链的触发相结合的方式。当导航结构中的一个链接被触发时,该链接将被赋予一个查询式Q(C,T,S),式中三个变量的含义分别代表卡片的内容、类型和表示样式,在用适当的值填充变量后,即可利用查询式计算生成链接末端的卡片。例如在图3中,当链接L1被触发后,L1的查询式为:Q(“体育”,List,Stylel),其计算结果为页面P2中的卡片。Q中的变量C的值为L1的触发端点的概念“体育”,Q在计算时将检索用户语义模型,获取此概念的相关概念或相关资源作为卡片的内容。Q中变量T的值为List,因此Q生成的卡片将具有列表型的信息结构。同时,由于Q中变量S的值为Stylel,因此Q还要读取样式表中名称为Stylel的表示样式,并据此决定卡片的外观。同理,链接L2的查询式为Q(“足球俱乐部”,Slide,Stylel),其结果是生成一个信息结构为幻灯片类型,表示样式为Stylel,内容与足球俱乐部相关的卡片”[11,12]。
导航机制采用SemanticWeb技术,揭示和整合网络信息资源的深层语义知识模型,能有效解决无序、异构网络信息空间中的“迷航”问题。它利用映射方法建立用户语义模型,可以充分表达用户需求的语义知识,以提高个性化导航的效率。
4结束语
网络信息的利用状况不容乐观,迫使人们努力探索更为先进更为成熟的导航理论、方法和技术。第二代web技术——SemanticWeb在信息服务中的应用,促进了网络导航新技术的发展。它作为导航系统的信息组织框架,能够使复杂的信息空间变得有序、清晰和直观,它采用机器可读的形式化的知识表示方式,有利于知识内容的自动获取。目前,SemanticWeb技术正获得越来越多的应用,相信经过不断地研究和优化,以SemanticWeb为基础的高级网络信息服务将逐步成熟,智能、高效、个性化的导航系统将成为开发网络信息资源的主流工具。
【参考文献】
1丛敬军,阎辉.数字图书馆的知识信息导航技术研究.中国图书馆学报,2003,29(145):51~53
2马瑞民,衣治安.Web上超文本数据导航方法的研究.情报学报,2001,20(5):538~544
3张晓林.SemanticWeb与基于语义的网络信息检索.情报学报,2002,21(4):413~420
4刘柏嵩.基于知识的语义网:概念、技术及挑战.中国图书馆学报,2003,29(144):18~21
5MikeUschold,MichaelGruninger.Ontologies:Principles,MethodsandApplications.KnowledgeEngineeringReview,1996,11(2):93~155
6JeffHeflinetal.Requirementsforawebontologylanguage./TR/webont-req/
7张平,郭金庚.语义网描述语言分析.电脑开发与应用,2003,16(4):31~33
8OntoWebberModel-DrivenOntology-BasedWebSiteManagement.www-db.stanford.edu/pub/gio/2001/Ontowebber01.pdf
9Ontology-BasedPersonalizedSearchandBrowsing.ittc.ku.edu/~sgauch/selectedpapera/WLAS2003.pdf
10毕强,刘早学.QUIC——一个智能超文本导航系统.情报学报,2002,20(12):1277~1281
信息通信的概念篇4
近年来,无论在教学还是在学术研究领域,人们总是将会计信息化和会计电算化相混淆,认为两者是同一概念,没有实质区别,可以替换使用;也有人认为会计信息化的概念优于会计电算化,但不知道优在何处,只是在朦胧中意识到会计信息化可能会替代会计电算化。笔者认为搞清楚两者的来龙去脉,对两者加以正确的区分,有利于教育教学、企业信息化的发展与定位甚至学术机构的确切命名。
一、会计电算化和会计信息化概念的由来与含义
1979年,计算机应会计工作在我国拉开了序幕,当时人们的认识就是将计算机技术应用于会计领域能够有效地提高会计的工作效率,学术界并没有提出一个权威性的概念统一人们的思想认识。1981年于长春召开的“财务、会计、成本应用电子计算机问题讨论会”上,第一次提出了“会计电算化”的概念。
会计电算化的基本含义是指将计算机技术应用到会计工作领域,用会计软件指挥各种计算机替代手工完成,或手工很难完成、甚至无法完成的会计工作的过程。
2005年8月,由《会计之友》杂志社承办的中国会计学会会计电算化专业委员会年会在山西太原召开。会上提出了“会计电算化”向“会计信息化”发展的理念,与会专家就这两个概念进行了热烈的讨论,一致认为用“会计信息化”可以更好地概括“会计电算化”的进一步发展,也可以进一步提升“会计电算化”的应用水平。
会计信息化是会计与信息技术融合的过程,是将会计信息作为管理信息资源,全面运用以计算机、网络与通讯为主的信息技术对会计信息进行获取、加工、传输、存储应用等处理,为企业内部的经营管理者、企业外部的信息使用者提供全面、及时的信息,会计信息化是企业信息化的重要组成部分。
可以看到,两个概念是人们在不同时期、信息技术发展的不同阶段提出来的。
二、会计信息化与会计电算化的区别
应当看到,没有过去20多年会计电算化所积累的丰硕成果,今天的会计信息化也就无从提出与研究。会计信息化与会计电算化,没有划定的边界,只是随着信息技术的不断发展与其在会计领域应用深度和范围的不同而在认识上产生了飞跃,两者都以信息技术为特征,所不同的是,由于在不同时代所依托的信息技术迥异而使其各自应用的外延和内涵产生了较大的区别。
(一)信息技术环境的区别。人们通常所说的信息技术不是单纯的一种技术,而是计算机技术、网络通信技术和信息感测技术等组群技术的简称。会计电算化阶段,人们谋求能够开发出解决会计领域的单项工作或整体核算工作的软件,从而帮助会计工作人员实现劳动力的解放和生产力水平的提高;硬件方面则主要以单机环境或f/s(文件/服务器)架构为主,很少涉及网络通信技术和感测技术。会计信息化阶段,人们需要研究和开发集财务管理、生产管理、供应链管理、人力资源管理乃至决策支持等诸多子系统于一体的管理信息系统,会计信息系统属于管理信息系统的重要子系统,这个阶段的mis(管理信息系统)、erp(企业资源计划)、scm(供应链管理)、crm(客户关系管理)等产品和概念的提出无不建立在网络和通信技术基础之上。
可见,电算化和信息化都应用了计算机技术;电算化较少使用网络通信技术,信息化则更多地依赖于网络通信技术的支持;电算化几乎没有用到感测技术,信息化则会随着其发展越来越多的使用诸如条码感测、智能感测等感测技术。
(二)系统地位层次的区别。会计电算化主要服务于财务部门的核算与管理,属于部门级应用;而会计信息化则是企业信息化的有机组成部分,会计信息系统是管理信息系统的核心子系统,除了服务于财务部门外,还要为信息管理层、决策支持层和决策层提供服务,属于企业级应用。
(三)系统目标的区别。会计电算化和会计信息化是人们随着信息技术在会计领域应用的不断深入而提出的差异概念。会计电算化以解放生产力,提高工作效率为出发点,首先强调的是会计数据处理的规范化,改变手工会计的不规范现实,要求会计软件的开发、会计信息系统的运行按照我国统一会计制度的要求规范操作,立足于财务报告的规范生成;而会计信息化则更强调会计输出结果的效率和增值性,这种增值效应依赖于网络环境下会计数据的快速搜集、实时传递以及对不同层次数据的深加工。会计信息化的成效依赖于会计信息输出的多元化研究。
(四)信息输入的区别。会计电算化条件下输入系统的是记账凭证,数据主要由财务部门自己输入;而会计信息化的大量数据可从企业内外其他系统直接获取,同时可以预见,随着原始凭证标准化问题的解决以及网络安全技术的日臻成熟,经过数字签名的原始凭证会直接进入会计信息系统。
(五)数据处理的区别。会计电算化主要通过批处理方式处理业已发生的数据,而会计信息化使实时处理数据成为可能。在计算机网络环境下,企业的业务部门通过intranet(企业内部网)协同工作,所产生的各类数据信息存储于系统集成的数据库中,企业信息的内部用户可以通过对数据库的实时访问,对数据进行实时处理。
(六)信息输出的区别。电算化环境下,会计信息的输出主要有显示、打印、磁盘等方式;信息化环境下,内部需求除了上述方式以外,更多的可以通过网络实现信息传递与共享,通过授权、划分权限级次,企业内部各个机构、部门从信息系统上直接获取。随着xbrl(可扩展商业报告语言)深入研究以及b/s(浏览器/服务器)体系架构在大型系统中的逐步推广和应用,会有越来越多的企业在internet上公布其财务信息。
三、区别会计电算化与会计信息化的意义
会计信息化的概念提出以来,学术领域、教学领域都在同时使用这两个概念,造成的结果是人们疑惑丛生,疑惑之余只能盲从,继续盲从会导致企业无法正确定位自己的信息化进程、教学概念继续模棱两可、学术机构不能正确定位自己的研究和工作方向,上述结果最终会影响我国会计信息化的健康发展。
(一)有利于澄清教学中的模糊概念。目前,计算机会计教材比比皆是,名称不一,有会计信息系统、计算机会计学、会计电算化、电算化会计、计算机在会计中的应用等诸多称谓,笔者不反对“百花齐放、百家争鸣”的宗旨,但教学过程的授者是教师,受者是学生,名称和概念过多会导致授受双方无所适从,会使教学缺乏说服力,也会使学术研究缺乏统一的认识和思想,这可能是会计信息系统教材参差不齐、内容相左的重要原因。会计信息系统结合了信息论、系统论的思想,吻合了会计信息化的概念,适应了当前信息技术发展的大趋势,是计算机会计教材名称的首选。
(二)有利于企业正确定位自己的信息化进程。企业信息化进程受制于信息技术的发展,1979年我国开始搞计算机会计的试点,1983年国务院成立了电子振兴领导小组,直至1990年国内才推出第一批品牌的会计软件,可以说到上世纪90年代末,一个企业能够拥有自己的计算机硬件,找到合适的会计软件已属不易,不存在网络大规模的应用和遍地开花,而且这十几年的时间里企业的计算机会计确实是只在会计电算化阶段徘徊,软件生产厂商开发的会计软件业主要停留在会计电算化上,即能够用软件替代手工完成传统的手工会计核算工作,阿尼塔。s.霍兰德所谓的“传统会计信息系统是手工会计的翻版”即是这个意思。20世纪末本世纪初,随着大中型、分布式数据库逐步应用于国内信息处理领域;随着f/s(文件/服务器)逐步向c/s(客户机/服务器)、b/s(浏览器/服务器)体系架构的发展;随着越来越多的erp产品推出,特别是越来越多的企业有实力、有能力取得上述技术与服务以后,计算机会计脱离了“信息孤岛”时代,进入了集成财务、生产制造、供应链、人力资源、经营决策的企业信息化时代,会计信息系统不再是孤立的系统,会计信息系统不再单独地服务于部门需求,会计信息会随着更准确的输入、更深层次的加工、更实时的处理以及满足了更多样的需求而为企业带来了更多的增值服务。
当然并非所有企业都适用c/s、erp,所有企业都应该对自己的信息化程度进行正确定位,无论企业规模大小,无论企业的硬件架构和所选用的软件层次如何,不可否认的是企业一并进入了信息化时代。可见,会计信息化取代会计电算化已是趋势使然。
信息通信的概念篇5
一、信息素养是信息化社会对人类提出的新要求
(一)信息素养概念的产生和发展
信息素养概念的酝酿始于美国图书检索技能的演变。1974年,美国信息产业协会主席保罗·泽考斯基率先提出了信息素养这一全新概念,并解释为:"利用大量的信息工具及主要信息资源使问题得到解答问题时利用信息的技术和技能。信息素养概念一经提出,便得到广泛传播和使用。首先是在教育领域。1983年,美国信息学家霍顿提出要在教育部门开设信息素养课程,以提高人们对电子邮政、资料分析以及图书馆网络的使用能力。日本学者增田米二认为,教育要迎接信息化社会的挑战,唯有实施信息素养教育。与此同时,世界各国的研究机构纷纷围绕如何提高信息素养展开了广泛的探索和深入的研究,对信息素养概念的界定、内涵和评价标准等提出了一系列新的见解。1987年信息学家PatrieiaBreivik将信息素养概括为一种了解提供信息的系统并能鉴别信息价值、选择获取信息的最佳渠道、掌握获取和存储信息的基本技能。1989年美国图书馆协会(ALA)下设的"信息素养总统委员会"在其年度报告中对信息素养的含义进行了重新概括:"要成为一个有信息素养的人,就必须能够确定何时需要信息并且能够有效地查寻、评价和使用所需要的信息。"1992年,Doyle在《信息素养全美论坛的终结报告》中将信息素养定义为:一个具有信息素养的人,他能够认识到精确的和完整的信息是做出合理决策的基础,确定对信息的需求,形成基于信息需求的问题,确定潜在的信息源,制定成功的检索方案,从包括基于计算机和其他信息源获取信息、评价信息、组织信息于实际的应用,将新信息与原有的知识体系进行融合以及在批判性思考和问题解决的过程中使用信息。
我国对信息素养问题的研究起步较晚。近年来,教育、科技、文化等领域奋起直追,取得了可喜的成果。钟启泉、王吉庆教授全面分析研究了信息时代对教育工作提出的挑战和机遇,对教师信息素养提出了一系列新的见解。他们认为,信息素养是"一种可以通过教育所培育的,在信息社会中获得信息、利用信息、开发信息方面的修养与能力。"这个见解丰富了对信息素养的研究,也在一定程度上反映了我国在该研究领域的主流思想。
(二)信息素养概念产生的巨大影响
信息素养概念的产生,使人们对自身现有的素质结构、学习方式、文化传统等开始了审慎反思。伴随着这些思考,许多符合信息时展的新思想观念和行为方式相继产生,并成为人们普遍追求的亮点。
信息通信的概念篇6
识、又掌握了方法,培养能力,从而真正实现物理概念教学的目的。
一、呈现物理情景,引入概念
建构主义认为:“学生的知识不是通过教师传授获得的,而是学生在一定的情境中,借助教师和同学的帮助,利用必要的学习资源,通过一定建构的方式获得的。”因此,在物理概念引入教学中,运用信息技术呈现物理情景,能使学生在视觉、听觉等多种感官上全方位地受到刺激,从而有效激发学生的好奇心,点燃学生的思维火花。
如,“动能”教学时,我把龙卷风、海啸、水库放水等动态视频组合在一起加以呈现,学生看到大树拔起、车辆掀翻、堤坝冲毁、房屋倒塌的画面后非常震感,也提了许多问题:“龙卷风怎么形成的?力量怎么样厉害?”“水狂泻下怎么会如此厉害?这是什么能量?”……这样以信息技术呈现物理现象,无论是视觉效果还是听觉效果,都能给学生深刻的印象,让学生对自然界物体具有的某种“能力”获得一种强烈的感受和直观的认识,从而为建立“动能”的概念打下基础。
因此,在物理概念教学中初中物理,创设与形成物理概念有关的生动的、新颖的情境,使学生感知大量的感性材料,对物理现象有一个明晰的印象,有利于学生形成正确的物理概念,加深理解物理规律。
二、揭示本质属性,理解概念
物理概念的建立过程是在物理环境中学生通过观察、实验获取必要的感性知识,并与自己认知结构中原有的概念相联系的基础上,通过同化或顺应不断加深认识和理解概念的。因此,在教学中运用信息技术为学生提供充分的感性认识的基础上,引导学生进行分析、综合、抽象,摒弃现象和过程中那些表面的、偶然的、次要的等非本质的东西,以揭示现象和过程的本质属性。
如,“重力”教学时,我先播放铅球和跳高比赛的视频录像,然后提出问题:奋力投出的铅球和跃过横杆的运动员最终会处于怎样的状态?这样的竞技项目挑战的是人类的什么极限?问题的提出,激起了学生浓厚的兴趣。待学生回答之后,再播放神舟七号航天飞船成功升上太空和宇航员在飞船舱内的生活和工作情景的视频,再一次提出问题让学生思考:在远离地球的太空中,宇航员可以用任意的姿势“漂浮”在船舱中,这又是什么原因呢?
这样,借助信息技术展示现实生活中的重力现象,丰富了学生的感知,激发了学生积极思维,在鲜明对比的情境中,抽象概括出重力概念的本质属性,使学生深刻认识到:重力是由于地球的吸引而产生的。
三、突破教学难点,深化概念
将物理学科教学与信息技术整合,利用信息技术辅助教学无疑为课程目标的实现提供了近乎完美的渠道。信息技术独有的“模拟”作用,不仅能真实生动地再现各种难以理解的、抽象的物理知识,激励学生参与教学过程,而且可以有效突破物理教学中的重点和难点问题,深化概念规律的理解。
如,“电流”一节,难点是学生无法观察到电流的形成与方向,因此,电流的概念理解起来比较困难。在教学时,我利用Flash软件进行仿真“模拟”,把电池组、小灯泡、开关、导线连成实物电路。然后闭合开关,电流(用红色线条表示)从电源正极(用“+”表示)流出,通过小灯泡时,灯泡发光,最后回到负极(用“一”表示),形象、直观一目了然。师生通过对这一直观模拟实验的观察、分析、归纳和总结,很快就能够理解电流的形成、方向这一重点、难点,对“电流”的概念也就有了更深层次的理解。
因此,在物理教学中,教师应充分利用信息技术教学手段,根据教学内容精心设计,把抽象的、枯燥的物理知识原理转化为生动的、具体的图像,帮助学生在头脑中建立正确模型免费。从而有效突破教学难点,加深对物理概念的理解。
四、动态分析过程,活化概念
物理概念与规律的教学是物理教学的核心。物理现象、物理过程的相互联系及其发展趋势是靠物理规律建立的。在物理规律教学中拓展概念教学,运用信息技术的动态变化功能,进一步揭示和理解相关概念之间的相互关系,形象直观地“顿悟”概念的内涵。这有利于概念知识沿网状同化,从而达到活化概念的目的。如,有关滑动变阻器的滑片移动时初中物理,电流表、电压表示数变化情况的判断以及变化范围的计算问题,一直是历年中考物理试题和各种物理竞赛中的热点。而学生普遍感到此类题难度大,得分率也较低。如右图所示的电路中,滑动变阻器R2的
滑片P向右移动。请分析电流表和电压表的变化情况。教师在引导学生分析时,可充分利用信息技术的动态变化功能,制成课件进行以下动态分析:把电压表和电流表等效替换,电压表等效于开路,电流表等效于一条导线。由此不难看出,电路中的电流只有一条道路,即串联电路,电压表测量的事滑动变阻器的电压。
这样,运用信息技术对电路进行动态分析,既让学生充分理解了电路的规律,也加深学生对电学部分相关概念的具体认识,深化和活化了物理概念,收到良好的教学效果。
五、加强练习反馈,巩固概念
课堂练习的检测与反馈是打造高效课堂的重要环节。通过反馈练习可以使学生深化概念,提高学习效率,加强对所学概念的理解和巩固。利用现代信息技术贮量大、速度快的特点,对学生进行有针对性的训练和检测,为学生创造了一种悦目、悦耳、悦心的效果,高效率地提高理解概念的程度。
如,九年级“惯性”一节复习检测中,我用多媒体播放飞机正确投掷救灾物质的动画视频,同时提出问题:飞机投掷救灾物质为什么要提前投掷?让学生用本堂课所学知识来回答。这样就把学生思维引向深入,不仅培养了学生分析问题和解决问题的能力,而且通过练习深化了对“惯性”概念的理解。
因此,利用多媒体信息技术图文并茂、生动直观的特点巧设练习,不仅突出了联系的针对性、有效性,而且还能极大地激发学生学习的积极性、主动性和创造性,为培养学生的创新精神和实践能力开辟了广阔途径。
【参考文献】
[1]物理课程标准(实验稿).[M].北京师范大学出版社,2001.7




