知秋数据库
‘壹’ 信息世界指的是什么
信息世界:是现实世界在人们头脑中的反映。 从事物的特性到计算机中的数据表示,经历了三个领域:现实世界、信息世界、机器世界。 (1) 现实世界:存在于人们头脑之外的客观世界,称为现实世界。 (2) 信息世界:是现实世界在人们头脑中的反映。 (3) 机器世界:信息世界的信息在机器世界中以数据形式存储。 信息世界中数据描述的术语有:实体、实体集、属性、实体标识符 机器世界中数据描述的术语有:字段、记录、文件、关键码 它们的对应关系是: 在数据库中每个概念都有类型和值之区分,类型是概念的内涵,值是概念的外延 (一)关于信息的知识 1、什么是信息 信息的定义 对于信息的定义呈现出多定义而又无定论的局面,这一局面的形成是由于观察事物的多维视野造成的。多维视野是现代自然科学、社会科学、人文科学以及横向科学研究的一个显着特点,因此,不同学科有不同的信息定义,即棚塌使是同一学科也可能出现差异很大的命题。在信息的定义这一问题上,也是如此,自然科学、信息科学、管理科学中所说的信息常常不是一回事,前者多指数据、指令,后者多指消息、情报,但即便如此,同属社会科学的消息、情报与信息也有一定的差距。 信息化的创始人香农和韦弗1948年在《通信的数学理论》中指出:“凡是在一种情况下能减少不确定性的任何事物都叫做信息(information)。”这一定义是从通信科学的角度来探讨信息概念的,排除了信息的语义因素的定义,不考虑信息的含义价值,特指一种形式信息和统计概率信息因此不能直接用于研究人类的信息传播。但这一定义指出了信息的一个价值——减少不确定性,这是信息的认知知识功能,即当一个信息为人们所感知和确认后,这一信息就成为一定意义上的知识,形成后的知识又可以作为信息来传递(冗余信息);而尚未被认识的原始,则成为人们努力探讨的对象,在尚未认识它们之前还不是知识(未知信息)。 控制论的创始人维纳对信息的定义是:“信息就是我们在适应外部世界,并且使这种适应所作用于外部世界的过程中,同外部世界进行交换的内容的名称。”这一定义深入到了人与世界的交换关系,涉及交换内容,因此比前一个定义更适合用于研究探索人类的信息传播。 这一定义的贡献与缺陷都是明显的。一方面,他确认了信息是人类主观世界与客观世界间的桥梁,客观世界作用于主观世界,主观世界反作用于客观世界,都必须依靠信息的媒介作用,人的大脑是个信息处理中心,在不断地接受、处理、储存来自人体内部和外部的种种信息,并利用这些信息来改造成客观世界。但另一方面,这个定义将凡是我们同外部世界进行交换的内容都称为信息,我们知道世界由物质、能量和信息组成,三者密切相关,但各不相同,信息虽然具有物质属性,但不是物质实体本身,同样,信息可以转化为能量、但不是能量本身,信息是由事物发出的信息、指令、数据、信号等所包含的内容。 我国国家标准GB489885《情报与文献工作词汇基本术语》中,关于“信息”的解释是:“Information物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。” 这个定义首先明确了信息的本质是物质的属性,而不是物质实体本身。客观存在的一切事物,包括自然界、人体本身和人类社会,都是在不断运动着的,运动的物质,必然会产生相互作用和影响,从而引起物质结构、数量等多方面的变化,事物的这些变化,便成为信息产生的物质基础。因此,信息不是事物本身,而是由事物发出的数据、消息中所包含的意义。 这个定义中首先弥补了信息论中对信息定义的特定指向性——即只描述了非人类、非语义层的信息概念,把信息这一概念放到人类社会以及人类交往中考察,也纠正了控制论信息定义中对信息概念的泛化倾向,继而明确指出信息是物质的属性,而不是事物本身,是由事物发出的消息、指令、数据、信号等所包含的内容,是数据、消息中的意义。 同时,这一定义明确了信息的认知知识的功能,即能减少不确定性的能力,可以说,信息是知识的源泉,知识是对获得信息进行处理并使之系统化的结果。这一功能是信息伏芹的基本功能,是人类解释客观世界发展规律的重要途径,知识的积累、科技的发展进步、经济文化的繁荣,都离不开信息的这一功能,经过大脑对信息的鉴别、筛选、归纳、提炼和存储,人类对客观世界的认识逐步深入,人类逐步进化、进步、发展。 其次,这一定义明确了信息是指数据与消息中所包含的意义,是数据与消息这样的讯息中所包含的内容,区分了信息与讯息,从结构上使信息的概念更加准确。 《辞海》:信息是指对消息接受者来说预先不知道的报道。 心理学:信息是存在于意识之外的东西,它存在于自然界、印刷品、硬盘以及空气之中。 描述定义:信息是用语言、文字、数字、符号、图象、声音、情景、表情、状态等方式传递的内容。 从测量角度:信息是事物特性的可转换量和实际转换量的综合量度。 人脑的大部分信息是通过视觉和感觉器官获得的。信息,不是新冒出来的事物,本来就广泛存在于自然与社会之中。古人日出而作、日落而息,正是依靠太阳东升西落带来的信息确定时间的。南雁告春,是动物带来了春天的信息;一叶知秋,是植物送来了秋天的信息。 学生坐在教室里学习,与亲友、朋友们通信,看电影、电视,也是在接受信息。信息包含了人们以往不知道或者不能确定的东西。因此,消息、新闻、报道、资料、情报都是一种信息。知识也是一种信息,是经过人们提炼、加工、系统化了的信息。 2、信息的特点 信息是活的,是在不断扩充的。牛顿是伟大的科学家,用今天的眼光来看牛顿那个时代,就会感到那时的信息少得可怜。也可以预计,再过30年、100年,信息会多得令人吃惊。我们掌握的信息越多,用得越多,用处也越大。 信息是可以压缩与还原的。比如,很多复杂的现象,可以归纳成一条简明的定律;一大堆数据之间的关系,可以用一个方程式来表达。这就是说,人们能够对信息进行集中、综合和概括。同时,也能将压缩了的信息展开。 信息是可以存贮的。信息有一定的载体,远古时代人们只能用大脑来保存信息,后来有了文字,就用文字来记存各种信息。人们把文字镌刻在物质载体上,例如古巴比伦的泥板、古埃及的莎草纸,古代中国的青铜鼎、竹简、布帛等,以及在任何古代民族可见的石碑、石刻等等,大凡物质的东西都可以用符号的方式记录信息,因如,信息可以通过载体储存和传播。除此之外,信息还可以借助图象、声音、情景、表情、状态等方式进行传递。今天,人们还可以用电子计算机及其他自动装置保存信息。 信息也是需要加工的。例如,4×6-7=17,就是一个简单的信息加工。等号左侧是原始信息,右侧是加了工的信息。将英语译成汉语,也是信息加工。英语是原料,汉语是成品;后者对中国人更有用。此外,像经营决策、情报检索、资料分析、自动控制,甚至下棋、打扑克都是一种信息加工。 信息处理是指将信息缩小、放大、分类、编辑、分析、计算,加工成某种要求的数据形式,如绘制图形、打印报表等。 过去,信息加工大多依靠人的大脑来完成。在信息量小、变化缓慢的时代,大脑还能对付。到了今天,信息迅速膨胀,瞬息万变,竞争激烈,只依靠大脑进行信息加工已经不行了,信息加工也要机械化自动化,就非用机器不行了。电子计算机(俗称电脑),就是用来进行信息加工的机器,它能够以超凡的速度、惊人的记忆力,来完成大脑所无法完成的信息加工。加工业的发展,建立了以各种机器为基础的工业,带来了工业化的社会。信息加工的不断发展,毫无疑问,将建立起以各种电脑为基础的信息工业,将人类引入信息化的社会。 3、信息的传输 静止的信息本身并没有实际意义。信息只有通过交流才能发挥效益。只有当信息借助与载体进行传播的时候,才具有了实际意义。通过信息交流,人们能够了解别人,认识世界,并传达自己的思想,正是信息的广泛传播,赋予了人类区别于任何其他动物具有了发达的智慧,改变着这个世界,也改变着我们的生活。 人类最古老的媒介不是别的东西,而是人的身体本身,人们使用手、脸等身体部位来进行动作、表情等非语言传播。然后才产生了语言。一些人类学家认为,语言是在10万年前出现的。 大约纪元前2万年左右,人类用图画来表达他们的思想。他们的作品今天在法国北部的山洞里依旧可见。他们在这些洞壁上留下了驯鹿、野马和一些灭绝的动物的绘画。在史前的不同时期,这些壁画一定是由那些最富创造力的人类创作的,是史前人类最原始的媒介之一。 人们还在树上刻标记以指明路线,用堆石头表示方向或边界。在有文字以前的社会中,人类把表达深远意义的装饰性图案做在陶器、编织物、雕刻和其他简陋的日常用品上。 烽烟和旗鼓曾是古代
‘贰’ RPA是什么技术
RPA是自动化流程,低代码开发工具。
RPA主要通过各种封装好的控件,让用户能利用拖拉拽控件,简单的操作生成自动化流程,在电脑上实现浏览器、应用程序自动鼠标点击、键盘输入;excel操作;数据处理;数据库增删改查;定时执行;自动生成交互界面等等。
传统的RPA技术已出现多年,最早可追溯到1994年微软发布Excel 5.0中Macroinstruction(宏指令)功能,早期这类编程工具如批处理脚本和触发器等皆为RPA的雏形,微软孕育了大部分底层自动化框架和技术。
随着数据库和编程技术的成熟,专业的RPA工具从21世纪初开始不断建立发展,国内外诞生UiPath、Blue Prism、Automation Anywhere、弘玑Cyclone等RPA企业。
从底层技术看,目前市场上的RPA厂商大部分建立于微软.net Framework框架,有的利用WorkflowFoundation(流程软件)开发,可调用Windows系统中office的原生API;有的基于.net Framework的框架,利用开源或其他自研技术从底层自建体系;还有一部分则是在.net Framework上利用现代编程如C++、python技术,实现RPA的自动化功能。此外,国内还有少部分厂商脱离了微软.net Framework框架,利用其他语言/框架自行研发,以实现与国产系统更好的兼容,比如弘玑Cyclone。
从业务层面,RPA的三个核心技术分别是屏幕抓取、业务流程自动化管理和人工智能。屏幕抓取主要用于选取指定对象后,模拟人的行为进行鼠标点击、键盘输入,而业务流程自动化管理可以将更多其他操作比如excel处理,逻辑判断等结合起来,形成可以稳定按照指定规则运行的自动化流程。AI能力则进一步扩展了RPA的能力边界,比如发票OCR识别、合同NLP语义分析,使得RPA变得更加智能,进一步处理一些漫长而复杂的任务。