成就存储专家之路存储从入门到精通
㈠ 如何快速成为数据分析师
接下来我们分别从每一个部分讲讲具体应该学什么、怎么学。
数据获取:公开数据、python爬虫
如果接触的只是企业数据库里的数据,不需要要获取外部数据的,这个部分可以忽略。
外部数据的获取方式主要有以下两种。
第一种是获取外部的公开数据集,一些科研机构、企业、政府会开放一些数据,你需要到特定的网站去下载这些数据。这些数据集通常比较完善、质量相对较高。
另一种获取外部数据费的方式就是爬虫。
比如你可以通过爬虫获取招聘网站某一职位的招聘信息,爬取租房网站上某城市的租房信息,爬取豆瓣评分评分最高的电影列表,获取知乎点赞排行、网易云音乐评论排行列表。基于互联网爬取的数据,你可以对某个行业、某种人群进行分析。
在爬虫之前你需要先了解一些 Python 的基础知识:元素(列表、字典、元组等)、变量、循环、函数(链接的菜鸟教程非常好)……以及如何用成熟的 Python 库(urllib、BeautifulSoup、requests、scrapy)实现网页爬虫。如果是初学,建议从 urllib 和 BeautifulSoup 开始。(PS:后续的数据分析也需要 Python 的知识,以后遇到的问题也可以在这个教程查看)
网上的爬虫教程不要太多,爬虫上手推荐豆瓣的网页爬取,一方面是网页结构比较简单,二是豆瓣对爬虫相对比较友好。
掌握基础的爬虫之后,你还需要一些高级技巧,比如正则表达式、模拟用户登录、使用代理、设置爬取频率、使用cookie信息等等,来应对不同网站的反爬虫限制。
除此之外,常用的的电商网站、问答网站、点评网站、二手交易网站、婚恋网站、招聘网站的数据,都是很好的练手方式。这些网站可以获得很有分析意义的数据,最关键的是,有很多成熟的代码,可以参考。
数据存取:sql语言
你可能有一个疑惑,为什么没有讲到Excel。在应对万以内的数据的时候,Excel对于一般的分析没有问题,一旦数据量大,就会力不从心,数据库就能够很好地解决这个问题。而且大多数的企业,都会以SQL的形式来存储数据,如果你是一个分析师,也需要懂得SQL的操作,能够查询、提取数据。
SQL作为最经典的数据库工具,为海量数据的存储与管理提供可能,并且使数据的提取的效率大大提升。你需要掌握以下技能:
提取特定情况下的数据:企业数据库里的数据一定是大而繁复的,你需要提取你需要的那一部分。比如你可以根据你的需要提取2018年所有的销售数据、提取今年销量最大的50件商品的数据、提取上海、广东地区用户的消费数据……,SQL可以通过简单的命令帮你完成这些工作。
数据库的增、删、查、改:这些是数据库最基本的操作,但只要用简单的命令就能够实现,所以你只需要记住命令就好。
数据的分组聚合、如何建立多个表之间的联系:这个部分是SQL的进阶操作,多个表之间的关联,在你处理多维度、多个数据集的时候非常有用,这也让你可以去处理更复杂的数据。
数据预处理:Python(pandas)
很多时候我们拿到的数据是不干净的,数据的重复、缺失、异常值等等,这时候就需要进行数据的清洗,把这些影响分析的数据处理好,才能获得更加精确地分析结果。
比如空气质量的数据,其中有很多天的数据由于设备的原因是没有监测到的,有一些数据是记录重复的,还有一些数据是设备故障时监测无效的。比如用户行为数据,有很多无效的操作对分析没有意义,就需要进行删除。
那么我们需要用相应的方法去处理,比如残缺数据,我们是直接去掉这条数据,还是用临近的值去补全,这些都是需要考虑的问题。
对于数据预处理,学会 pandas 的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:
选择:数据访问(标签、特定值、布尔索引等)
缺失值处理:对缺失数据行进行删除或填充
重复值处理:重复值的判断与删除
空格和异常值处理:清楚不必要的空格和极端、异常数据
相关操作:描述性统计、Apply、直方图等
合并:符合各种逻辑关系的合并操作
分组:数据划分、分别执行函数、数据重组
Reshaping:快速生成数据透视表
概率论及统计学知识
数据整体分布是怎样的?什么是总体和样本?中位数、众数、均值、方差等基本的统计量如何应用?如果有时间维度的话随着时间的变化是怎样的?如何在不同的场景中做假设检验?数据分析方法大多源于统计学的概念,所以统计学的知识也是必不可少的。需要掌握的知识点如下:
基本统计量:均值、中位数、众数、百分位数、极值等
其他描述性统计量:偏度、方差、标准差、显着性等
其他统计知识:总体和样本、参数和统计量、ErrorBar
概率分布与假设检验:各种分布、假设检验流程
其他概率论知识:条件概率、贝叶斯等
有了统计学的基本知识,你就可以用这些统计量做基本的分析了。通过可视化的方式来描述数据的指标,其实可以得出很多结论了,比如排名前100的是哪些,平均水平是怎样的,近几年的变化趋势如何……
你可以使用python的包 Seaborn(python包)在做这些可视化的分析,你会轻松地画出各种可视化图形,并得出具有指导意义的结果。了解假设检验之后,可以对样本指标与假设的总体指标之间是否存在差别作出判断,已验证结果是否在可接受的范围。
python数据分析
如果你有一些了解的话,就知道目前市面上其实有很多 Python 数据分析的书籍,但每一本都很厚,学习阻力非常大。但其实真正最有用的那部分信息,只是这些书里很少的一部分。比如用 Python 实现不同案例的假设检验,其实你就可以对数据进行很好的验证。
比如掌握回归分析的方法,通过线性回归和逻辑回归,其实你就可以对大多数的数据进行回归分析,并得出相对精确地结论。比如DataCastle的训练竞赛“房价预测”和“职位预测”,都可以通过回归分析实现。这部分需要掌握的知识点如下:
回归分析:线性回归、逻辑回归
基本的分类算法:决策树、随机森林……
基本的聚类算法:k-means……
特征工程基础:如何用特征选择优化模型
调参方法:如何调节参数优化模型
Python 数据分析包:scipy、numpy、scikit-learn等
在数据分析的这个阶段,重点了解回归分析的方法,大多数的问题可以得以解决,利用描述性的统计分析和回归分析,你完全可以得到一个不错的分析结论。
当然,随着你实践量的增多,可能会遇到一些复杂的问题,你就可能需要去了解一些更高级的算法:分类、聚类,然后你会知道面对不同类型的问题的时候更适合用哪种算法模型,对于模型的优化,你需要去学习如何通过特征提取、参数调节来提升预测的精度。这就有点数据挖掘和机器学习的味道了,其实一个好的数据分析师,应该算是一个初级的数据挖掘工程师了。
系统实战
这个时候,你就已经具备了数据分析的基本能力了。但是还要根据不同的案例、不同的业务场景进行实战。能够独立完成分析任务,那么你就已经打败市面上大部分的数据分析师了。
如何进行实战呢?
上面提到的公开数据集,可以找一些自己感兴趣的方向的数据,尝试从不同的角度来分析,看看能够得到哪些有价值的结论。
另一个角度是,你可以从生活、工作中去发现一些可用于分析的问题,比如上面说到的电商、招聘、社交等平台等方向都有着很多可以挖掘的问题。
开始的时候,你可能考虑的问题不是很周全,但随着你经验的积累,慢慢就会找到分析的方向,有哪些一般分析的维度,比如top榜单、平均水平、区域分布、年龄分布、相关性分析、未来趋势预测等等。随着经验的增加,你会有一些自己对于数据的感觉,这就是我们通常说的数据思维了。
你也可以看看行业的分析报告,看看优秀的分析师看待问题的角度和分析问题的维度,其实这并不是一件困难的事情。
在掌握了初级的分析方法之后,也可以尝试做一些数据分析的竞赛,比如 DataCastle 为数据分析师专门定制的三个竞赛,提交答案即可获取评分和排名:
员工离职预测训练赛
美国King County房价预测训练赛
北京PM2.5浓度分析训练赛
种一棵树最好的时间是十年前,其次是现在。现在就去,找一个数据集开始吧!!
㈡ 大学生如何学习
大学生的学习,其实最主要的还是课堂上的认真听讲,课后根据自己的兴趣去考研,考公,或者其他的一些技能的学习。接下来主要说下课堂上的学习。
首先,将手机关机,许多学生在上课的时候总会情不自禁的拿起手机来进行打游戏,看电视剧,或者聊天等行为,这就造成了不能在课堂上认真听讲的局面。可能有的学生会说,我们的笔记比较多,我们需要手机进行拍照然后进行笔记的记录,但是什么也不如“烂笔头”所以说手机终究是一个辅助工具,真正的学习还是要靠我们自己,所以说上课之前,将手机关机,或者教室里有收纳篮的话,可以放在那里面。
以上是课上认真听讲的一部分,课后的学习主要是靠自己的自制力,有明确的目标,知道自己要去做什么,知道自己怎么做,自己对未来的规划是什么,是继续学习深造,还是早点步入社会积累经验,这些都对自己接下来的行为有所影响的。
㈢ 如何成为一个数据分析师需要具备哪些技能
接下来我们分别从每一个部分讲讲具体应该学什么、怎么学。
数据获取:公开数据、Python爬虫
如果接触的只是企业数据库里的数据,不需要要获取外部数据的,这个部分可以忽略。
外部数据的获取方式主要有以下两种。
第一种是获取外部的公开数据集,一些科研机构、企业、政府会开放一些数据,你需要到特定的网站去下载这些数据。这些数据集通常比较完善、质量相对较高。
另一种获取外部数据费的方式就是爬虫。
比如你可以通过爬虫获取招聘网站某一职位的招聘信息,爬取租房网站上某城市的租房信息,爬取豆瓣评分评分最高的电影列表,获取知乎点赞排行、网易云音乐评论排行列表。基于互联网爬取的数据,你可以对某个行业、某种人群进行分析。
在爬虫之前你需要先了解一些 Python 的基础知识:元素(列表、字典、元组等)、变量、循环、函数(链接的菜鸟教程非常好)……以及如何用成熟的 Python 库(urllib、BeautifulSoup、requests、scrapy)实现网页爬虫。如果是初学,建议从 urllib 和 BeautifulSoup 开始。(PS:后续的数据分析也需要 Python 的知识,以后遇到的问题也可以在这个教程查看)
网上的爬虫教程不要太多,爬虫上手推荐豆瓣的网页爬取,一方面是网页结构比较简单,二是豆瓣对爬虫相对比较友好。
掌握基础的爬虫之后,你还需要一些高级技巧,比如正则表达式、模拟用户登录、使用代理、设置爬取频率、使用cookie信息等等,来应对不同网站的反爬虫限制。
除此之外,常用的的电商网站、问答网站、点评网站、二手交易网站、婚恋网站、招聘网站的数据,都是很好的练手方式。这些网站可以获得很有分析意义的数据,最关键的是,有很多成熟的代码,可以参考。
数据存取:SQL语言
你可能有一个疑惑,为什么没有讲到Excel。在应对万以内的数据的时候,Excel对于一般的分析没有问题,一旦数据量大,就会力不从心,数据库就能够很好地解决这个问题。而且大多数的企业,都会以SQL的形式来存储数据,如果你是一个分析师,也需要懂得SQL的操作,能够查询、提取数据。
SQL作为最经典的数据库工具,为海量数据的存储与管理提供可能,并且使数据的提取的效率大大提升。你需要掌握以下技能:
提取特定情况下的数据:企业数据库里的数据一定是大而繁复的,你需要提取你需要的那一部分。比如你可以根据你的需要提取2018年所有的销售数据、提取今年销量最大的50件商品的数据、提取上海、广东地区用户的消费数据……,SQL可以通过简单的命令帮你完成这些工作。
数据库的增、删、查、改:这些是数据库最基本的操作,但只要用简单的命令就能够实现,所以你只需要记住命令就好。
数据的分组聚合、如何建立多个表之间的联系:这个部分是SQL的进阶操作,多个表之间的关联,在你处理多维度、多个数据集的时候非常有用,这也让你可以去处理更复杂的数据。
数据预处理:Python(pandas)
很多时候我们拿到的数据是不干净的,数据的重复、缺失、异常值等等,这时候就需要进行数据的清洗,把这些影响分析的数据处理好,才能获得更加精确地分析结果。
比如空气质量的数据,其中有很多天的数据由于设备的原因是没有监测到的,有一些数据是记录重复的,还有一些数据是设备故障时监测无效的。比如用户行为数据,有很多无效的操作对分析没有意义,就需要进行删除。
那么我们需要用相应的方法去处理,比如残缺数据,我们是直接去掉这条数据,还是用临近的值去补全,这些都是需要考虑的问题。
对于数据预处理,学会 pandas 的用法,应对一般的数据清洗就完全没问题了。需要掌握的知识点如下:
选择:数据访问(标签、特定值、布尔索引等)
缺失值处理:对缺失数据行进行删除或填充
重复值处理:重复值的判断与删除
空格和异常值处理:清楚不必要的空格和极端、异常数据
相关操作:描述性统计、Apply、直方图等
合并:符合各种逻辑关系的合并操作
分组:数据划分、分别执行函数、数据重组
Reshaping:快速生成数据透视表
概率论及统计学知识
数据整体分布是怎样的?什么是总体和样本?中位数、众数、均值、方差等基本的统计量如何应用?如果有时间维度的话随着时间的变化是怎样的?如何在不同的场景中做假设检验?数据分析方法大多源于统计学的概念,所以统计学的知识也是必不可少的。需要掌握的知识点如下:
基本统计量:均值、中位数、众数、百分位数、极值等
其他描述性统计量:偏度、方差、标准差、显着性等
其他统计知识:总体和样本、参数和统计量、ErrorBar
概率分布与假设检验:各种分布、假设检验流程
其他概率论知识:条件概率、贝叶斯等
有了统计学的基本知识,你就可以用这些统计量做基本的分析了。通过可视化的方式来描述数据的指标,其实可以得出很多结论了,比如排名前100的是哪些,平均水平是怎样的,近几年的变化趋势如何……
你可以使用python的包 Seaborn(python包)在做这些可视化的分析,你会轻松地画出各种可视化图形,并得出具有指导意义的结果。了解假设检验之后,可以对样本指标与假设的总体指标之间是否存在差别作出判断,已验证结果是否在可接受的范围。
python数据分析
如果你有一些了解的话,就知道目前市面上其实有很多 Python 数据分析的书籍,但每一本都很厚,学习阻力非常大。但其实真正最有用的那部分信息,只是这些书里很少的一部分。比如用 Python 实现不同案例的假设检验,其实你就可以对数据进行很好的验证。
比如掌握回归分析的方法,通过线性回归和逻辑回归,其实你就可以对大多数的数据进行回归分析,并得出相对精确地结论。比如DataCastle的训练竞赛“房价预测”和“职位预测”,都可以通过回归分析实现。这部分需要掌握的知识点如下:
回归分析:线性回归、逻辑回归
基本的分类算法:决策树、随机森林……
基本的聚类算法:k-means……
特征工程基础:如何用特征选择优化模型
调参方法:如何调节参数优化模型
Python 数据分析包:scipy、numpy、scikit-learn等
在数据分析的这个阶段,重点了解回归分析的方法,大多数的问题可以得以解决,利用描述性的统计分析和回归分析,你完全可以得到一个不错的分析结论。
当然,随着你实践量的增多,可能会遇到一些复杂的问题,你就可能需要去了解一些更高级的算法:分类、聚类,然后你会知道面对不同类型的问题的时候更适合用哪种算法模型,对于模型的优化,你需要去学习如何通过特征提取、参数调节来提升预测的精度。这就有点数据挖掘和机器学习的味道了,其实一个好的数据分析师,应该算是一个初级的数据挖掘工程师了。
系统实战
这个时候,你就已经具备了数据分析的基本能力了。但是还要根据不同的案例、不同的业务场景进行实战。能够独立完成分析任务,那么你就已经打败市面上大部分的数据分析师了。
如何进行实战呢?
上面提到的公开数据集,可以找一些自己感兴趣的方向的数据,尝试从不同的角度来分析,看看能够得到哪些有价值的结论。
另一个角度是,你可以从生活、工作中去发现一些可用于分析的问题,比如上面说到的电商、招聘、社交等平台等方向都有着很多可以挖掘的问题。
开始的时候,你可能考虑的问题不是很周全,但随着你经验的积累,慢慢就会找到分析的方向,有哪些一般分析的维度,比如top榜单、平均水平、区域分布、年龄分布、相关性分析、未来趋势预测等等。随着经验的增加,你会有一些自己对于数据的感觉,这就是我们通常说的数据思维了。
你也可以看看行业的分析报告,看看优秀的分析师看待问题的角度和分析问题的维度,其实这并不是一件困难的事情。
在掌握了初级的分析方法之后,也可以尝试做一些数据分析的竞赛,比如 DataCastle 为数据分析师专门定制的三个竞赛,提交答案即可获取评分和排名:
员工离职预测训练赛
美国King County房价预测训练赛
北京PM2.5浓度分析训练赛
种一棵树最好的时间是十年前,其次是现在。现在就去,找一个数据集开始吧!!
㈣ 大数据培训学校学哪些内容
首先我们要了解java语言和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后。
大数据
大数据
Java :只要了解一些基础即可,做大数据不需要很深的Java 技术,学java SE 就相当于有学习大数据基础。
Linux:因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置,能少踩很多坑,学会shell就能看懂脚本这样能更容易理解和配置大数据集群。还能让你对以后新出的大数据技术学习起来更快。
Hadoop:这是现在流行的大数据处理平台几乎已经成为大数据的代名词,所以这个是必学的。Hadoop里面包括几个组件HDFS、MapRece和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapRece是对数据进行处理计算的,它有个特点就是不管多大的数据只要给它时间它就能把数据跑完,但是时间可能不是很快所以它叫数据的批处理。
Zookeeper:这是个万金油,安装Hadoop的HA的时候就会用到它,以后的Hbase也会用到它。它一般用来存放一些相互协作的信息,这些信息比较小一般不会超过1M,都是使用它的软件对它有依赖,对于我们个人来讲只需要把它安装正确,让它正常的run起来就可以了。
Mysql:我们学习完大数据的处理了,接下来学习学习小数据的处理工具mysql数据库,因为一会装hive的时候要用到,mysql需要掌握到什么层度那?你能在Linux上把它安装好,运行起来,会配置简单的权限,修改root的密码,创建数据库。这里主要的是学习SQL的语法,因为hive的语法和这个非常相似。
Sqoop:这个是用于把Mysql里的数据导入到Hadoop里的。当然你也可以不用这个,直接把Mysql数据表导出成文件再放到HDFS上也是一样的,当然生产环境中使用要注意Mysql的压力。
Hive:这个东西对于会SQL语法的来说就是神器,它能让你处理大数据变的很简单,不会再费劲的编写MapRece程序。有的人说Pig那?它和Pig差不多掌握一个就可以了。
Oozie:既然学会Hive了,我相信你一定需要这个东西,它可以帮你管理你的Hive或者MapRece、Spark脚本,还能检查你的程序是否执行正确,出错了给你发报警并能帮你重试程序,最重要的是还能帮你配置任务的依赖关系。我相信你一定会喜欢上它的,不然你看着那一大堆脚本,和密密麻麻的crond是不是有种想屎的感觉。
Hbase:这是Hadoop生态体系中的NOSQL数据库,他的数据是按照key和value的形式存储的并且key是唯一的,所以它能用来做数据的排重,它与MYSQL相比能存储的数据量大很多。所以他常被用于大数据处理完成之后的存储目的地。
Kafka:这是个比较好用的队列工具,队列是干吗的?排队买票你知道不?数据多了同样也需要排队处理,这样与你协作的其它同学不会叫起来,你干吗给我这么多的数据(比如好几百G的文件)我怎么处理得过来,你别怪他因为他不是搞大数据的,你可以跟他讲我把数据放在队列里你使用的时候一个个拿,这样他就不在抱怨了马上灰流流的去优化他的程序去了,因为处理不过来就是他的事情。而不是你给的问题。当然我们也可以利用这个工具来做线上实时数据的入库或入HDFS,这时你可以与一个叫Flume的工具配合使用,它是专门用来提供对数据进行简单处理,并写到各种数据接受方(比如Kafka)的。
Spark:它是用来弥补基于MapRece处理数据速度上的缺点,它的特点是把数据装载到内存中计算而不是去读慢的要死进化还特别慢的硬盘。特别适合做迭代运算,所以算法流们特别稀饭它。它是用scala编写的。Java语言或者Scala都可以操作它,因为它们都是用JVM的。
㈤ 电脑的发展史是什么
电脑的发展史是:
计算工具的演化经历了由简单到复杂、从低级到高级的不同阶段,例如从“结绳记事”中的绳结到算筹、算盘计算尺、机械计算机等。它们在不同的历史时期发挥了各自的历史作用,同时也启发了现代电子计算机的研制思想。
1889年,美国科学家赫尔曼·何乐礼研制出以电力为基础的电动制表机,用以储存计算资料。
1930年,美国科学家范内瓦·布什造出世界上首台模拟电子计算机。
1946年2月14日,由美国军方定制的世界上第一台电子计算机“电子数字积分计算机”在美国宾夕法尼亚大学问世了。ENIAC是美国奥伯丁武器试验场为了满足计算弹道需要而研制成的,这台计算器使用了17840支电子管,大小为80英尺×8英尺,重达28t(吨),功耗为170kW,其运算速度为每秒5000次的加法运算,造价约为487000美元。
ENIAC的问世具有划时代的意义,表明电子计算机时代的到来。在以后60多年里,计算机技术以惊人的速度发展,没有任何一门技术的性能价格比能在30年内增长6个数量级。
电脑的发展趋势:
随着科技的进步,各种计算机技术、网络技术的飞速发展,计算机的发展已经进入了一个快速而又崭新的时代,计算机已经从功能单一、体积较大发展到了功能复杂、体积微小、资源网络化等。
计算机的未来充满了变数,性能的大幅度提高是不可置疑的,而实现性能的飞跃却有多种途径。不过性能的大幅提升并不是计算机发展的唯一路线,计算机的发展还应当变得越来越人性化,同时也要注重环保等等。
计算机从出现至今,经历了机器语言、程序语言、简单操作系统和Linux、Macos、Windows等现代操作系统四代,运行速度也得到了极大的提升,第四代计算机的运算速度已经达到几十亿次每秒。
计算机也由原来的仅供军事科研使用发展到人人拥有,计算机强大的应用功能,产生了巨大的市场需要,未来计算机性能应向着微型化、网络化、智能化和巨型化的方向发展。
㈥ 求生之路明明完成专家模式战役了,为什么成就里 有待证明 没有打勾
你需要从一个章节的第一关开始打才会有,一共五个章节,你可以看看你完成了多少个。
㈦ 阅读问题
计算机的发展历史
一、第一台计算机的诞生
第一台计算机(ENIAC)于1946年2月,在美国诞生。
ENIAC PC机
耗资 100万美圆 600美圆
重量 30吨 10kg
占地 150平方米 0.25平方米
电子器件 1.9万只电子管 100块集成电路
运算速度 5000次/秒 500万次/秒
二、计算机发展历史
1、第一代计算机(1946~1958)
电子管为基本电子器件;使用机器语言和汇编语言;主要应用于国防和科学计算;运算速度每秒几千次至几万次。
2、第二代计算机(1958~1964)
晶体管为主要器件;软件上出现了操作系统和算法语言;运算速度每秒几万次至几十万次。
3、第三代计算机(1964~1971)
普遍采用集成电路;体积缩小;运算速度每秒几十万次至几百万次。
4、第四代计算机(1971~ )
以大规模集成电路为主要器件;运算速度每秒几百万次至上亿次。
三、我国计算机发展历史
从1953年开始研究,到1958年研制出了我国第一台计算机
在1982年我国研制出了运算速度1亿次的银河I、II型等小型系列机。
计算机的历史
计算机是新技术革命的一支主力,也是推动社会向现代化迈进的活跃因素。计算机科学与技术是第二次世界大战以来发展最快、影响最为深远的新兴学科之一。计算机产业已在世界范围内发展成为一种极富生命力的战略产业。
现代计算机是一种按程序自动进行信息处理的通用工具,它的处理对象是信息,处理结果也是信息。利用计算机解决科学计算、工程设计、经营管理、过程控制或人工智能等各种问题的方法,都是按照一定的算法进行的。这种算法是定义精确的一系列规则,它指出怎样以给定的输入信息经过有限的步骤产生所需要的输出信息。
信息处理的一般过程,是计算机使用者针对待解抉的问题,事先编制程序并存入计算机内,然后利用存储程序指挥、控制计算机自动进行各种基本操作,直至获得预期的处理结果。计算机自动工作的基础在于这种存储程序方式,其通用性的基础则在于利用计算机进行信息处理的共性方法。
计算机的历史
现代计算机的诞生和发展 现代计算机问世之前,计算机的发展经历了机械式计算机、机电式计算机和萌芽期的电子计算机三个阶段。
早在17世纪,欧洲一批数学家就已开始设计和制造以数字形式进行基本运算的数字计算机。1642年,法国数学家帕斯卡采用与钟表类似的齿轮传动装置,制成了最早的十进制加法器。1678年,德国数学家莱布尼兹制成的计算机,进一步解决了十进制数的乘、除运算。
英国数学家巴贝奇在1822年制作差分机模型时提出一个设想,每次完成一次算术运算将发展为自动完成某个特定的完整运算过程。1884年,巴贝奇设计了一种程序控制的通用分析机。这台分析机虽然已经描绘出有关程序控制方式计算机的雏型,但限于当时的技术条件而未能实现。
巴贝奇的设想提出以后的一百多年期间,电磁学、电工学、电子学不断取得重大进展,在元件、器件方面接连发明了真空二极管和真空三极管;在系统技术方面,相继发明了无线电报、电视和雷达……。所有这些成就为现代计算机的发展准备了技术和物质条件。
与此同时,数学、物理也相应地蓬勃发展。到了20世纪30年代,物理学的各个领域经历着定量化的阶段,描述各种物理过程的数学方程,其中有的用经典的分析方法已根难解决。于是,数值分析受到了重视,研究出各种数值积分,数值微分,以及微分方程数值解法,把计算过程归结为巨量的基本运算,从而奠定了现代计算机的数值算法基础。
社会上对先进计算工具多方面迫切的需要,是促使现代计算机诞生的根本动力。20世纪以后,各个科学领域和技术部门的计算困难堆积如山,已经阻碍了学科的继续发展。特别是第二次世界大战爆发前后,军事科学技术对高速计算工具的需要尤为迫切。在此期间,德国、美国、英国部在进行计算机的开拓工作,几乎同时开始了机电式计算机和电子计算机的研究。
德国的朱赛最先采用电气元件制造计算机。他在1941年制成的全自动继电器计算机Z-3,已具备浮点记数、二进制运算、数字存储地址的指令形式等现代计算机的特征。在美国,1940~1947年期间也相继制成了继电器计算机MARK-1、MARK-2、Model-1、Model-5等。不过,继电器的开关速度大约为百分之一秒,使计算机的运算速度受到很大限制。
电子计算机的开拓过程,经历了从制作部件到整机从专用机到通用机、从“外加式程序”到“存储程序”的演变。1938年,美籍保加利亚学者阿塔纳索夫首先制成了电子计算机的运算部件。1943年,英国外交部通信处制成了“巨人”电子计算机。这是一种专用的密码分析机,在第二次世界大战中得到了应用。
1946年2月美国宾夕法尼亚大学莫尔学院制成的大型电子数字积分计算机(ENIAC),最初也专门用于火炮弹道计算,后经多次改进而成为能进行各种科学计算的通用计算机。这台完全采用电子线路执行算术运算、逻辑运算和信息存储的计算机,运算速度比继电器计算机快1000倍。这就是人们常常提到的世界上第一台电子计算机。但是,这种计算机的程序仍然是外加式的,存储容量也太小,尚未完全具备现代计算机的主要特征。
新的重大突破是由数学家冯·诺伊曼领导的设计小组完成的。1945年3月他们发表了一个全新的存储程序式通用电子计算机方案—电子离散变量自动计算机(EDVAC)。随后于1946年6月,冯·诺伊曼等人提出了更为完善的设计报告《电子计算机装置逻辑结构初探》。同年7~8月间,他们又在莫尔学院为美国和英国二十多个机构的专家讲授了专门课程《电子计算机设计的理论和技术》,推动了存储程序式计算机的设计与制造。
1949年,英国剑桥大学数学实验室率先制成电子离散时序自动计算机(EDSAC);美国则于1950年制成了东部标准自动计算机(SFAC)等。至此,电子计算机发展的萌芽时期遂告结束,开始了现代计算机的发展时期。
在创制数字计算机的同时,还研制了另一类重要的计算工具——模拟计算机。物理学家在总结自然规律时,常用数学方程描述某一过程;相反,解数学方程的过程,也有可能采用物理过程模拟方法,对数发明以后,1620年制成的计算尺,己把乘法、除法化为加法、减法进行计算。麦克斯韦巧妙地把积分(面积)的计算转变为长度的测量,于1855年制成了积分仪。
19世纪数学物理的另一项重大成就——傅里叶分析,对模拟机的发展起到了直接的推动作用。19世纪后期和20世纪前期,相继制成了多种计算傅里叶系数的分析机和解微分方程的微分分析机等。但是当试图推广微分分析机解偏微分方程和用模拟机解决一般科学计算问题时,人们逐渐认识到模拟机在通用性和精确度等方面的局限性,并将主要精力转向了数字计算机。
电子数字计算机问世以后,模拟计算机仍然继续有所发展,并且与数字计算机相结合而产生了混合式计算机。模拟机和混合机已发展成为现代计算机的特殊品种,即用在特定领域的高效信息处理工具或仿真工具。
20世纪中期以来,计算机一直处于高速度发展时期,计算机由仅包含硬件发展到包含硬件、软件和固件三类子系统的计算机系统。计算机系统的性能—价格比,平均每10年提高两个数量级。计算机种类也一再分化,发展成微型计算机、小型计算机、通用计算机(包括巨型、大型和中型计算机),以及各种专用机(如各种控制计算机、模拟—数字混合计算机)等。
计算机器件从电子管到晶体管,再从分立元件到集成电路以至微处理器,促使计算机的发展出现了三次飞跃。
在电子管计算机时期(1946~1959),计算机主要用于科学计算。主存储器是决定计算机技术面貌的主要因素。当时,主存储器有水银延迟线存储器、阴极射线示波管静电存储器、磁鼓和磁心存储器等类型,通常按此对计算机进行分类。
到了晶体管计算机时期(1959~1964),主存储器均采用磁心存储器,磁鼓和磁盘开始用作主要的辅助存储器。不仅科学计算用计算机继续发展,而且中、小型计算机,特别是廉价的小型数据处理用计算机开始大量生产。
1964年,在集成电路计算机发展的同时,计算机也进入了产品系列化的发展时期。半导体存储器逐步取代了磁心存储器的主存储器地位,磁盘成了不可缺少的辅助存储器,并且开始普遍采用虚拟存储技术。随着各种半导体只读存储器和可改写的只读存储器的迅速发展,以及微程序技术的发展和应用,计算机系统中开始出现固件子系统。
20世纪70年代以后,计算机用集成电路的集成度迅速从中小规模发展到大规模、超大规模的水平,微处理器和微型计算机应运而生,各类计算机的性能迅速提高。随着字长4位、8位、16位、32位和64位的微型计算机相继问世和广泛应用,对小型计算机、通用计算机和专用计算机的需求量也相应增长了。
微型计算机在社会上大量应用后,一座办公楼、一所学校、一个仓库常常拥有数十台以至数百台计算机。实现它们互连的局部网随即兴起,进一步推动了计算机应用系统从集中式系统向分布式系统的发展。
在电子管计算机时期,一些计算机配置了汇编语言和子程序库,科学计算用的高级语言FORTRAN初露头角。在晶体管计算机阶段,事务处理的COBOL语言、科学计算机用的ALGOL语言,和符号处理用的LISP等高级语言开始进入实用阶段。操作系统初步成型,使计算机的使用方式由手工操作改变为自动作业管理。
进入集成电路计算机发展时期以后,在计算机中形成了相当规模的软件子系统,高级语言种类进一步增加,操作系统日趋完善,具备批量处理、分时处理、实时处理等多种功能。数据库管理系统、通信处理程序、网络软件等也不断增添到软件子系统中。软件子系统的功能不断增强,明显地改变了计算机的使用属性,使用效率显着提高。
在现代计算机中,外围设备的价值一般已超过计算机硬件子系统的一半以上,其技术水平在很大程度上决定着计算机的技术面貌。外围设备技术的综合性很强,既依赖于电子学、机械学、光学、磁学等多门学科知识的综合,又取决于精密机械工艺、电气和电子加工工艺以及计量的技术和工艺水平等。
外围设备包括辅助存储器和输入输出设备两大类。辅助存储器包括磁盘、磁鼓、磁带、激光存储器、海量存储器和缩微存储器等;输入输出设备又分为输入、输出、转换、、模式信息处理设备和终端设备。在这些品种繁多的设备中,对计算机技术面貌影响最大的是磁盘、终端设备、模式信息处理设备和转换设备等。
新一代计算机是把信息采集存储处理、通信和人工智能结合在一起的智能计算机系统。它不仅能进行一般信息处理,而且能面向知识处理,具有形式化推理、联想、学习和解释的能力,将能帮助人类开拓未知的领域和获得新的知识。
计算技术在中国的发展 在人类文明发展的历史上中国曾经在早期计算工具的发明创造方面写过光辉的一页。远在商代,中国就创造了十进制记数方法,领先于世界千余年。到了周代,发明了当时最先进的计算工具——算筹。这是一种用竹、木或骨制成的颜色不同的小棍。计算每一个数学问题时,通常编出一套歌诀形式的算法,一边计算,一边不断地重新布棍。中国古代数学家祖冲之,就是用算筹计算出圆周率在3.1415926和3.1415927之间。这一结果比西方早一千年。
珠算盘是中国的又一独创,也是计算工具发展史上的第一项重大发明。这种轻巧灵活、携带方便、与人民生活关系密切的计算工具,最初大约出现于汉朝,到元朝时渐趋成熟。珠算盘不仅对中国经济的发展起过有益的作用,而且传到日本、朝鲜、东南亚等地区,经受了历史的考验,至今仍在使用。
中国发明创造指南车、水运浑象仪、记里鼓车、提花机等,不仅对自动控制机械的发展有卓越的贡献,而且对计算工具的演进产生了直接或间接的影响。例如,张衡制作的水运浑象仪,可以自动地与地球运转同步,后经唐、宋两代的改进,遂成为世界上最早的天文钟。
记里鼓车则是世界上最早的自动计数装置。提花机原理刘计算机程序控制的发展有过间接的影响。中国古代用阳、阴两爻构成八卦,也对计算技术的发展有过直接的影响。莱布尼兹写过研究八卦的论文,系统地提出了二进制算术运算法则。他认为,世界上最早的二进制表示法就是中国的八卦。
经过漫长的沉寂,新中国成立后,中国计算技术迈入了新的发展时期,先后建立了研究机构,在高等院校建立了计算技术与装置专业和计算数学专业,并且着手创建中国计算机制造业。
1958年和1959年,中国先后制成第一台小型和大型电子管计算机。60年代中期,中国研制成功一批晶体管计算机,并配制了ALGOL等语言的编译程序和其他系统软件。60年代后期,中国开始研究集成电路计算机。70年代,中国已批量生产小型集成电路计算机。80年代以后,中国开始重点研制微型计算机系统并推广应用;在大型计算机、特别是巨型计算机技术方面也取得了重要进展;建立了计算机服务业,逐步健全了计算机产业结构。
在计算机科学与技术的研究方面,中国在有限元计算方法、数学定理的机器证明、汉字信息处理、计算机系统结构和软件等方面都有所建树。在计算机应用方面,中国在科学计算与工程设计领域取得了显着成就。在有关经营管理和过程控制等方面,计算机应用研究和实践也日益活跃。
计算机科学与技术
计算机科学与技术是一门实用性很强、发展极其迅速的面向广大社会的技术学科,它建立在数学、电子学 (特别是微电子学)、磁学、光学、精密机械等多门学科的基础之上。但是,它并不是简单地应用某些学科的知识,而是经过高度综合形成一整套有关信息表示、变换、存储、处理、控制和利用的理论、方法和技术。
计算机科学是研究计算机及其周围各种现象与规模的科学,主要包括理论计算机科学、计算机系统结构、软件和人工智能等。计算机技术则泛指计算机领域中所应用的技术方法和技术手段,包括计算机的系统技术、软件技术、部件技术、器件技术和组装技术等。计算机科学与技术包括五个分支学科,即理论计算机科学、计算机系统结构、计算机组织与实现、计算机软件和计算机应用。
理论计算机学 是研究计算机基本理论的学科。在几千年的数学发展中,人们研究了各式各样的计算,创立了许多算法。但是,以计算或算法本身的性质为研究对象的数学理论,却是在20世纪30年代才发展起来的。
当时,由几位数理逻辑学者建立的算法理论,即可计算性理论或称递归函数论,对20世纪40年代现代计算机设计思想的形成产生过影响。此后,关于现实计算机及其程序的数学模型性质的研究,以及计算复杂性的研究等不断有所发展。
理论计算机科学包括自动机论、形式语言理论、程序理论、算法分析,以及计算复杂性理论等。自动机是现实自动计算机的数学模型,或者说是现实计算机程序的模型,自动机理论的任务就在于研究这种抽象机器的模型;程序设计语言是一种形式语言,形式语言理论根据语言表达能力的强弱分为O~3型语言,与图灵机等四类自动机逐一对应;程序理论是研究程序逻辑、程序复杂性、程序正确性证明、程序验证、程序综合、形式语言学,以及程序设计方法的理论基础;算法分析研究各种特定算法的性质。计算复杂性理论研究算法复杂性的一般性质。
计算机系统结构 程序设计者所见的计算机属性,着重于计算机的概念结构和功能特性,硬件、软件和固件子系统的功能分配及其界面的确定。使用高级语言的程序设计者所见到的计算机属性,主要是软件子系统和固件子系统的属性,包括程序语言以及操作系统、数据库管理系统、网络软件等的用户界面。使用机器语言的程序设计者所见到的计算机属性,则是硬件子系统的概念结构(硬件子系统结构)及其功能特性,包括指令系统(机器语言),以及寄存器定义、中断机构、输入输出方式、机器工作状态等。
硬件子系统的典型结构是冯·诺伊曼结构,它由运算器控制器、存储器和输入、输出设备组成,采用“指令驱动”方式。当初,它是为解非线性、微分方程而设计的,并未预见到高级语言、操作系统等的出现,以及适应其他应用环境的特殊要求。在相当长的一段时间内,软件子系统都是以这种冯·诺伊曼结构为基础而发展的。但是,其间不相适应的情况逐渐暴露出来,从而推动了计算机系统结构的变革。
计算机组织与实现 是研究组成计算机的功能、部件间的相互连接和相互作用,以及有关计算机实现的技术,均属于计算机组织与实现的任务。
在计算机系统结构确定分配给硬子系统的功能及其概念结构之后,计算机组织的任务就是研究各组成部分的内部构造和相互联系,以实现机器指令级的各种功能和特性。这种相互联系包括各功能部件的布置、相互连接和相互作用。
随着计算机功能的扩展和性能的提高,计算机包含的功能部件也日益增多,其间的互连结构日趋复杂。现代已有三类互连方式,分别以中央处理器、存储器或通信子系统为中心,与其他部件互连。以通信子系统为中心的组织方式,使计算机技术与通信技术紧密结合,形成了计算机网络、分布计算机系统等重要的计算机研究与应用领域。
与计算实现有关的技术范围相当广泛,包括计算机的元件、器件技术,数字电路技术,组装技术以及有关的制造技术和工艺等。
软件 软件的研究领域主要包括程序设计、基础软件、软件工程三个方面。程序设计指设计和编制程序的过程,是软件研究和发展的基础环节。程序设计研究的内容,包括有关的基本概念、规范、工具、方法以及方法学等。这个领域发展的特点是:从顺序程序设计过渡到并发程序设计和分币程序设计;从非结构程序设计方法过渡到结构程序设计方法;从低级语言工具过渡到高级语言工具;从具体方法过渡到方法学。
基础软件指计算机系统中起基础作用的软件。计算机的软件子系统可以分为两层:靠近硬件子系统的一层称为系统软件,使用频繁,但与具体应用领域无关;另一层则与具体应用领域直接有关,称为应用软件;此外还有支援其他软件的研究与维护的软件,专门称为支援软件。
软件工程是采用工程方法研究和维护软件的过程,以及有关的技术。软件研究和维护的全过程,包括概念形成、要求定义、设计、实现、调试、交付使用,以及有关校正性、适应性、完善性等三层意义的维护。软件工程的研究内容涉及上述全过程有关的对象、结构、方法、工具和管理等方面。
软件目动研究系统的任务是:在软件工程中采用形式方法:使软件研究与维护过程中的各种工作尽可能多地由计算机自动完成;创造一种适应软件发展的软件、固件与硬件高度综合的高效能计算机。
计算机产业
计算机产业包括两大部门,即计算机制造业和计算机服务业。后者又称为信息处理产业或信息服务业。计算机产业是一种省能源、省资源、附加价值高、知识和技术密集的产业,对于国民经济的发展、国防实力和社会进步均有巨大影响。因此,不少国家采取促进计算机产业兴旺发达的政策。
计算机制造业包括生产各种计算机系统、外围设备终端设备,以及有关装置、元件、器件和材料的制造。计算机作为工业产品,要求产品有继承性,有很高的性能-价格比和综合性能。计算机的继承性特别体现在软件兼容性方面,这能使用户和厂家把过去研制的软件用在新产品上,使价格很高的软件财富继续发挥作用,减少用户再次研制软件的时间和费用。提高性能-价格比是计算机产品更新的目标和动力。
计算机制造业提供的计算机产品,一般仅包括硬件子系统和部分软件子系统。通常,软件子系统中缺少适应各种特定应用环境的应用软件。为了使计算机在特定环境中发挥效能,还需要设计应用系统和研制应用软件此外,计算机的运行和维护,需要有掌握专业知识的技术人员,这常常是一股用户所作不到的。
针对这些社会需要,一些计算机制造厂家十分重视向用户提供各种技术服务和销售服务。一些独立于计算机制造厂家的计算机服务机构,也在50年代开始出现。到60年代末期,计算机服务业在世界范围内已形成为独立的行业。
计算机的发展与应用
计算机科学与技术的各门学科相结合,改进了研究工具和研究方法,促进了各门学科的发展。过去,人们主要通过实验和理论两种途径进行科学技术研究。现在,计算和模拟已成为研究工作的第三条途径。
计算机与有关的实验观测仪器相结合,可对实验数据进行现场记录、整理、加工、分析和绘制图表,显着地提高实验工作的质量和效率。计算机辅助设计已成为工程设计优质化、自动化的重要手段。在理论研究方面,计算机是人类大脑的延伸,可代替人脑的若干功能并加以强化。古老的数学靠纸和笔运算,现在计算机成了新的工具,数学定理证明之类的繁重脑力劳动,已可能由计算机来完成或部分完成。
计算和模拟作为一种新的研究手段,常使一些学科衍生出新的分支学科。例如,空气动力学、气象学、弹性结构力学和应用分析等所面临的“计算障碍”,在有了高速计算机和有关的计算方法之后开始有所突破,并衍生出计算空气动力学、气象数值预报等边缘分支学科。利用计算机进行定量研究,不仅在自然科学中发挥了重大的作用,在社会科学和人文学科中也是如此。例如,在人口普查、社会调查和自然语言研究方面,计算机就是一种很得力的工具。
计算机在各行各业中的广泛应用,常常产生显着的经济效益和社会效益,从而引起产业结构、产品结构、经营管理和服务方式等方面的重大变革。在产业结构中已出观了计算机制造业和计算机服务业,以及知识产业等新的行业。
微处理器和微计算机已嵌入机电设备、电子设备、通信设备、仪器仪表和家用电器中,使这些产品向智能化方向发展。计算机被引入各种生产过程系统中,使化工、石油、钢铁、电力、机械、造纸、水泥等生产过程的自动化水平大大提高,劳动生产率上升、质量提高、成本下降。计算机嵌入各种武器装备和武器系统干,可显着提高其作战效果。
经营管理方面,计算机可用于完成统计、计划、查询、库存管理、市场分析、辅助决策等,使经营管理工作科学化和高效化,从而加速资金周转,降低库存水准,改善服务质量,缩短新产品研制周期,提高劳动生产率。在办公室自动化方面,计算机可用于文件的起草、检索和管理等,显着提高办公效率。
计算机还是人们的学习工具和生活工具。借助家用计算机、个人计算机、计算机网、数据库系统和各种终端设备,人们可以学习各种课程,获取各种情报和知识,处理各种生活事务(如订票、购物、存取款等),甚至可以居家办公。越来越多的人的工作、学习和生活中将与计算机发生直接的或间接的联系。普及计算机教育已成为一个重要的问题。
总之,计算机的发展和应用已不仅是一种技术现象而且是一种政治、经济、军事和社会现象。世界各国都力图主动地驾驭这种社会计算机化和信息化的进程,克服计算机化过程中可能出现的消极因素,更顺利地向高
时代的车轮即将驶进21世纪的大门。人们将怎样面向未来?无论你从事什么工作,也不论你生活在什么地方,都会认识到我们所面临的世纪是科技高度发展的信息时代。计算机是信息处理的主要工具,掌握计算机知识已成为当代人类文化不可缺少的重要组成部分,计算机技能则是人们工作和生活必不可少的基本手段。
基于这样的认识,近年来我国掀起了一个全国范围的学习计算机热潮,各行各业的人都迫切地要求学习计算机知识和掌握计算机技能。对于广大的非计算机专业的人们,学习计算机的目的是应用,希望学以致用,立竿见影,而无须从系统理论学起。
掌握计算机技能关键是实践,只有通过大量的实践应用才能真正深入地掌握它。光靠看书是难以真正掌握计算机应用的。正如同在陆地上是无法学会游泳一样,要学游泳必须下到水中去。同样,要学习计算机应用,必须坐到计算机旁,经常地、反复地操作计算机,熟能生巧。只要得法,你在计算机上花的时间愈多,收获就愈大......
㈧ 如何做成一个DBA,有没有好的学习计划
一、DBA技术
1、作为一个DBA,你必须要精通SQL命令、各种数据库架构、数据库管理和维护、数据库调优,必要的时候,还需要为开发人员搭建一个健壮、结构良好、性能稳定的数据库环境。
2、数据库是构建在操作系统之上的,你还需要精通系统技术。当然,完全不必要学习系统管理员那样高深的技术理论。
3、你还需要掌握服务器硬件、软件技术理论。便于数据库基于服务器问题出现的时候,能够及时提出解决方案。
4、还要理解数据库在服务器、系统软件中如何实现和运作的。
二、了解DBA职责:
1、监视数据库。
2、记录和统计系统和性能的表现技术信息。
3、构造数据库框架、配置数据库实例。
4、维护数据库网络安全,过滤非法查询信息。
5、及时备份数据库
6、利用备份,还原数据库,甚至是迁移数据库。
7、为开发人员定制、配置专用的测试服务器。
8、数据库技术最新的研发方向。
9、数据库调优。
10、完整熟悉数据库操作流程。
11、诊断数据库,找出数据库的不足之处和生成数据库解决方案。
12、完整培训数据库系统那个环境。
13、与系统管理员保持良好的合作关系。
14、创建有效的、定期维护的安全的数据库。
三、初级DBA学习
1、关系数据库理论
这是很多DBA的入门基础理论。目前市场上主流的数据库都是关系型数据库,当然关系型数据库理论也成为了DBA的基础技术理论。只有对于关系型数据库理论达到了一个层次,对于关系型数据库管理系统(RDBMS)才能更好地应用,无论是Oracle数据库,IBM的DB2,还是微软的SQL Server。目前,很多的大学都有关系型数据库理论的课程。推荐一本关系型数据库理论书籍,Elmasri and Navathe编写的数据库系统基础,Bejamin/Cummings Press。
2、系统学习SQL语句
对于DBA而言,使用得最多的还是SQL查询语句。因此,掌握SQL语言是非常必要的。只有当SQL查询语言,成为了一种你DBA生涯的职业习惯的时候,你才能真正意义上成为合格的DBA。在目前所有的数据库中,SQL查询语言全部通用。本质上来讲,SQL查询语言是DBA和数据库交互的必要工具。这里有一本非常好的书籍,《Oracle Database 11g完全参考手册》,属于DBA非常重要的技术参考文档。
3、逐渐参与基本的数据库管理工作
对于数据库管理而言,有两本比较好的书籍,《Oracle Database 11g DBA手册》和《Oracle Database 11g备份与恢复指导》。这都是Oracle比较好的技术文档,同时也是基本的数据库管理工作的理论基础。对于DBA而言,关系型数据库理论和SQl查询语言理论是DBA真正的技术理论基础,数据库管理工作更多的时候只是一种工具。而且,实践才是检验和提高DBA技术的唯一标准。从数据库日常管理工作中学习,从实践中提高,才是DBA成长的唯一出路。
4、继续学习数据库技术
参与Oracle培训,获得Oracle认证其实对于DBA而言,还远远不够。IT行业是一个技术更新速度非常频繁的行业。而DBA行业的技术更新,更是远胜于IT行业。以Oracle为代表的数据库厂商,都投入了大量的资金和资源到技术研发中去,Oracle的技术基本都是每三个就会进行一次大的更新。这也是很多的Oracle官方培训机构普遍采用PDF电子教材的根本原因所在。去阅读,去学习,去不断丰富自己的技术理论和实践能力。
5、不断尝试参与案例
对于DBA而言,日常的数据库管理工作,还只是基本职能之一。要想在DBA行业走得更远,丰富自己的技术实力才是王道。所以,尝试不断地去测试案例,不断地去数据库中寻找疑难杂症,不断地提出解决方案,从众多的解决方案中寻找优秀的方案,吸取经验,也是DBA学习的另外一种非常有效的手段。毕竟,日常的数据库管理都不会遇到太多的问题,需要自己去创建模型,自己去创建案例。当然,如果日常管理的数据库都能不断出现各种各样的问题,那说明你在DBA的道路上,还仍重而道远。
6、寻找良师
在DBA行业发展,一个优秀的引路人是DBA生涯最好的指明灯。他们往往能够在你的DBA生涯中,给予你比较宝贵的建议,传授给你比较好的经验的积累,使你在DBA的道路上,尽可能少地走弯路。
7、参与本地讨论组
目前,各种交互平台上,DBA技术讨论组非常多,甚至还有很多跨城市、跨国家的用户讨论组。这其中,本地讨论组是一种非常好的资源,很多时候还会举行线下的聚会,讨论数据库相关的话题。
四、中级DBA进阶
请记住,SQL语言、关系型数据库理论和基本的数据库管理任务,是作为一名初级DBA所必备的技术理论和实践基础。如果你已经成为初级DBA,并确信掌握了上面三种技术,而且也开始厌倦不断地阅读技术文档。那么接下来的建议将带你进入中级DBA的技术殿堂。
1、学习操作系统和服务器硬件
我们知道,数据库是建立在操作系统和服务器硬件之上的。操作系统,作为硬件和数据库之间交互的中间层,在日常的数据库维护工作中,也是经常遇到诸多疑难杂症的。如果是Unix操作系统则需要熟悉和掌握Unix命令行语句。如果是Windows Server操作系统,则需要学习操作系统的维护、管理和优化。当然,作为承载数据库和操作系统的服务器硬件,也是很有必要的。
2、学习一门开发语言
对于数据库而言,并不是单独存在的。作为后台运行的数据库,很多时候都有前端的操作界面和功能的实现。毕竟,并不是所有的软件开发者都精通数据库编程。特别在一些大型的IT企业,DBA往往都需要和软件开发程序员合作,搭建软件运行和数据存储的后台数据库。学习一门开发语言,能够让你很好地理解数据库开发在程序设计中的意义和作用。并能在和软件开发程序员的合作中,更好地实现程序员理想的功能。
3、取得认证
对于已经成为DBA的你而言,认证将不再作为DBA行业的敲门砖。更多的时候,认证对于初级DBA而言,是一种学习的过程,同时也是自我价值的实现过程。同时,在参与认证考试的时候,也能够从和其他DBA的交流中,学习一些从未接触过的技术或者经验。
成为一名中级DBA,OCP(Oracle Certified Professional)是你必须考取的认证。作为数据库行业的大佬,Oracle的技术实力是不言而喻的。而且,DBA行业的最高级别认证,也是属于Oracle认证体系的。
更重要的是,取得一门认证,对于你的DBA生涯的发展而言,是大有裨益的。所以,去取得认证吧。
4、获得技术资源库
对于DBA而言,Technet账户是必须的。这是众多DBA少有的技术、资源交流聚集地。在共享Oracle知识,分享Oracle资源的同时,也能够寻找并获取对你而言有价值的Oracle资源。
5、更多的交流
随着新一代互联网技术的兴起和发展,越来越多的新奇的交互手段层出不穷。即时交流工具、新闻组、论坛、irc、聊天室,都可以成为DBA们交流的舞台。但是,传统的新闻组和论坛,依然保有无可比拟的技术优势,可以回答你提出的数据库问题。真正优秀的交流社区,数据库高手们是乐意与你分享他们的技术经验的。
Usenet newsgroup------comp.databases.oracle.server和comp.databases.oracle.misc,这是两个世界性的Oracle数据库技术新闻组。当然,需要比较好的英文功底。
Quest Pipelines------中等的Pipelines,笔者的最爱。
五、成就高级DBA
高级DBA更多的时候,被人成为数据库专家。经过长期的学习和实践,你已经准备好像高级DBA发起冲刺了。如果准备好了,下面的内容将帮你在DBA的道路上走得更远。
1、阅读数据库技术文档
对于DBA而言,真正的技术宝库,就是数据库厂商给出的官方技术文档几乎所以的技术理论都涵盖到这些技术文档中。而且,原版的技术文章更具价值。目前市面上,几乎所有的数据库书籍都是技术文档的解读。当然,这需要你有过硬的英文阅读能力。而且,每个版本的技术文档都有区别。Oracle Database 11g就在Oracle Database 10g的基础上,加入了11g的新特征和新技术。当然,有的高级DBA并没有读过技术文档,这在很大程度上,只是特例。如果一个版本的技术文档,你通读至少12次以上,相信每次都会有新的感悟,你也会逐渐了解到数据库真正的技术核心价值。
2、探寻各个领域的专家之路
高级DBA几乎是数据库领域真正的专家。而涉及到数据库领域,备份与恢复、调优等领域很多。从最简单的开始,尝试了解全部的技术手段和解决问题方案,尝试成为这个领域的专家。之后再逐渐扩展到其他领域。对于IT行业而言,技术更新换代的速度非常快,而以Oracle为代表的数据库厂商,都拥有自己强大的数据库技术研发团队。几乎每3个月,Oracle技术就会更新一次。去学习,保持技术水平的领先性,你一定能成为数据库专家。
3、继续参与社会化媒体的讨论
经过长期的学习和实践,相信你已经积累了自己的社会化媒体DBA技术交流平台。积极地去参与数据库技术讨论,将会让你在DBA的道路上走得更远。如果一个平台没有什么有价值的技术讨论,不妨尝试换一个平台。
4、总结自己的技术经验
学习只是一个成长的经历,总结才能在不断学习中,找出自己的不足之处。所以,以学技术白皮书的方式,去尝试总结自己多年来所学到的技术和积累的经验。不断梳理数据库技术和理论架构,你会发现,自己技术的不足之处很难有所建树。针对这些不足之处可以适当得强化和提高。当你尝试总结的时候,你会吃惊地发现,曾经都快遗忘的技术理论又开始出现在脑海里,这是非常美妙的体验。
5、成为Oracle解决方案专家
对于DBA而言,不断积累遇到的数据库问题,甚至是故意破坏数据库以探寻数据库疑难问题,是每个DBA几乎都要经历的过程。高级DBA基本都是Oracle解决方案专家,能够根据Oracle数据库出现各种问题,很快地提出解决方案。
6、成为Oracle性能调优专家
Oracle数据库日常问题的解决、性能优化,几乎成为了每个雇用DBA企业都十分关注的问题。性能调优对于企业而言,能够在很大程度上节约企业的成本。一个Oracle性能调优专家能够在很大程度上,以最优的Oracle数据库解决方案来实现最好的Oracle数据库存储。
7、成为承载能力计划专家
评估一个数据库的承载能力,几乎成为了高级DBA的必修课。如何准确预估数据增长量、交易增长量,从而更好的规划、设计数据库的承载能力,以最优的软硬件配置实现企业利益的最大化,这才是高级DBA的价值所在。
8、关注新技术
虽然,在国内,新技术的实现需要一段很长的时间。但是,尽早掌握数据库新技术,对于高级DBA而言是非常必要的。总有大型的企业,需要不断革新和改进自己的数据库技术,这就要求高级DBA不断关注新技术,学习新技术。