成就存儲專家之路存儲從入門到精通
㈠ 如何快速成為數據分析師
接下來我們分別從每一個部分講講具體應該學什麼、怎麼學。
數據獲取:公開數據、python爬蟲
如果接觸的只是企業資料庫里的數據,不需要要獲取外部數據的,這個部分可以忽略。
外部數據的獲取方式主要有以下兩種。
第一種是獲取外部的公開數據集,一些科研機構、企業、政府會開放一些數據,你需要到特定的網站去下載這些數據。這些數據集通常比較完善、質量相對較高。
另一種獲取外部數據費的方式就是爬蟲。
比如你可以通過爬蟲獲取招聘網站某一職位的招聘信息,爬取租房網站上某城市的租房信息,爬取豆瓣評分評分最高的電影列表,獲取知乎點贊排行、網易雲音樂評論排行列表。基於互聯網爬取的數據,你可以對某個行業、某種人群進行分析。
在爬蟲之前你需要先了解一些 Python 的基礎知識:元素(列表、字典、元組等)、變數、循環、函數(鏈接的菜鳥教程非常好)……以及如何用成熟的 Python 庫(urllib、BeautifulSoup、requests、scrapy)實現網頁爬蟲。如果是初學,建議從 urllib 和 BeautifulSoup 開始。(PS:後續的數據分析也需要 Python 的知識,以後遇到的問題也可以在這個教程查看)
網上的爬蟲教程不要太多,爬蟲上手推薦豆瓣的網頁爬取,一方面是網頁結構比較簡單,二是豆瓣對爬蟲相對比較友好。
掌握基礎的爬蟲之後,你還需要一些高級技巧,比如正則表達式、模擬用戶登錄、使用代理、設置爬取頻率、使用cookie信息等等,來應對不同網站的反爬蟲限制。
除此之外,常用的的電商網站、問答網站、點評網站、二手交易網站、婚戀網站、招聘網站的數據,都是很好的練手方式。這些網站可以獲得很有分析意義的數據,最關鍵的是,有很多成熟的代碼,可以參考。
數據存取:sql語言
你可能有一個疑惑,為什麼沒有講到Excel。在應對萬以內的數據的時候,Excel對於一般的分析沒有問題,一旦數據量大,就會力不從心,資料庫就能夠很好地解決這個問題。而且大多數的企業,都會以SQL的形式來存儲數據,如果你是一個分析師,也需要懂得SQL的操作,能夠查詢、提取數據。
SQL作為最經典的資料庫工具,為海量數據的存儲與管理提供可能,並且使數據的提取的效率大大提升。你需要掌握以下技能:
提取特定情況下的數據:企業資料庫里的數據一定是大而繁復的,你需要提取你需要的那一部分。比如你可以根據你的需要提取2018年所有的銷售數據、提取今年銷量最大的50件商品的數據、提取上海、廣東地區用戶的消費數據……,SQL可以通過簡單的命令幫你完成這些工作。
資料庫的增、刪、查、改:這些是資料庫最基本的操作,但只要用簡單的命令就能夠實現,所以你只需要記住命令就好。
數據的分組聚合、如何建立多個表之間的聯系:這個部分是SQL的進階操作,多個表之間的關聯,在你處理多維度、多個數據集的時候非常有用,這也讓你可以去處理更復雜的數據。
數據預處理:Python(pandas)
很多時候我們拿到的數據是不幹凈的,數據的重復、缺失、異常值等等,這時候就需要進行數據的清洗,把這些影響分析的數據處理好,才能獲得更加精確地分析結果。
比如空氣質量的數據,其中有很多天的數據由於設備的原因是沒有監測到的,有一些數據是記錄重復的,還有一些數據是設備故障時監測無效的。比如用戶行為數據,有很多無效的操作對分析沒有意義,就需要進行刪除。
那麼我們需要用相應的方法去處理,比如殘缺數據,我們是直接去掉這條數據,還是用臨近的值去補全,這些都是需要考慮的問題。
對於數據預處理,學會 pandas 的用法,應對一般的數據清洗就完全沒問題了。需要掌握的知識點如下:
選擇:數據訪問(標簽、特定值、布爾索引等)
缺失值處理:對缺失數據行進行刪除或填充
重復值處理:重復值的判斷與刪除
空格和異常值處理:清楚不必要的空格和極端、異常數據
相關操作:描述性統計、Apply、直方圖等
合並:符合各種邏輯關系的合並操作
分組:數據劃分、分別執行函數、數據重組
Reshaping:快速生成數據透視表
概率論及統計學知識
數據整體分布是怎樣的?什麼是總體和樣本?中位數、眾數、均值、方差等基本的統計量如何應用?如果有時間維度的話隨著時間的變化是怎樣的?如何在不同的場景中做假設檢驗?數據分析方法大多源於統計學的概念,所以統計學的知識也是必不可少的。需要掌握的知識點如下:
基本統計量:均值、中位數、眾數、百分位數、極值等
其他描述性統計量:偏度、方差、標准差、顯著性等
其他統計知識:總體和樣本、參數和統計量、ErrorBar
概率分布與假設檢驗:各種分布、假設檢驗流程
其他概率論知識:條件概率、貝葉斯等
有了統計學的基本知識,你就可以用這些統計量做基本的分析了。通過可視化的方式來描述數據的指標,其實可以得出很多結論了,比如排名前100的是哪些,平均水平是怎樣的,近幾年的變化趨勢如何……
你可以使用python的包 Seaborn(python包)在做這些可視化的分析,你會輕松地畫出各種可視化圖形,並得出具有指導意義的結果。了解假設檢驗之後,可以對樣本指標與假設的總體指標之間是否存在差別作出判斷,已驗證結果是否在可接受的范圍。
python數據分析
如果你有一些了解的話,就知道目前市面上其實有很多 Python 數據分析的書籍,但每一本都很厚,學習阻力非常大。但其實真正最有用的那部分信息,只是這些書里很少的一部分。比如用 Python 實現不同案例的假設檢驗,其實你就可以對數據進行很好的驗證。
比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的數據進行回歸分析,並得出相對精確地結論。比如DataCastle的訓練競賽「房價預測」和「職位預測」,都可以通過回歸分析實現。這部分需要掌握的知識點如下:
回歸分析:線性回歸、邏輯回歸
基本的分類演算法:決策樹、隨機森林……
基本的聚類演算法:k-means……
特徵工程基礎:如何用特徵選擇優化模型
調參方法:如何調節參數優化模型
Python 數據分析包:scipy、numpy、scikit-learn等
在數據分析的這個階段,重點了解回歸分析的方法,大多數的問題可以得以解決,利用描述性的統計分析和回歸分析,你完全可以得到一個不錯的分析結論。
當然,隨著你實踐量的增多,可能會遇到一些復雜的問題,你就可能需要去了解一些更高級的演算法:分類、聚類,然後你會知道面對不同類型的問題的時候更適合用哪種演算法模型,對於模型的優化,你需要去學習如何通過特徵提取、參數調節來提升預測的精度。這就有點數據挖掘和機器學習的味道了,其實一個好的數據分析師,應該算是一個初級的數據挖掘工程師了。
系統實戰
這個時候,你就已經具備了數據分析的基本能力了。但是還要根據不同的案例、不同的業務場景進行實戰。能夠獨立完成分析任務,那麼你就已經打敗市面上大部分的數據分析師了。
如何進行實戰呢?
上面提到的公開數據集,可以找一些自己感興趣的方向的數據,嘗試從不同的角度來分析,看看能夠得到哪些有價值的結論。
另一個角度是,你可以從生活、工作中去發現一些可用於分析的問題,比如上面說到的電商、招聘、社交等平台等方向都有著很多可以挖掘的問題。
開始的時候,你可能考慮的問題不是很周全,但隨著你經驗的積累,慢慢就會找到分析的方向,有哪些一般分析的維度,比如top榜單、平均水平、區域分布、年齡分布、相關性分析、未來趨勢預測等等。隨著經驗的增加,你會有一些自己對於數據的感覺,這就是我們通常說的數據思維了。
你也可以看看行業的分析報告,看看優秀的分析師看待問題的角度和分析問題的維度,其實這並不是一件困難的事情。
在掌握了初級的分析方法之後,也可以嘗試做一些數據分析的競賽,比如 DataCastle 為數據分析師專門定製的三個競賽,提交答案即可獲取評分和排名:
員工離職預測訓練賽
美國King County房價預測訓練賽
北京PM2.5濃度分析訓練賽
種一棵樹最好的時間是十年前,其次是現在。現在就去,找一個數據集開始吧!!
㈡ 大學生如何學習
大學生的學習,其實最主要的還是課堂上的認真聽講,課後根據自己的興趣去考研,考公,或者其他的一些技能的學習。接下來主要說下課堂上的學習。
首先,將手機關機,許多學生在上課的時候總會情不自禁的拿起手機來進行打游戲,看電視劇,或者聊天等行為,這就造成了不能在課堂上認真聽講的局面。可能有的學生會說,我們的筆記比較多,我們需要手機進行拍照然後進行筆記的記錄,但是什麼也不如「爛筆頭」所以說手機終究是一個輔助工具,真正的學習還是要靠我們自己,所以說上課之前,將手機關機,或者教室里有收納籃的話,可以放在那裡面。
以上是課上認真聽講的一部分,課後的學習主要是靠自己的自製力,有明確的目標,知道自己要去做什麼,知道自己怎麼做,自己對未來的規劃是什麼,是繼續學習深造,還是早點步入社會積累經驗,這些都對自己接下來的行為有所影響的。
㈢ 如何成為一個數據分析師需要具備哪些技能
接下來我們分別從每一個部分講講具體應該學什麼、怎麼學。
數據獲取:公開數據、Python爬蟲
如果接觸的只是企業資料庫里的數據,不需要要獲取外部數據的,這個部分可以忽略。
外部數據的獲取方式主要有以下兩種。
第一種是獲取外部的公開數據集,一些科研機構、企業、政府會開放一些數據,你需要到特定的網站去下載這些數據。這些數據集通常比較完善、質量相對較高。
另一種獲取外部數據費的方式就是爬蟲。
比如你可以通過爬蟲獲取招聘網站某一職位的招聘信息,爬取租房網站上某城市的租房信息,爬取豆瓣評分評分最高的電影列表,獲取知乎點贊排行、網易雲音樂評論排行列表。基於互聯網爬取的數據,你可以對某個行業、某種人群進行分析。
在爬蟲之前你需要先了解一些 Python 的基礎知識:元素(列表、字典、元組等)、變數、循環、函數(鏈接的菜鳥教程非常好)……以及如何用成熟的 Python 庫(urllib、BeautifulSoup、requests、scrapy)實現網頁爬蟲。如果是初學,建議從 urllib 和 BeautifulSoup 開始。(PS:後續的數據分析也需要 Python 的知識,以後遇到的問題也可以在這個教程查看)
網上的爬蟲教程不要太多,爬蟲上手推薦豆瓣的網頁爬取,一方面是網頁結構比較簡單,二是豆瓣對爬蟲相對比較友好。
掌握基礎的爬蟲之後,你還需要一些高級技巧,比如正則表達式、模擬用戶登錄、使用代理、設置爬取頻率、使用cookie信息等等,來應對不同網站的反爬蟲限制。
除此之外,常用的的電商網站、問答網站、點評網站、二手交易網站、婚戀網站、招聘網站的數據,都是很好的練手方式。這些網站可以獲得很有分析意義的數據,最關鍵的是,有很多成熟的代碼,可以參考。
數據存取:SQL語言
你可能有一個疑惑,為什麼沒有講到Excel。在應對萬以內的數據的時候,Excel對於一般的分析沒有問題,一旦數據量大,就會力不從心,資料庫就能夠很好地解決這個問題。而且大多數的企業,都會以SQL的形式來存儲數據,如果你是一個分析師,也需要懂得SQL的操作,能夠查詢、提取數據。
SQL作為最經典的資料庫工具,為海量數據的存儲與管理提供可能,並且使數據的提取的效率大大提升。你需要掌握以下技能:
提取特定情況下的數據:企業資料庫里的數據一定是大而繁復的,你需要提取你需要的那一部分。比如你可以根據你的需要提取2018年所有的銷售數據、提取今年銷量最大的50件商品的數據、提取上海、廣東地區用戶的消費數據……,SQL可以通過簡單的命令幫你完成這些工作。
資料庫的增、刪、查、改:這些是資料庫最基本的操作,但只要用簡單的命令就能夠實現,所以你只需要記住命令就好。
數據的分組聚合、如何建立多個表之間的聯系:這個部分是SQL的進階操作,多個表之間的關聯,在你處理多維度、多個數據集的時候非常有用,這也讓你可以去處理更復雜的數據。
數據預處理:Python(pandas)
很多時候我們拿到的數據是不幹凈的,數據的重復、缺失、異常值等等,這時候就需要進行數據的清洗,把這些影響分析的數據處理好,才能獲得更加精確地分析結果。
比如空氣質量的數據,其中有很多天的數據由於設備的原因是沒有監測到的,有一些數據是記錄重復的,還有一些數據是設備故障時監測無效的。比如用戶行為數據,有很多無效的操作對分析沒有意義,就需要進行刪除。
那麼我們需要用相應的方法去處理,比如殘缺數據,我們是直接去掉這條數據,還是用臨近的值去補全,這些都是需要考慮的問題。
對於數據預處理,學會 pandas 的用法,應對一般的數據清洗就完全沒問題了。需要掌握的知識點如下:
選擇:數據訪問(標簽、特定值、布爾索引等)
缺失值處理:對缺失數據行進行刪除或填充
重復值處理:重復值的判斷與刪除
空格和異常值處理:清楚不必要的空格和極端、異常數據
相關操作:描述性統計、Apply、直方圖等
合並:符合各種邏輯關系的合並操作
分組:數據劃分、分別執行函數、數據重組
Reshaping:快速生成數據透視表
概率論及統計學知識
數據整體分布是怎樣的?什麼是總體和樣本?中位數、眾數、均值、方差等基本的統計量如何應用?如果有時間維度的話隨著時間的變化是怎樣的?如何在不同的場景中做假設檢驗?數據分析方法大多源於統計學的概念,所以統計學的知識也是必不可少的。需要掌握的知識點如下:
基本統計量:均值、中位數、眾數、百分位數、極值等
其他描述性統計量:偏度、方差、標准差、顯著性等
其他統計知識:總體和樣本、參數和統計量、ErrorBar
概率分布與假設檢驗:各種分布、假設檢驗流程
其他概率論知識:條件概率、貝葉斯等
有了統計學的基本知識,你就可以用這些統計量做基本的分析了。通過可視化的方式來描述數據的指標,其實可以得出很多結論了,比如排名前100的是哪些,平均水平是怎樣的,近幾年的變化趨勢如何……
你可以使用python的包 Seaborn(python包)在做這些可視化的分析,你會輕松地畫出各種可視化圖形,並得出具有指導意義的結果。了解假設檢驗之後,可以對樣本指標與假設的總體指標之間是否存在差別作出判斷,已驗證結果是否在可接受的范圍。
python數據分析
如果你有一些了解的話,就知道目前市面上其實有很多 Python 數據分析的書籍,但每一本都很厚,學習阻力非常大。但其實真正最有用的那部分信息,只是這些書里很少的一部分。比如用 Python 實現不同案例的假設檢驗,其實你就可以對數據進行很好的驗證。
比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的數據進行回歸分析,並得出相對精確地結論。比如DataCastle的訓練競賽「房價預測」和「職位預測」,都可以通過回歸分析實現。這部分需要掌握的知識點如下:
回歸分析:線性回歸、邏輯回歸
基本的分類演算法:決策樹、隨機森林……
基本的聚類演算法:k-means……
特徵工程基礎:如何用特徵選擇優化模型
調參方法:如何調節參數優化模型
Python 數據分析包:scipy、numpy、scikit-learn等
在數據分析的這個階段,重點了解回歸分析的方法,大多數的問題可以得以解決,利用描述性的統計分析和回歸分析,你完全可以得到一個不錯的分析結論。
當然,隨著你實踐量的增多,可能會遇到一些復雜的問題,你就可能需要去了解一些更高級的演算法:分類、聚類,然後你會知道面對不同類型的問題的時候更適合用哪種演算法模型,對於模型的優化,你需要去學習如何通過特徵提取、參數調節來提升預測的精度。這就有點數據挖掘和機器學習的味道了,其實一個好的數據分析師,應該算是一個初級的數據挖掘工程師了。
系統實戰
這個時候,你就已經具備了數據分析的基本能力了。但是還要根據不同的案例、不同的業務場景進行實戰。能夠獨立完成分析任務,那麼你就已經打敗市面上大部分的數據分析師了。
如何進行實戰呢?
上面提到的公開數據集,可以找一些自己感興趣的方向的數據,嘗試從不同的角度來分析,看看能夠得到哪些有價值的結論。
另一個角度是,你可以從生活、工作中去發現一些可用於分析的問題,比如上面說到的電商、招聘、社交等平台等方向都有著很多可以挖掘的問題。
開始的時候,你可能考慮的問題不是很周全,但隨著你經驗的積累,慢慢就會找到分析的方向,有哪些一般分析的維度,比如top榜單、平均水平、區域分布、年齡分布、相關性分析、未來趨勢預測等等。隨著經驗的增加,你會有一些自己對於數據的感覺,這就是我們通常說的數據思維了。
你也可以看看行業的分析報告,看看優秀的分析師看待問題的角度和分析問題的維度,其實這並不是一件困難的事情。
在掌握了初級的分析方法之後,也可以嘗試做一些數據分析的競賽,比如 DataCastle 為數據分析師專門定製的三個競賽,提交答案即可獲取評分和排名:
員工離職預測訓練賽
美國King County房價預測訓練賽
北京PM2.5濃度分析訓練賽
種一棵樹最好的時間是十年前,其次是現在。現在就去,找一個數據集開始吧!!
㈣ 大數據培訓學校學哪些內容
首先我們要了解java語言和Linux操作系統,這兩個是學習大數據的基礎,學習的順序不分前後。
大數據
大數據
Java :只要了解一些基礎即可,做大數據不需要很深的Java 技術,學java SE 就相當於有學習大數據基礎。
Linux:因為大數據相關軟體都是在Linux上運行的,所以Linux要學習的扎實一些,學好Linux對你快速掌握大數據相關技術會有很大的幫助,能讓你更好的理解hadoop、hive、hbase、spark等大數據軟體的運行環境和網路環境配置,能少踩很多坑,學會shell就能看懂腳本這樣能更容易理解和配置大數據集群。還能讓你對以後新出的大數據技術學習起來更快。
Hadoop:這是現在流行的大數據處理平台幾乎已經成為大數據的代名詞,所以這個是必學的。Hadoop裡麵包括幾個組件HDFS、MapRece和YARN,HDFS是存儲數據的地方就像我們電腦的硬碟一樣文件都存儲在這個上面,MapRece是對數據進行處理計算的,它有個特點就是不管多大的數據只要給它時間它就能把數據跑完,但是時間可能不是很快所以它叫數據的批處理。
Zookeeper:這是個萬金油,安裝Hadoop的HA的時候就會用到它,以後的Hbase也會用到它。它一般用來存放一些相互協作的信息,這些信息比較小一般不會超過1M,都是使用它的軟體對它有依賴,對於我們個人來講只需要把它安裝正確,讓它正常的run起來就可以了。
Mysql:我們學習完大數據的處理了,接下來學習學習小數據的處理工具mysql資料庫,因為一會裝hive的時候要用到,mysql需要掌握到什麼層度那?你能在Linux上把它安裝好,運行起來,會配置簡單的許可權,修改root的密碼,創建資料庫。這里主要的是學習SQL的語法,因為hive的語法和這個非常相似。
Sqoop:這個是用於把Mysql里的數據導入到Hadoop里的。當然你也可以不用這個,直接把Mysql數據表導出成文件再放到HDFS上也是一樣的,當然生產環境中使用要注意Mysql的壓力。
Hive:這個東西對於會SQL語法的來說就是神器,它能讓你處理大數據變的很簡單,不會再費勁的編寫MapRece程序。有的人說Pig那?它和Pig差不多掌握一個就可以了。
Oozie:既然學會Hive了,我相信你一定需要這個東西,它可以幫你管理你的Hive或者MapRece、Spark腳本,還能檢查你的程序是否執行正確,出錯了給你發報警並能幫你重試程序,最重要的是還能幫你配置任務的依賴關系。我相信你一定會喜歡上它的,不然你看著那一大堆腳本,和密密麻麻的crond是不是有種想屎的感覺。
Hbase:這是Hadoop生態體系中的NOSQL資料庫,他的數據是按照key和value的形式存儲的並且key是唯一的,所以它能用來做數據的排重,它與MYSQL相比能存儲的數據量大很多。所以他常被用於大數據處理完成之後的存儲目的地。
Kafka:這是個比較好用的隊列工具,隊列是干嗎的?排隊買票你知道不?數據多了同樣也需要排隊處理,這樣與你協作的其它同學不會叫起來,你干嗎給我這么多的數據(比如好幾百G的文件)我怎麼處理得過來,你別怪他因為他不是搞大數據的,你可以跟他講我把數據放在隊列里你使用的時候一個個拿,這樣他就不在抱怨了馬上灰流流的去優化他的程序去了,因為處理不過來就是他的事情。而不是你給的問題。當然我們也可以利用這個工具來做線上實時數據的入庫或入HDFS,這時你可以與一個叫Flume的工具配合使用,它是專門用來提供對數據進行簡單處理,並寫到各種數據接受方(比如Kafka)的。
Spark:它是用來彌補基於MapRece處理數據速度上的缺點,它的特點是把數據裝載到內存中計算而不是去讀慢的要死進化還特別慢的硬碟。特別適合做迭代運算,所以演算法流們特別稀飯它。它是用scala編寫的。Java語言或者Scala都可以操作它,因為它們都是用JVM的。
㈤ 電腦的發展史是什麼
電腦的發展史是:
計算工具的演化經歷了由簡單到復雜、從低級到高級的不同階段,例如從「結繩記事」中的繩結到算籌、算盤計算尺、機械計算機等。它們在不同的歷史時期發揮了各自的歷史作用,同時也啟發了現代電子計算機的研製思想。
1889年,美國科學家赫爾曼·何樂禮研製出以電力為基礎的電動製表機,用以儲存計算資料。
1930年,美國科學家范內瓦·布希造出世界上首台模擬電子計算機。
1946年2月14日,由美國軍方定製的世界上第一台電子計算機「電子數字積分計算機」在美國賓夕法尼亞大學問世了。ENIAC是美國奧伯丁武器試驗場為了滿足計算彈道需要而研製成的,這台計算器使用了17840支電子管,大小為80英尺×8英尺,重達28t(噸),功耗為170kW,其運算速度為每秒5000次的加法運算,造價約為487000美元。
ENIAC的問世具有劃時代的意義,表明電子計算機時代的到來。在以後60多年裡,計算機技術以驚人的速度發展,沒有任何一門技術的性能價格比能在30年內增長6個數量級。
電腦的發展趨勢:
隨著科技的進步,各種計算機技術、網路技術的飛速發展,計算機的發展已經進入了一個快速而又嶄新的時代,計算機已經從功能單一、體積較大發展到了功能復雜、體積微小、資源網路化等。
計算機的未來充滿了變數,性能的大幅度提高是不可置疑的,而實現性能的飛躍卻有多種途徑。不過性能的大幅提升並不是計算機發展的唯一路線,計算機的發展還應當變得越來越人性化,同時也要注重環保等等。
計算機從出現至今,經歷了機器語言、程序語言、簡單操作系統和Linux、Macos、Windows等現代操作系統四代,運行速度也得到了極大的提升,第四代計算機的運算速度已經達到幾十億次每秒。
計算機也由原來的僅供軍事科研使用發展到人人擁有,計算機強大的應用功能,產生了巨大的市場需要,未來計算機性能應向著微型化、網路化、智能化和巨型化的方向發展。
㈥ 求生之路明明完成專家模式戰役了,為什麼成就裡 有待證明 沒有打勾
你需要從一個章節的第一關開始打才會有,一共五個章節,你可以看看你完成了多少個。
㈦ 閱讀問題
計算機的發展歷史
一、第一台計算機的誕生
第一台計算機(ENIAC)於1946年2月,在美國誕生。
ENIAC PC機
耗資 100萬美圓 600美圓
重量 30噸 10kg
佔地 150平方米 0.25平方米
電子器件 1.9萬只電子管 100塊集成電路
運算速度 5000次/秒 500萬次/秒
二、計算機發展歷史
1、第一代計算機(1946~1958)
電子管為基本電子器件;使用機器語言和匯編語言;主要應用於國防和科學計算;運算速度每秒幾千次至幾萬次。
2、第二代計算機(1958~1964)
晶體管為主要器件;軟體上出現了操作系統和演算法語言;運算速度每秒幾萬次至幾十萬次。
3、第三代計算機(1964~1971)
普遍採用集成電路;體積縮小;運算速度每秒幾十萬次至幾百萬次。
4、第四代計算機(1971~ )
以大規模集成電路為主要器件;運算速度每秒幾百萬次至上億次。
三、我國計算機發展歷史
從1953年開始研究,到1958年研製出了我國第一台計算機
在1982年我國研製出了運算速度1億次的銀河I、II型等小型系列機。
計算機的歷史
計算機是新技術革命的一支主力,也是推動社會向現代化邁進的活躍因素。計算機科學與技術是第二次世界大戰以來發展最快、影響最為深遠的新興學科之一。計算機產業已在世界范圍內發展成為一種極富生命力的戰略產業。
現代計算機是一種按程序自動進行信息處理的通用工具,它的處理對象是信息,處理結果也是信息。利用計算機解決科學計算、工程設計、經營管理、過程式控制制或人工智慧等各種問題的方法,都是按照一定的演算法進行的。這種演算法是定義精確的一系列規則,它指出怎樣以給定的輸入信息經過有限的步驟產生所需要的輸出信息。
信息處理的一般過程,是計算機使用者針對待解抉的問題,事先編製程序並存入計算機內,然後利用存儲程序指揮、控制計算機自動進行各種基本操作,直至獲得預期的處理結果。計算機自動工作的基礎在於這種存儲程序方式,其通用性的基礎則在於利用計算機進行信息處理的共性方法。
計算機的歷史
現代計算機的誕生和發展 現代計算機問世之前,計算機的發展經歷了機械式計算機、機電式計算機和萌芽期的電子計算機三個階段。
早在17世紀,歐洲一批數學家就已開始設計和製造以數字形式進行基本運算的數字計算機。1642年,法國數學家帕斯卡採用與鍾表類似的齒輪傳動裝置,製成了最早的十進制加法器。1678年,德國數學家萊布尼茲製成的計算機,進一步解決了十進制數的乘、除運算。
英國數學家巴貝奇在1822年製作差分機模型時提出一個設想,每次完成一次算術運算將發展為自動完成某個特定的完整運算過程。1884年,巴貝奇設計了一種程序控制的通用分析機。這台分析機雖然已經描繪出有關程序控制方式計算機的雛型,但限於當時的技術條件而未能實現。
巴貝奇的設想提出以後的一百多年期間,電磁學、電工學、電子學不斷取得重大進展,在元件、器件方面接連發明了真空二極體和真空三極體;在系統技術方面,相繼發明了無線電報、電視和雷達……。所有這些成就為現代計算機的發展准備了技術和物質條件。
與此同時,數學、物理也相應地蓬勃發展。到了20世紀30年代,物理學的各個領域經歷著定量化的階段,描述各種物理過程的數學方程,其中有的用經典的分析方法已根難解決。於是,數值分析受到了重視,研究出各種數值積分,數值微分,以及微分方程數值解法,把計算過程歸結為巨量的基本運算,從而奠定了現代計算機的數值演算法基礎。
社會上對先進計算工具多方面迫切的需要,是促使現代計算機誕生的根本動力。20世紀以後,各個科學領域和技術部門的計算困難堆積如山,已經阻礙了學科的繼續發展。特別是第二次世界大戰爆發前後,軍事科學技術對高速計算工具的需要尤為迫切。在此期間,德國、美國、英國部在進行計算機的開拓工作,幾乎同時開始了機電式計算機和電子計算機的研究。
德國的朱賽最先採用電氣元件製造計算機。他在1941年製成的全自動繼電器計算機Z-3,已具備浮點記數、二進制運算、數字存儲地址的指令形式等現代計算機的特徵。在美國,1940~1947年期間也相繼製成了繼電器計算機MARK-1、MARK-2、Model-1、Model-5等。不過,繼電器的開關速度大約為百分之一秒,使計算機的運算速度受到很大限制。
電子計算機的開拓過程,經歷了從製作部件到整機從專用機到通用機、從「外加式程序」到「存儲程序」的演變。1938年,美籍保加利亞學者阿塔納索夫首先製成了電子計算機的運算部件。1943年,英國外交部通信處製成了「巨人」電子計算機。這是一種專用的密碼分析機,在第二次世界大戰中得到了應用。
1946年2月美國賓夕法尼亞大學莫爾學院製成的大型電子數字積分計算機(ENIAC),最初也專門用於火炮彈道計算,後經多次改進而成為能進行各種科學計算的通用計算機。這台完全採用電子線路執行算術運算、邏輯運算和信息存儲的計算機,運算速度比繼電器計算機快1000倍。這就是人們常常提到的世界上第一台電子計算機。但是,這種計算機的程序仍然是外加式的,存儲容量也太小,尚未完全具備現代計算機的主要特徵。
新的重大突破是由數學家馮·諾伊曼領導的設計小組完成的。1945年3月他們發表了一個全新的存儲程序式通用電子計算機方案—電子離散變數自動計算機(EDVAC)。隨後於1946年6月,馮·諾伊曼等人提出了更為完善的設計報告《電子計算機裝置邏輯結構初探》。同年7~8月間,他們又在莫爾學院為美國和英國二十多個機構的專家講授了專門課程《電子計算機設計的理論和技術》,推動了存儲程序式計算機的設計與製造。
1949年,英國劍橋大學數學實驗室率先製成電子離散時序自動計算機(EDSAC);美國則於1950年製成了東部標准自動計算機(SFAC)等。至此,電子計算機發展的萌芽時期遂告結束,開始了現代計算機的發展時期。
在創制數字計算機的同時,還研製了另一類重要的計算工具——模擬計算機。物理學家在總結自然規律時,常用數學方程描述某一過程;相反,解數學方程的過程,也有可能採用物理過程模擬方法,對數發明以後,1620年製成的計算尺,己把乘法、除法化為加法、減法進行計算。麥克斯韋巧妙地把積分(面積)的計算轉變為長度的測量,於1855年製成了積分儀。
19世紀數學物理的另一項重大成就——傅里葉分析,對模擬機的發展起到了直接的推動作用。19世紀後期和20世紀前期,相繼製成了多種計算傅里葉系數的分析機和解微分方程的微分分析機等。但是當試圖推廣微分分析機解偏微分方程和用模擬機解決一般科學計算問題時,人們逐漸認識到模擬機在通用性和精確度等方面的局限性,並將主要精力轉向了數字計算機。
電子數字計算機問世以後,模擬計算機仍然繼續有所發展,並且與數字計算機相結合而產生了混合式計算機。模擬機和混合機已發展成為現代計算機的特殊品種,即用在特定領域的高效信息處理工具或模擬工具。
20世紀中期以來,計算機一直處於高速度發展時期,計算機由僅包含硬體發展到包含硬體、軟體和固件三類子系統的計算機系統。計算機系統的性能—價格比,平均每10年提高兩個數量級。計算機種類也一再分化,發展成微型計算機、小型計算機、通用計算機(包括巨型、大型和中型計算機),以及各種專用機(如各種控制計算機、模擬—數字混合計算機)等。
計算機器件從電子管到晶體管,再從分立元件到集成電路以至微處理器,促使計算機的發展出現了三次飛躍。
在電子管計算機時期(1946~1959),計算機主要用於科學計算。主存儲器是決定計算機技術面貌的主要因素。當時,主存儲器有水銀延遲線存儲器、陰極射線示波管靜電存儲器、磁鼓和磁心存儲器等類型,通常按此對計算機進行分類。
到了晶體管計算機時期(1959~1964),主存儲器均採用磁心存儲器,磁鼓和磁碟開始用作主要的輔助存儲器。不僅科學計算用計算機繼續發展,而且中、小型計算機,特別是廉價的小型數據處理用計算機開始大量生產。
1964年,在集成電路計算機發展的同時,計算機也進入了產品系列化的發展時期。半導體存儲器逐步取代了磁心存儲器的主存儲器地位,磁碟成了不可缺少的輔助存儲器,並且開始普遍採用虛擬存儲技術。隨著各種半導體只讀存儲器和可改寫的只讀存儲器的迅速發展,以及微程序技術的發展和應用,計算機系統中開始出現固件子系統。
20世紀70年代以後,計算機用集成電路的集成度迅速從中小規模發展到大規模、超大規模的水平,微處理器和微型計算機應運而生,各類計算機的性能迅速提高。隨著字長4位、8位、16位、32位和64位的微型計算機相繼問世和廣泛應用,對小型計算機、通用計算機和專用計算機的需求量也相應增長了。
微型計算機在社會上大量應用後,一座辦公樓、一所學校、一個倉庫常常擁有數十台以至數百台計算機。實現它們互連的局部網隨即興起,進一步推動了計算機應用系統從集中式系統向分布式系統的發展。
在電子管計算機時期,一些計算機配置了匯編語言和子程序庫,科學計算用的高級語言FORTRAN初露頭角。在晶體管計算機階段,事務處理的COBOL語言、科學計算機用的ALGOL語言,和符號處理用的LISP等高級語言開始進入實用階段。操作系統初步成型,使計算機的使用方式由手工操作改變為自動作業管理。
進入集成電路計算機發展時期以後,在計算機中形成了相當規模的軟體子系統,高級語言種類進一步增加,操作系統日趨完善,具備批量處理、分時處理、實時處理等多種功能。資料庫管理系統、通信處理程序、網路軟體等也不斷增添到軟體子系統中。軟體子系統的功能不斷增強,明顯地改變了計算機的使用屬性,使用效率顯著提高。
在現代計算機中,外圍設備的價值一般已超過計算機硬體子系統的一半以上,其技術水平在很大程度上決定著計算機的技術面貌。外圍設備技術的綜合性很強,既依賴於電子學、機械學、光學、磁學等多門學科知識的綜合,又取決於精密機械工藝、電氣和電子加工工藝以及計量的技術和工藝水平等。
外圍設備包括輔助存儲器和輸入輸出設備兩大類。輔助存儲器包括磁碟、磁鼓、磁帶、激光存儲器、海量存儲器和縮微存儲器等;輸入輸出設備又分為輸入、輸出、轉換、、模式信息處理設備和終端設備。在這些品種繁多的設備中,對計算機技術面貌影響最大的是磁碟、終端設備、模式信息處理設備和轉換設備等。
新一代計算機是把信息採集存儲處理、通信和人工智慧結合在一起的智能計算機系統。它不僅能進行一般信息處理,而且能面向知識處理,具有形式化推理、聯想、學習和解釋的能力,將能幫助人類開拓未知的領域和獲得新的知識。
計算技術在中國的發展 在人類文明發展的歷史上中國曾經在早期計算工具的發明創造方面寫過光輝的一頁。遠在商代,中國就創造了十進制記數方法,領先於世界千餘年。到了周代,發明了當時最先進的計算工具——算籌。這是一種用竹、木或骨製成的顏色不同的小棍。計算每一個數學問題時,通常編出一套歌訣形式的演算法,一邊計算,一邊不斷地重新布棍。中國古代數學家祖沖之,就是用算籌計算出圓周率在3.1415926和3.1415927之間。這一結果比西方早一千年。
珠算盤是中國的又一獨創,也是計算工具發展史上的第一項重大發明。這種輕巧靈活、攜帶方便、與人民生活關系密切的計算工具,最初大約出現於漢朝,到元朝時漸趨成熟。珠算盤不僅對中國經濟的發展起過有益的作用,而且傳到日本、朝鮮、東南亞等地區,經受了歷史的考驗,至今仍在使用。
中國發明創造指南車、水運渾象儀、記里鼓車、提花機等,不僅對自動控制機械的發展有卓越的貢獻,而且對計算工具的演進產生了直接或間接的影響。例如,張衡製作的水運渾象儀,可以自動地與地球運轉同步,後經唐、宋兩代的改進,遂成為世界上最早的天文鍾。
記里鼓車則是世界上最早的自動計數裝置。提花機原理劉計算機程序控制的發展有過間接的影響。中國古代用陽、陰兩爻構成八卦,也對計算技術的發展有過直接的影響。萊布尼茲寫過研究八卦的論文,系統地提出了二進制算術運演算法則。他認為,世界上最早的二進製表示法就是中國的八卦。
經過漫長的沉寂,新中國成立後,中國計算技術邁入了新的發展時期,先後建立了研究機構,在高等院校建立了計算技術與裝置專業和計算數學專業,並且著手創建中國計算機製造業。
1958年和1959年,中國先後製成第一台小型和大型電子管計算機。60年代中期,中國研製成功一批晶體管計算機,並配製了ALGOL等語言的編譯程序和其他系統軟體。60年代後期,中國開始研究集成電路計算機。70年代,中國已批量生產小型集成電路計算機。80年代以後,中國開始重點研製微型計算機系統並推廣應用;在大型計算機、特別是巨型計算機技術方面也取得了重要進展;建立了計算機服務業,逐步健全了計算機產業結構。
在計算機科學與技術的研究方面,中國在有限元計算方法、數學定理的機器證明、漢字信息處理、計算機系統結構和軟體等方面都有所建樹。在計算機應用方面,中國在科學計算與工程設計領域取得了顯著成就。在有關經營管理和過程式控制制等方面,計算機應用研究和實踐也日益活躍。
計算機科學與技術
計算機科學與技術是一門實用性很強、發展極其迅速的面向廣大社會的技術學科,它建立在數學、電子學 (特別是微電子學)、磁學、光學、精密機械等多門學科的基礎之上。但是,它並不是簡單地應用某些學科的知識,而是經過高度綜合形成一整套有關信息表示、變換、存儲、處理、控制和利用的理論、方法和技術。
計算機科學是研究計算機及其周圍各種現象與規模的科學,主要包括理論計算機科學、計算機系統結構、軟體和人工智慧等。計算機技術則泛指計算機領域中所應用的技術方法和技術手段,包括計算機的系統技術、軟體技術、部件技術、器件技術和組裝技術等。計算機科學與技術包括五個分支學科,即理論計算機科學、計算機系統結構、計算機組織與實現、計算機軟體和計算機應用。
理論計算機學 是研究計算機基本理論的學科。在幾千年的數學發展中,人們研究了各式各樣的計算,創立了許多演算法。但是,以計算或演算法本身的性質為研究對象的數學理論,卻是在20世紀30年代才發展起來的。
當時,由幾位數理邏輯學者建立的演算法理論,即可計算性理論或稱遞歸函數論,對20世紀40年代現代計算機設計思想的形成產生過影響。此後,關於現實計算機及其程序的數學模型性質的研究,以及計算復雜性的研究等不斷有所發展。
理論計算機科學包括自動機論、形式語言理論、程序理論、演算法分析,以及計算復雜性理論等。自動機是現實自動計算機的數學模型,或者說是現實計算機程序的模型,自動機理論的任務就在於研究這種抽象機器的模型;程序設計語言是一種形式語言,形式語言理論根據語言表達能力的強弱分為O~3型語言,與圖靈機等四類自動機逐一對應;程序理論是研究程序邏輯、程序復雜性、程序正確性證明、程序驗證、程序綜合、形式語言學,以及程序設計方法的理論基礎;演算法分析研究各種特定演算法的性質。計算復雜性理論研究演算法復雜性的一般性質。
計算機系統結構 程序設計者所見的計算機屬性,著重於計算機的概念結構和功能特性,硬體、軟體和固件子系統的功能分配及其界面的確定。使用高級語言的程序設計者所見到的計算機屬性,主要是軟體子系統和固件子系統的屬性,包括程序語言以及操作系統、資料庫管理系統、網路軟體等的用戶界面。使用機器語言的程序設計者所見到的計算機屬性,則是硬體子系統的概念結構(硬體子系統結構)及其功能特性,包括指令系統(機器語言),以及寄存器定義、中斷機構、輸入輸出方式、機器工作狀態等。
硬體子系統的典型結構是馮·諾伊曼結構,它由運算器控制器、存儲器和輸入、輸出設備組成,採用「指令驅動」方式。當初,它是為解非線性、微分方程而設計的,並未預見到高級語言、操作系統等的出現,以及適應其他應用環境的特殊要求。在相當長的一段時間內,軟體子系統都是以這種馮·諾伊曼結構為基礎而發展的。但是,其間不相適應的情況逐漸暴露出來,從而推動了計算機系統結構的變革。
計算機組織與實現 是研究組成計算機的功能、部件間的相互連接和相互作用,以及有關計算機實現的技術,均屬於計算機組織與實現的任務。
在計算機系統結構確定分配給硬子系統的功能及其概念結構之後,計算機組織的任務就是研究各組成部分的內部構造和相互聯系,以實現機器指令級的各種功能和特性。這種相互聯系包括各功能部件的布置、相互連接和相互作用。
隨著計算機功能的擴展和性能的提高,計算機包含的功能部件也日益增多,其間的互連結構日趨復雜。現代已有三類互連方式,分別以中央處理器、存儲器或通信子系統為中心,與其他部件互連。以通信子系統為中心的組織方式,使計算機技術與通信技術緊密結合,形成了計算機網路、分布計算機系統等重要的計算機研究與應用領域。
與計算實現有關的技術范圍相當廣泛,包括計算機的元件、器件技術,數字電路技術,組裝技術以及有關的製造技術和工藝等。
軟體 軟體的研究領域主要包括程序設計、基礎軟體、軟體工程三個方面。程序設計指設計和編製程序的過程,是軟體研究和發展的基礎環節。程序設計研究的內容,包括有關的基本概念、規范、工具、方法以及方法學等。這個領域發展的特點是:從順序程序設計過渡到並發程序設計和分幣程序設計;從非結構程序設計方法過渡到結構程序設計方法;從低級語言工具過渡到高級語言工具;從具體方法過渡到方法學。
基礎軟體指計算機系統中起基礎作用的軟體。計算機的軟體子系統可以分為兩層:靠近硬體子系統的一層稱為系統軟體,使用頻繁,但與具體應用領域無關;另一層則與具體應用領域直接有關,稱為應用軟體;此外還有支援其他軟體的研究與維護的軟體,專門稱為支援軟體。
軟體工程是採用工程方法研究和維護軟體的過程,以及有關的技術。軟體研究和維護的全過程,包括概念形成、要求定義、設計、實現、調試、交付使用,以及有關校正性、適應性、完善性等三層意義的維護。軟體工程的研究內容涉及上述全過程有關的對象、結構、方法、工具和管理等方面。
軟體目動研究系統的任務是:在軟體工程中採用形式方法:使軟體研究與維護過程中的各種工作盡可能多地由計算機自動完成;創造一種適應軟體發展的軟體、固件與硬體高度綜合的高效能計算機。
計算機產業
計算機產業包括兩大部門,即計算機製造業和計算機服務業。後者又稱為信息處理產業或信息服務業。計算機產業是一種省能源、省資源、附加價值高、知識和技術密集的產業,對於國民經濟的發展、國防實力和社會進步均有巨大影響。因此,不少國家採取促進計算機產業興旺發達的政策。
計算機製造業包括生產各種計算機系統、外圍設備終端設備,以及有關裝置、元件、器件和材料的製造。計算機作為工業產品,要求產品有繼承性,有很高的性能-價格比和綜合性能。計算機的繼承性特別體現在軟體兼容性方面,這能使用戶和廠家把過去研製的軟體用在新產品上,使價格很高的軟體財富繼續發揮作用,減少用戶再次研製軟體的時間和費用。提高性能-價格比是計算機產品更新的目標和動力。
計算機製造業提供的計算機產品,一般僅包括硬體子系統和部分軟體子系統。通常,軟體子系統中缺少適應各種特定應用環境的應用軟體。為了使計算機在特定環境中發揮效能,還需要設計應用系統和研製應用軟體此外,計算機的運行和維護,需要有掌握專業知識的技術人員,這常常是一股用戶所作不到的。
針對這些社會需要,一些計算機製造廠家十分重視向用戶提供各種技術服務和銷售服務。一些獨立於計算機製造廠家的計算機服務機構,也在50年代開始出現。到60年代末期,計算機服務業在世界范圍內已形成為獨立的行業。
計算機的發展與應用
計算機科學與技術的各門學科相結合,改進了研究工具和研究方法,促進了各門學科的發展。過去,人們主要通過實驗和理論兩種途徑進行科學技術研究。現在,計算和模擬已成為研究工作的第三條途徑。
計算機與有關的實驗觀測儀器相結合,可對實驗數據進行現場記錄、整理、加工、分析和繪制圖表,顯著地提高實驗工作的質量和效率。計算機輔助設計已成為工程設計優質化、自動化的重要手段。在理論研究方面,計算機是人類大腦的延伸,可代替人腦的若干功能並加以強化。古老的數學靠紙和筆運算,現在計算機成了新的工具,數學定理證明之類的繁重腦力勞動,已可能由計算機來完成或部分完成。
計算和模擬作為一種新的研究手段,常使一些學科衍生出新的分支學科。例如,空氣動力學、氣象學、彈性結構力學和應用分析等所面臨的「計算障礙」,在有了高速計算機和有關的計算方法之後開始有所突破,並衍生出計算空氣動力學、氣象數值預報等邊緣分支學科。利用計算機進行定量研究,不僅在自然科學中發揮了重大的作用,在社會科學和人文學科中也是如此。例如,在人口普查、社會調查和自然語言研究方面,計算機就是一種很得力的工具。
計算機在各行各業中的廣泛應用,常常產生顯著的經濟效益和社會效益,從而引起產業結構、產品結構、經營管理和服務方式等方面的重大變革。在產業結構中已出觀了計算機製造業和計算機服務業,以及知識產業等新的行業。
微處理器和微計算機已嵌入機電設備、電子設備、通信設備、儀器儀表和家用電器中,使這些產品向智能化方向發展。計算機被引入各種生產過程系統中,使化工、石油、鋼鐵、電力、機械、造紙、水泥等生產過程的自動化水平大大提高,勞動生產率上升、質量提高、成本下降。計算機嵌入各種武器裝備和武器系統干,可顯著提高其作戰效果。
經營管理方面,計算機可用於完成統計、計劃、查詢、庫存管理、市場分析、輔助決策等,使經營管理工作科學化和高效化,從而加速資金周轉,降低庫存水準,改善服務質量,縮短新產品研製周期,提高勞動生產率。在辦公室自動化方面,計算機可用於文件的起草、檢索和管理等,顯著提高辦公效率。
計算機還是人們的學習工具和生活工具。藉助家用計算機、個人計算機、計算機網、資料庫系統和各種終端設備,人們可以學習各種課程,獲取各種情報和知識,處理各種生活事務(如訂票、購物、存取款等),甚至可以居家辦公。越來越多的人的工作、學習和生活中將與計算機發生直接的或間接的聯系。普及計算機教育已成為一個重要的問題。
總之,計算機的發展和應用已不僅是一種技術現象而且是一種政治、經濟、軍事和社會現象。世界各國都力圖主動地駕馭這種社會計算機化和信息化的進程,克服計算機化過程中可能出現的消極因素,更順利地向高
時代的車輪即將駛進21世紀的大門。人們將怎樣面向未來?無論你從事什麼工作,也不論你生活在什麼地方,都會認識到我們所面臨的世紀是科技高度發展的信息時代。計算機是信息處理的主要工具,掌握計算機知識已成為當代人類文化不可缺少的重要組成部分,計算機技能則是人們工作和生活必不可少的基本手段。
基於這樣的認識,近年來我國掀起了一個全國范圍的學習計算機熱潮,各行各業的人都迫切地要求學習計算機知識和掌握計算機技能。對於廣大的非計算機專業的人們,學習計算機的目的是應用,希望學以致用,立竿見影,而無須從系統理論學起。
掌握計算機技能關鍵是實踐,只有通過大量的實踐應用才能真正深入地掌握它。光靠看書是難以真正掌握計算機應用的。正如同在陸地上是無法學會游泳一樣,要學游泳必須下到水中去。同樣,要學習計算機應用,必須坐到計算機旁,經常地、反復地操作計算機,熟能生巧。只要得法,你在計算機上花的時間愈多,收獲就愈大......
㈧ 如何做成一個DBA,有沒有好的學習計劃
一、DBA技術
1、作為一個DBA,你必須要精通SQL命令、各種資料庫架構、資料庫管理和維護、資料庫調優,必要的時候,還需要為開發人員搭建一個健壯、結構良好、性能穩定的資料庫環境。
2、資料庫是構建在操作系統之上的,你還需要精通系統技術。當然,完全不必要學習系統管理員那樣高深的技術理論。
3、你還需要掌握伺服器硬體、軟體技術理論。便於資料庫基於伺服器問題出現的時候,能夠及時提出解決方案。
4、還要理解資料庫在伺服器、系統軟體中如何實現和運作的。
二、了解DBA職責:
1、監視資料庫。
2、記錄和統計系統和性能的表現技術信息。
3、構造資料庫框架、配置資料庫實例。
4、維護資料庫網路安全,過濾非法查詢信息。
5、及時備份資料庫
6、利用備份,還原資料庫,甚至是遷移資料庫。
7、為開發人員定製、配置專用的測試伺服器。
8、資料庫技術最新的研發方向。
9、資料庫調優。
10、完整熟悉資料庫操作流程。
11、診斷資料庫,找出資料庫的不足之處和生成資料庫解決方案。
12、完整培訓資料庫系統那個環境。
13、與系統管理員保持良好的合作關系。
14、創建有效的、定期維護的安全的資料庫。
三、初級DBA學習
1、關系資料庫理論
這是很多DBA的入門基礎理論。目前市場上主流的資料庫都是關系型資料庫,當然關系型資料庫理論也成為了DBA的基礎技術理論。只有對於關系型資料庫理論達到了一個層次,對於關系型資料庫管理系統(RDBMS)才能更好地應用,無論是Oracle資料庫,IBM的DB2,還是微軟的SQL Server。目前,很多的大學都有關系型資料庫理論的課程。推薦一本關系型資料庫理論書籍,Elmasri and Navathe編寫的資料庫系統基礎,Bejamin/Cummings Press。
2、系統學習SQL語句
對於DBA而言,使用得最多的還是SQL查詢語句。因此,掌握SQL語言是非常必要的。只有當SQL查詢語言,成為了一種你DBA生涯的職業習慣的時候,你才能真正意義上成為合格的DBA。在目前所有的資料庫中,SQL查詢語言全部通用。本質上來講,SQL查詢語言是DBA和資料庫交互的必要工具。這里有一本非常好的書籍,《Oracle Database 11g完全參考手冊》,屬於DBA非常重要的技術參考文檔。
3、逐漸參與基本的資料庫管理工作
對於資料庫管理而言,有兩本比較好的書籍,《Oracle Database 11g DBA手冊》和《Oracle Database 11g備份與恢復指導》。這都是Oracle比較好的技術文檔,同時也是基本的資料庫管理工作的理論基礎。對於DBA而言,關系型資料庫理論和SQl查詢語言理論是DBA真正的技術理論基礎,資料庫管理工作更多的時候只是一種工具。而且,實踐才是檢驗和提高DBA技術的唯一標准。從資料庫日常管理工作中學習,從實踐中提高,才是DBA成長的唯一出路。
4、繼續學習資料庫技術
參與Oracle培訓,獲得Oracle認證其實對於DBA而言,還遠遠不夠。IT行業是一個技術更新速度非常頻繁的行業。而DBA行業的技術更新,更是遠勝於IT行業。以Oracle為代表的資料庫廠商,都投入了大量的資金和資源到技術研發中去,Oracle的技術基本都是每三個就會進行一次大的更新。這也是很多的Oracle官方培訓機構普遍採用PDF電子教材的根本原因所在。去閱讀,去學習,去不斷豐富自己的技術理論和實踐能力。
5、不斷嘗試參與案例
對於DBA而言,日常的資料庫管理工作,還只是基本職能之一。要想在DBA行業走得更遠,豐富自己的技術實力才是王道。所以,嘗試不斷地去測試案例,不斷地去資料庫中尋找疑難雜症,不斷地提出解決方案,從眾多的解決方案中尋找優秀的方案,吸取經驗,也是DBA學習的另外一種非常有效的手段。畢竟,日常的資料庫管理都不會遇到太多的問題,需要自己去創建模型,自己去創建案例。當然,如果日常管理的資料庫都能不斷出現各種各樣的問題,那說明你在DBA的道路上,還仍重而道遠。
6、尋找良師
在DBA行業發展,一個優秀的引路人是DBA生涯最好的指明燈。他們往往能夠在你的DBA生涯中,給予你比較寶貴的建議,傳授給你比較好的經驗的積累,使你在DBA的道路上,盡可能少地走彎路。
7、參與本地討論組
目前,各種交互平台上,DBA技術討論組非常多,甚至還有很多跨城市、跨國家的用戶討論組。這其中,本地討論組是一種非常好的資源,很多時候還會舉行線下的聚會,討論資料庫相關的話題。
四、中級DBA進階
請記住,SQL語言、關系型資料庫理論和基本的資料庫管理任務,是作為一名初級DBA所必備的技術理論和實踐基礎。如果你已經成為初級DBA,並確信掌握了上面三種技術,而且也開始厭倦不斷地閱讀技術文檔。那麼接下來的建議將帶你進入中級DBA的技術殿堂。
1、學習操作系統和伺服器硬體
我們知道,資料庫是建立在操作系統和伺服器硬體之上的。操作系統,作為硬體和資料庫之間交互的中間層,在日常的資料庫維護工作中,也是經常遇到諸多疑難雜症的。如果是Unix操作系統則需要熟悉和掌握Unix命令行語句。如果是Windows Server操作系統,則需要學習操作系統的維護、管理和優化。當然,作為承載資料庫和操作系統的伺服器硬體,也是很有必要的。
2、學習一門開發語言
對於資料庫而言,並不是單獨存在的。作為後台運行的資料庫,很多時候都有前端的操作界面和功能的實現。畢竟,並不是所有的軟體開發者都精通資料庫編程。特別在一些大型的IT企業,DBA往往都需要和軟體開發程序員合作,搭建軟體運行和數據存儲的後台資料庫。學習一門開發語言,能夠讓你很好地理解資料庫開發在程序設計中的意義和作用。並能在和軟體開發程序員的合作中,更好地實現程序員理想的功能。
3、取得認證
對於已經成為DBA的你而言,認證將不再作為DBA行業的敲門磚。更多的時候,認證對於初級DBA而言,是一種學習的過程,同時也是自我價值的實現過程。同時,在參與認證考試的時候,也能夠從和其他DBA的交流中,學習一些從未接觸過的技術或者經驗。
成為一名中級DBA,OCP(Oracle Certified Professional)是你必須考取的認證。作為資料庫行業的大佬,Oracle的技術實力是不言而喻的。而且,DBA行業的最高級別認證,也是屬於Oracle認證體系的。
更重要的是,取得一門認證,對於你的DBA生涯的發展而言,是大有裨益的。所以,去取得認證吧。
4、獲得技術資源庫
對於DBA而言,Technet賬戶是必須的。這是眾多DBA少有的技術、資源交流聚集地。在共享Oracle知識,分享Oracle資源的同時,也能夠尋找並獲取對你而言有價值的Oracle資源。
5、更多的交流
隨著新一代互聯網技術的興起和發展,越來越多的新奇的交互手段層出不窮。即時交流工具、新聞組、論壇、irc、聊天室,都可以成為DBA們交流的舞台。但是,傳統的新聞組和論壇,依然保有無可比擬的技術優勢,可以回答你提出的資料庫問題。真正優秀的交流社區,資料庫高手們是樂意與你分享他們的技術經驗的。
Usenet newsgroup------comp.databases.oracle.server和comp.databases.oracle.misc,這是兩個世界性的Oracle資料庫技術新聞組。當然,需要比較好的英文功底。
Quest Pipelines------中等的Pipelines,筆者的最愛。
五、成就高級DBA
高級DBA更多的時候,被人成為資料庫專家。經過長期的學習和實踐,你已經准備好像高級DBA發起沖刺了。如果准備好了,下面的內容將幫你在DBA的道路上走得更遠。
1、閱讀資料庫技術文檔
對於DBA而言,真正的技術寶庫,就是資料庫廠商給出的官方技術文檔幾乎所以的技術理論都涵蓋到這些技術文檔中。而且,原版的技術文章更具價值。目前市面上,幾乎所有的資料庫書籍都是技術文檔的解讀。當然,這需要你有過硬的英文閱讀能力。而且,每個版本的技術文檔都有區別。Oracle Database 11g就在Oracle Database 10g的基礎上,加入了11g的新特徵和新技術。當然,有的高級DBA並沒有讀過技術文檔,這在很大程度上,只是特例。如果一個版本的技術文檔,你通讀至少12次以上,相信每次都會有新的感悟,你也會逐漸了解到資料庫真正的技術核心價值。
2、探尋各個領域的專家之路
高級DBA幾乎是資料庫領域真正的專家。而涉及到資料庫領域,備份與恢復、調優等領域很多。從最簡單的開始,嘗試了解全部的技術手段和解決問題方案,嘗試成為這個領域的專家。之後再逐漸擴展到其他領域。對於IT行業而言,技術更新換代的速度非常快,而以Oracle為代表的資料庫廠商,都擁有自己強大的資料庫技術研發團隊。幾乎每3個月,Oracle技術就會更新一次。去學習,保持技術水平的領先性,你一定能成為資料庫專家。
3、繼續參與社會化媒體的討論
經過長期的學習和實踐,相信你已經積累了自己的社會化媒體DBA技術交流平台。積極地去參與資料庫技術討論,將會讓你在DBA的道路上走得更遠。如果一個平台沒有什麼有價值的技術討論,不妨嘗試換一個平台。
4、總結自己的技術經驗
學習只是一個成長的經歷,總結才能在不斷學習中,找出自己的不足之處。所以,以學技術白皮書的方式,去嘗試總結自己多年來所學到的技術和積累的經驗。不斷梳理資料庫技術和理論架構,你會發現,自己技術的不足之處很難有所建樹。針對這些不足之處可以適當得強化和提高。當你嘗試總結的時候,你會吃驚地發現,曾經都快遺忘的技術理論又開始出現在腦海里,這是非常美妙的體驗。
5、成為Oracle解決方案專家
對於DBA而言,不斷積累遇到的資料庫問題,甚至是故意破壞資料庫以探尋資料庫疑難問題,是每個DBA幾乎都要經歷的過程。高級DBA基本都是Oracle解決方案專家,能夠根據Oracle資料庫出現各種問題,很快地提出解決方案。
6、成為Oracle性能調優專家
Oracle資料庫日常問題的解決、性能優化,幾乎成為了每個僱用DBA企業都十分關注的問題。性能調優對於企業而言,能夠在很大程度上節約企業的成本。一個Oracle性能調優專家能夠在很大程度上,以最優的Oracle資料庫解決方案來實現最好的Oracle資料庫存儲。
7、成為承載能力計劃專家
評估一個資料庫的承載能力,幾乎成為了高級DBA的必修課。如何准確預估數據增長量、交易增長量,從而更好的規劃、設計資料庫的承載能力,以最優的軟硬體配置實現企業利益的最大化,這才是高級DBA的價值所在。
8、關注新技術
雖然,在國內,新技術的實現需要一段很長的時間。但是,盡早掌握資料庫新技術,對於高級DBA而言是非常必要的。總有大型的企業,需要不斷革新和改進自己的資料庫技術,這就要求高級DBA不斷關注新技術,學習新技術。