實時資料庫開源
A. 「大數據架構」用哪種框架更為合適
個完整的大數據平台應該提供離線計算、即席查詢、實時計算、實時查詢這幾個方面的功能。
hadoop、spark、storm 無論哪一個,單獨不可能完成上面的所有功能。
hadoop+spark+hive是一個很不錯的選擇.hadoop的HDFS毋庸置疑是分布式文件系統的解決方案,解決存儲問題;hadoop maprece、hive、spark application、sparksql解決的是離線計算和即席查詢的問題;spark streaming解決的是實時計算問題;另外,還需要HBase或者Redis等NOSQL技術來解決實時查詢的問題。
除了這些,大數據平台中必不可少的需要任務調度系統和數據交換工具;
任務調度系統解決所有大數據平台中的任務調度與監控;數據交換工具解決其他數據源與HDFS之間的數據傳輸,比如:資料庫到HDFS、HDFS到資料庫等等。關於大數據平台的架構技術文章,可搜索"lxw的大數據田地",裡面有很多。
B. 數據可視化有哪些商業軟體
1.
開源大數據生態圈
Hadoop
HDFS、Hadoop
MapRece,
HBase、Hive
漸次誕生,早期Hadoop生態圈逐步形成。
開源生態圈活躍,並免費,但Hadoop對技術要求高,實時性稍差。
2.
商用大數據分析工具
一體機資料庫/數據倉庫(費用很高)
IBM
PureData(Netezza),
Oracle
Exadata,
SAP
Hana等等。
數據倉庫(費用較高)
Teradata
AsterData,
EMC
GreenPlum,
HP
Vertica
等等。
數據集市(費用一般)
QlikView、
Tableau
、國內永洪科技Yonghong
Data
Ma嘗伐佰和脂古拌汰飽咯rt
等等。
前端展現
用於展現分析的前端開源工具有JasperSoft,Pentaho,
Spagobi,
Openi,
Birt等等。
用於展現分析商用分析工具有Cognos,BO,
Microsoft,
Oracle,Microstrategy,QlikView、
Tableau
、國內永洪科技Yonghong
Z-Suite等等。
C. matrixdb是開源嗎
matrixdb開源的。
MatrixDB,全球首款超融合時序資料庫。基於開源Greenplum,實現海量時空數據的快速採集、高效存儲、實時分析以及深度學習ML加AL,比傳統的時序資料庫InfluxDB、OpenTSDB性能快50倍,空間節省60%以上,比傳統的MPP資料庫快3至100倍。
D. 古橋大數據實時分析平台是開源的嗎
是的。
大數據分析平台和工具DiscoDisco最初由諾基亞開發,這是一種分布式計算框架,與Hadoop一樣,它也基於MapRece。它包括一種分布式文件系統以及支持數十億個鍵和值的資料庫。
大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過主流軟體工具,對於「大數據」(Bigdata)研究機構Gartner給出了這樣的定義。「大數據」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
E. nosql資料庫一般有哪幾種類型分別用在什麼場景
特點:
它們可以處理超大量的數據。
它們運行在便宜的PC伺服器集群上。
PC集群擴充起來非常方便並且成本很低,避免了「sharding」操作的復雜性和成本。
它們擊碎了性能瓶頸。
NoSQL的支持者稱,通過NoSQL架構可以省去將Web或Java應用和數據轉換成SQL友好格式的時間,執行速度變得更快。
「SQL並非適用於所有的程序代碼,」 對於那些繁重的重復操作的數據,SQL值得花錢。但是當資料庫結構非常簡單時,SQL可能沒有太大用處。
沒有過多的操作。
雖然NoSQL的支持者也承認關系資料庫提供了無可比擬的功能集合,而且在數據完整性上也發揮絕對穩定,他們同時也表示,企業的具體需求可能沒有那麼多。
Bootstrap支持
因為NoSQL項目都是開源的,因此它們缺乏供應商提供的正式支持。這一點它們與大多數開源項目一樣,不得不從社區中尋求支持。
優點:
易擴展
NoSQL資料庫種類繁多,但是一個共同的特點都是去掉關系資料庫的關系型特性。數據之間無關系,這樣就非常容易擴展。也無形之間,在架構的層面上帶來了可擴展的能力。
大數據量,高性能
NoSQL資料庫都具有非常高的讀寫性能,尤其在大數據量下,同樣表現優秀。這得益於它的無關系性,資料庫的結構簡單。一般MySQL使用 Query Cache,每次表的更新Cache就失效,是一種大粒度的Cache,在針對web2.0的交互頻繁的應用,Cache性能不高。而NoSQL的 Cache是記錄級的,是一種細粒度的Cache,所以NoSQL在這個層面上來說就要性能高很多了。
靈活的數據模型
NoSQL無需事先為要存儲的數據建立欄位,隨時可以存儲自定義的數據格式。而在關系資料庫里,增刪欄位是一件非常麻煩的事情。如果是非常大數據量的表,增加欄位簡直就是一個噩夢。這點在大數據量的web2.0時代尤其明顯。
高可用
NoSQL在不太影響性能的情況,就可以方便的實現高可用的架構。比如Cassandra,HBase模型,通過復制模型也能實現高可用。
主要應用:
Apache HBase
這個大數據管理平台建立在谷歌強大的BigTable管理引擎基礎上。作為具有開源、Java編碼、分布式多個優勢的資料庫,Hbase最初被設計應用於Hadoop平台,而這一強大的數據管理工具,也被Facebook採用,用於管理消息平台的龐大數據。
Apache Storm
用於處理高速、大型數據流的分布式實時計算系統。Storm為Apache Hadoop添加了可靠的實時數據處理功能,同時還增加了低延遲的儀錶板、安全警報,改進了原有的操作方式,幫助企業更有效率地捕獲商業機會、發展新業務。
Apache Spark
該技術採用內存計算,從多迭代批量處理出發,允許將數據載入內存做反復查詢,此外還融合數據倉庫、流處理和圖計算等多種計算範式,Spark用Scala語言實現,構建在HDFS上,能與Hadoop很好的結合,而且運行速度比MapRece快100倍。
Apache Hadoop
該技術迅速成為了大數據管理標准之一。當它被用來管理大型數據集時,對於復雜的分布式應用,Hadoop體現出了非常好的性能,平台的靈活性使它可以運行在商用硬體系統,它還可以輕松地集成結構化、半結構化和甚至非結構化數據集。
Apache Drill
你有多大的數據集?其實無論你有多大的數據集,Drill都能輕松應對。通過支持HBase、Cassandra和MongoDB,Drill建立了互動式分析平台,允許大規模數據吞吐,而且能很快得出結果。
Apache Sqoop
也許你的數據現在還被鎖定於舊系統中,Sqoop可以幫你解決這個問題。這一平台採用並發連接,可以將數據從關系資料庫系統方便地轉移到Hadoop中,可以自定義數據類型以及元數據傳播的映射。事實上,你還可以將數據(如新的數據)導入到HDFS、Hive和Hbase中。
Apache Giraph
這是功能強大的圖形處理平台,具有很好可擴展性和可用性。該技術已經被Facebook採用,Giraph可以運行在Hadoop環境中,可以將它直接部署到現有的Hadoop系統中。通過這種方式,你可以得到強大的分布式作圖能力,同時還能利用上現有的大數據處理引擎。
Cloudera Impala
Impala模型也可以部署在你現有的Hadoop群集上,監視所有的查詢。該技術和MapRece一樣,具有強大的批處理能力,而且Impala對於實時的SQL查詢也有很好的效果,通過高效的SQL查詢,你可以很快的了解到大數據平台上的數據。
Gephi
它可以用來對信息進行關聯和量化處理,通過為數據創建功能強大的可視化效果,你可以從數據中得到不一樣的洞察力。Gephi已經支持多個圖表類型,而且可以在具有上百萬個節點的大型網路上運行。Gephi具有活躍的用戶社區,Gephi還提供了大量的插件,可以和現有系統完美的集成到一起,它還可以對復雜的IT連接、分布式系統中各個節點、數據流等信息進行可視化分析。
MongoDB
這個堅實的平台一直被很多組織推崇,它在大數據管理上有極好的性能。MongoDB最初是由DoubleClick公司的員工創建,現在該技術已經被廣泛的應用於大數據管理。MongoDB是一個應用開源技術開發的NoSQL資料庫,可以用於在JSON這樣的平台上存儲和處理數據。目前,紐約時報、Craigslist以及眾多企業都採用了MongoDB,幫助他們管理大型數據集。(Couchbase伺服器也作為一個參考)。
十大頂尖公司:
Amazon Web Services
Forrester將AWS稱為「雲霸主」,談到雲計算領域的大數據,那就不得不提到亞馬遜。該公司的Hadoop產品被稱為EMR(Elastic Map Rece),AWS解釋這款產品採用了Hadoop技術來提供大數據管理服務,但它不是純開源Hadoop,經過修改後現在被專門用在AWS雲上。
Forrester稱EMR有很好的市場前景。很多公司基於EMR為客戶提供服務,有一些公司將EMR應用於數據查詢、建模、集成和管理。而且AWS還在創新,Forrester稱未來EMR可以基於工作量的需要自動縮放調整大小。亞馬遜計劃為其產品和服務提供更強大的EMR支持,包括它的RedShift數據倉庫、新公布的Kenesis實時處理引擎以及計劃中的NoSQL資料庫和商業智能工具。不過AWS還沒有自己的Hadoop發行版。
Cloudera
Cloudera有開源Hadoop的發行版,這個發行版採用了Apache Hadoop開源項目的很多技術,不過基於這些技術的發行版也有很大的進步。Cloudera為它的Hadoop發行版開發了很多功能,包括Cloudera管理器,用於管理和監控,以及名為Impala的SQL引擎等。Cloudera的Hadoop發行版基於開源Hadoop,但也不是純開源的產品。當Cloudera的客戶需要Hadoop不具備的某些功能時,Cloudera的工程師們就會實現這些功能,或者找一個擁有這項技術的合作夥伴。Forrester表示:「Cloudera的創新方法忠於核心Hadoop,但因為其可實現快速創新並積極滿足客戶需求,這一點使它不同於其他那些供應商。」目前,Cloudera的平台已經擁有200多個付費客戶,一些客戶在Cloudera的技術支持下已經可以跨1000多個節點實現對PB級數據的有效管理。
Hortonworks
和Cloudera一樣,Hortonworks是一個純粹的Hadoop技術公司。與Cloudera不同的是,Hortonworks堅信開源Hadoop比任何其他供應商的Hadoop發行版都要強大。Hortonworks的目標是建立Hadoop生態圈和Hadoop用戶社區,推進開源項目的發展。Hortonworks平台和開源Hadoop聯系緊密,公司管理人員表示這會給用戶帶來好處,因為它可以防止被供應商套牢(如果Hortonworks的客戶想要離開這個平台,他們可以輕松轉向其他開源平台)。這並不是說Hortonworks完全依賴開源Hadoop技術,而是因為該公司將其所有開發的成果回報給了開源社區,比如Ambari,這個工具就是由Hortonworks開發而成,用來填充集群管理項目漏洞。Hortonworks的方案已經得到了Teradata、Microsoft、Red Hat和SAP這些供應商的支持。
IBM
當企業考慮一些大的IT項目時,很多人首先會想到IBM。IBM是Hadoop項目的主要參與者之一,Forrester稱IBM已有100多個Hadoop部署,它的很多客戶都有PB級的數據。IBM在網格計算、全球數據中心和企業大數據項目實施等眾多領域有著豐富的經驗。「IBM計劃繼續整合SPSS分析、高性能計算、BI工具、數據管理和建模、應對高性能計算的工作負載管理等眾多技術。」
Intel
和AWS類似,英特爾不斷改進和優化Hadoop使其運行在自己的硬體上,具體來說,就是讓Hadoop運行在其至強晶元上,幫助用戶打破Hadoop系統的一些限制,使軟體和硬體結合的更好,英特爾的Hadoop發行版在上述方面做得比較好。Forrester指出英特爾在最近才推出這個產品,所以公司在未來還有很多改進的可能,英特爾和微軟都被認為是Hadoop市場上的潛力股。
MapR Technologies
MapR的Hadoop發行版目前為止也許是最好的了,不過很多人可能都沒有聽說過。Forrester對Hadoop用戶的調查顯示,MapR的評級最高,其發行版在架構和數據處理能力上都獲得了最高分。MapR已將一套特殊功能融入其Hadoop發行版中。例如網路文件系統(NFS)、災難恢復以及高可用性功能。Forrester說MapR在Hadoop市場上沒有Cloudera和Hortonworks那樣的知名度,MapR要成為一個真正的大企業,還需要加強夥伴關系和市場營銷。
Microsoft
微軟在開源軟體問題上一直很低調,但在大數據形勢下,它不得不考慮讓Windows也兼容Hadoop,它還積極投入到開源項目中,以更廣泛地推動Hadoop生態圈的發展。我們可以在微軟的公共雲Windows Azure HDInsight產品中看到其成果。微軟的Hadoop服務基於Hortonworks的發行版,而且是為Azure量身定製的。
微軟也有一些其他的項目,包括名為Polybase的項目,讓Hadoop查詢實現了SQLServer查詢的一些功能。Forrester說:「微軟在資料庫、數據倉庫、雲、OLAP、BI、電子表格(包括PowerPivot)、協作和開發工具市場上有很大優勢,而且微軟擁有龐大的用戶群,但要在Hadoop這個領域成為行業領導者還有很遠的路要走。」
Pivotal Software
EMC和Vmware部分大數據業務分拆組合產生了Pivotal。Pivotal一直努力構建一個性能優越的Hadoop發行版,為此,Pivotal在開源Hadoop的基礎上又添加了一些新的工具,包括一個名為HAWQ的SQL引擎以及一個專門解決大數據問題的Hadoop應用。Forrester稱Pivotal Hadoop平台的優勢在於它整合了Pivotal、EMC、Vmware的眾多技術,Pivotal的真正優勢實際上等於EMC和Vmware兩大公司為其撐腰。到目前為止,Pivotal的用戶還不到100個,而且大多是中小型客戶。
Teradata
對於Teradata來說,Hadoop既是一種威脅也是一種機遇。數據管理,特別是關於SQL和關系資料庫這一領域是Teradata的專長。所以像Hadoop這樣的NoSQL平台崛起可能會威脅到Teradata。相反,Teradata接受了Hadoop,通過與Hortonworks合作,Teradata在Hadoop平台集成了SQL技術,這使Teradata的客戶可以在Hadoop平台上方便地使用存儲在Teradata數據倉庫中的數據。
AMPLab
通過將數據轉變為信息,我們才可以理解世界,而這也正是AMPLab所做的。AMPLab致力於機器學習、數據挖掘、資料庫、信息檢索、自然語言處理和語音識別等多個領域,努力改進對信息包括不透明數據集內信息的甄別技術。除了Spark,開源分布式SQL查詢引擎Shark也源於AMPLab,Shark具有極高的查詢效率,具有良好的兼容性和可擴展性。近幾年的發展使計算機科學進入到全新的時代,而AMPLab為我們設想一個運用大數據、雲計算、通信等各種資源和技術靈活解決難題的方案,以應對越來越復雜的各種難題。
F. 常用的大數據工具有哪些
大數據分析的前瞻性使得很多公司以及企業都開始使用大數據分析對公司的決策做出幫助,而大數據分析是去分析海量的數據,所以就不得不藉助一些工具去分析大數據,。一般來說,數據分析工作中都是有很多層次的,這些層次分別是數據存儲層、數據報表層、數據分析層、數據展現層。對於不同的層次是有不同的工具進行工作的。下面小編就對大數據分析工具給大家好好介紹一下。
首先我們從數據存儲來講數據分析的工具。我們在分析數據的時候首先需要存儲數據,數據的存儲是一個非常重要的事情,如果懂得資料庫技術,並且能夠操作好資料庫技術,這就能夠提高數據分析的效率。而數據存儲的工具主要是以下的工具。
1、MySQL資料庫,這個對於部門級或者互聯網的資料庫應用是必要的,這個時候關鍵掌握資料庫的庫結構和SQL語言的數據查詢能力。
2、SQL Server的最新版本,對中小企業,一些大型企業也可以採用SQL Server資料庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了。
3、DB2,Oracle資料庫都是大型資料庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型資料庫公司都提供非常好的數據整合應用平台;
接著說數據報表層。一般來說,當企業存儲了數據後,首先要解決報表的問題。解決報表的問題才能夠正確的分析好資料庫。關於數據報表所用到的數據分析工具就是以下的工具。
1、Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規范的報表設計思想,早期商業智能其實大部分人的理解就是報表系統,不藉助IT技術人員就可以獲取企業各種信息——報表。
2、Tableau軟體,這個軟體是近年來非常棒的一個軟體,當然它已經不是單純的數據報表軟體了,而是更為可視化的數據分析軟體,因為很多人經常用它來從資料庫中進行報表和可視化分析。
第三說的是數據分析層。這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和數據挖掘工具;
1、Excel軟體,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟體;
2、SPSS軟體:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟體包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟體。
最後說表現層的軟體。一般來說表現層的軟體都是很實用的工具。表現層的軟體就是下面提到的內容。
1、PowerPoint軟體:大部分人都是用PPT寫報告。
2、Visio、SmartDraw軟體:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這里可以得到很多零件;
3、Swiff Chart軟體:製作圖表的軟體,生成的是Flash
G. 內存資料庫,MySQL和sqlite,哪個更好
一般,內存資料庫對應磁碟資料庫,而mysql和sqlite通常指的都是磁碟資料庫的兩種不同管理系統。下面分別回答一下內存資料庫和磁碟資料庫優劣,mysql和sqlite優劣。
內存資料庫:
基於內存的具有高效I/O、高並發的資料庫。缺點存儲量有限、可恢復性差。
1.
磁碟資料庫:
基於磁碟存儲穩定、保證數據可恢復性、一致性的資料庫。缺點是實時性不足。
兩種資料庫一般來講不會沖突,沒有一個企業能夠脫離磁碟資料庫,固化的穩定的數據一般都是採用磁碟資料庫。但是,當企業面臨用戶量擴大,並發性、實時性要求不斷提高時,便會藉助內存資料庫。因此,根據你的場合選擇合適的資料庫存儲形式非常重要。對於內存資料庫,其實自己也沒怎麼用過,給你個傳送門:http://dev.yesky.com/418/35355918.shtml
2.
對於mysql和sqlite,我個人覺得目前mysql非常通用,免費開源,學習成本低,應用面廣泛,落地迅速,與各大主流的編程語言都有通用介面。相對較好,sqlite我只在學校時候用過,Σ( ° △ °|||)︴。
一起學習一起進步!
H. Oracle是什麼
一般意義上來說是 Oracle 公司的一個軟體產品,是資料庫軟體
Oracle
開放分類: 軟體公司、納斯達克上市公司、美國公司、資料庫軟體、甲骨文
1.oracle是殷墟(Yin Xu)出土的甲骨文(oracle bone inscriptions)的英文翻譯的第一個單詞。
2.甲骨文股份有限公司是全球最大的資料庫軟體公司,總部位於美國加州的紅木灘。
公司類型 上市公司 (NASDAQ: ORCL)
口號 Oracle is the information company
成立於 加利福尼亞 (1977年)[1]
總部位於 美國加州紅木灘市
重要人物 勞倫斯·埃里森 Lawrence (Larry) J. Ellison, 首席執行官
產業 資料庫軟體
雇員數目 35000+
產品
資料庫伺服器
應用伺服器
開發工具
中間件產品
BI
客戶關系管理
供應鏈管理
JDE
收入 179億美元 (2007財年)
主要產品
甲骨文公司主要的產品目前分為兩大類:
* 伺服器(伺服器)及工具(主要競爭對手:國際商用機器、微軟)
* 資料庫伺服器:2008年最新版本11G
* 應用伺服器: Oracle Application Server
* 開發工具:Oracle JDeveloper,Oracle Designer,Oracle Developer,等等
* 應用軟體(主要競爭對手:德國SAP公司。)
* 企業資源計劃(ERP)軟體。已有10年以上的歷史。2005年,並購了開發企業軟體的人科軟體公司(PeopleSoft)以增強在這方面的競爭力。
* 客戶關系管理(CRM)軟體。自1998年開始研發這種軟體。2005年,並購了開發客戶關系管理軟體的希柏軟體公司(Siebel)。
Oracle公司是全球最大的信息管理軟體及服務供應商,成立於1977年,總部位於美國加州 Redwood shore。2000財年(99年6月到2000年5月)營業額達101億美元,再創Oracle公司銷售額歷史新高,比去年增長了13億美元,盈利增長61%,達到21億美元。Oracle公司現有員工超過三萬六千人,服務遍及全球145個國家。Oracle公司擁有世界上唯一一個全面集成的電子商務套件Oracle Applications R11i,它能夠自動化企業經營管理過程中的各個方面,深受用戶的青睞,促使Oracle應用軟體在2000財年第四季度的銷售額達4.47億美元,與SAP公司的同期應用軟體銷售額3.52億美元相比,多出近1億美元,這一事實表明,Oracle已經是世界最大的應用軟體供應商。Oracle電子商務套件涵蓋了企業經營管理過程中的方方面面,雖然它在不同的方面分別面對不同的競爭對手,而Oracle電子商務解決方案的核心優勢就在於它的集成性和完整性,用戶完全可以從Oracle公司獲得任何所需要的應用功能,更重要的是,它們具有一致的基於Internet技術的應用體系結構,而如果用戶想從其它廠商處獲得Oracle電子商務所提供的完整功能,不僅需要從多家廠商分別購買不同的應用,而且需要另請咨詢公司把這些不同的應用裝配起來,還必須確保它們能夠協同地工作。
先進的產品和高效率的企業運作,是Oracle公司利潤得以繼續增長的重要原因,一年前,Oracle公司確定了通過採用自身的Internet電子商務解決方案,實現每年節省10億美元企業日常運作費用的目標,這一數據相當於將我們的年度利潤率提高10%。
四年前電子商務在全球范圍內還僅處於萌芽狀態時,Oracle公司便前瞻性地作出了從領先的資料庫廠商向以Internet計算為基礎的完整的電子商務解決方案供應商轉型的戰略部署。這一前瞻性戰略為Oracle帶來了巨大的利益,今天,Oracle能夠領先於競爭對手提供包括平台產品、應用產品和完善的服務在內的先進的、完整的、集成的電子商務解決方案,可以無縫集成供應鏈管理(SCM)、企業資源管理(ERP)、客戶資源管理(CRM)和企業商業智能(BI)和電子商務應用IP(Internet Pocurement)、Exchange、Portal-to-go等產品。Oracle從低端到高端的所有方案100%基於Internet應用體系結構,都可以通過Web安全、直接地訪問,使企業能夠通過Web完成包括報價、定單、支付、執行、服務等在內的企業業務過程的所有環節,幫助企業將現有業務內容快速轉移到電子商務,迅速獲得來自電子商務的高效益。
Oracle應用產品包括財務、供應鏈、製造、項目管理、人力資源和市場與銷售等150多個模塊,榮獲多項世界大獎,現已被全球近7600多家企業所採用。由於在電子商務方面的傑出表現,Oracle公司在美國Mongan Stanley公司最新公布的權威性全球企業1000強中,從去年的第122名一躍成為第13名,成為全球第二大獨立軟體公司和最大的電子商務解決方案供應商。目前, Amazon和Dell等全球十個最大的Internet電子商務網站、全球十個最大的B-to-B網站中的九個、93%的上市.COM公司、65家「財富全球100強」企業均不約而同地採用Oracle電子商務解決方案。
Oracle中國公司
1989年Oracle公司正式進入中國市場,成為第一家進入中國的世界軟體巨頭,標志著剛剛起飛的中國國民經濟信息化建設已經得到Oracle的積極響應,由Oracle首創的關系型資料庫技術開始服務於中國用戶。1991年7月,經過了近兩年時間的努力開拓,為了更好地與迅速發展的業務相適應,Oracle在北京建立獨資公司。今天的Oracle中國公司擁有超過3500名員工,並在全國十二個城市設立了分公司。
為了幫助中國用戶及時、充分利用世界最先進的計算機軟體技術與產品,Oracle中國公司在產品漢化方面投入了大量的資源,目前,Oracle的大部分產品均已實現了全面中文化,中文版產品的更新節奏與美國本土基本同步一致。與此同時,Oracle在中國得到了數以百計的國內計算機企業的合作與支持,除了惠普、Sun、康柏、Cisco、Intel等Oracle全球聯盟合作夥伴和普華永道咨詢有限公司、安達信企業咨詢有限公司、安盛咨詢、德勤企業管理咨詢公司、凱捷安永咨詢(亞太)有限公司等Oracle全球系統集成商外,Oracle公司在中國還建立起完整的合作夥伴體系,6家增值經銷商、72家獨立軟體開發商、3家應用軟體合作夥伴、180家授權分銷商和4家授權培訓中心,他們共同構成了基於Oracle技術產品基礎的全國性市場開拓、系統集成、增值開發與技術服務體系,為Oracle在中國的業務發展提供了強有力的支持。由他們開發的數百個基於Oracle平台的商品化應用軟體包,已經廣泛應用於國內的政府部門、電信、郵政、公安、金融、保險、能源電力、交通、科教、石化、航空航天、民航等各行各業。
甲骨文公司主要產品簡介
1. Oracle電子商務套件(Oracle E-Business Suite)
Oracle電子商務套件是行業中第一個集成的基於互聯網的商務應用套件,它將前台與後台運營中的關鍵業務流程自動化。Oracle電子商務套件涵蓋了營銷、銷售、服務、合同、定單管理、產品設計、采購、供應鏈、製造、財務、項目管理、人力資源與專業服務自動化在內的企業中每一個領域的業務。2001年全球共有1100多家企業實施了Oracle電子商務套件,目前全球已經有超過12000家用戶正在獲益於Oracle電子商務套件所帶來的前所未有的好處。
自從Oracle電子商務套件首次面世以來,甲骨文公司已經推出了6種電子商務套件的增強版本,從而形成了一整套成熟的、功能齊全的應用套件。Oracle電子商務套件能夠使用戶在實施業務應用時擁有前所未有的可選擇性與靈活性,它的開放式基礎架構與單一數據模型使用戶在部署套件中的應用軟體時擁有多種選擇,既可以單獨使用,也可以組成業務流,還可以作為一個整體的集成套件來部署。Oracle電子商務套件既可以作為用CD ROM為載體的傳統軟體的形式,也可以作為一種在線服務的形式來提供給用戶。
2. Oracle10g —— 新一代電子商務平台
Oracle10g是業界第一個完整的、智能化的新一代Internet基礎架構,Oracle10g電子商務平台實際上是指Oracle資料庫10g、Oracle應用伺服器10g和Oracle開發工具套件10g的完整集成。
Oracle資料庫10g是第一套具有無限可伸縮性與高可用性,並可在集群環境中運行商業軟體的互聯網資料庫,具有400多個領先的資料庫功能,在集群技術、高可用性、商業智能、安全性、系統管理等方面都實現了新的突破。作為甲骨文公司長達十年的軟體技術研發成果,真正應用集群技術(Real Application Clusters)能夠提供近乎無限的擴充能力與整體可用性,為用戶帶來透明的、高速增長的集群功能。
Oracle應用伺服器10g是J2EE認證的、最輕、最快、最具伸縮性的應用伺服器,提供了企業門戶軟體、無線支持、高速緩存、輕量級J2EE引擎、商務智能、快速應用開發、應用與業務集成、Web 服務等多種應用開發功能,形成完整的電子商務應用開發和部署環境。使用了Oracle應用伺服器10g的用戶可以通過升級軟體來取代升級硬體,大大的節省了基礎設施的成本花費。
Oracle開發工具套件10g是一套完整的集成開發工具,可用於快速開發使用Java和XML語言的互聯網應用和Web服務,支持任何語言、任何操作系統、任何開發風格、開發生命周期的任何階段以及所有最新的互聯網標准。
9i之後的Oracle的硬體要求很高,(Windows版本)9i建議配512M內存,10g建議配1G內存。
Oracle資料庫的體系結構
Oracle資料庫包括Oracle資料庫伺服器和客戶端。
Oracle資料庫伺服器:
Oracle Server是一個對象一關系資料庫管理系統。它提供開放的、全面的、和集成的信息管理方法。每個Server由一個 Oracle DB和一個 Oracle Server實例組成。它具有場地自治性(Site Autonomy)和提供數據存儲透明機制,以此可實現數據存儲透明性。每個 Oracle資料庫對應唯一的一個實例名SID,Oracle資料庫伺服器啟動後,一般至少有以下幾個用戶:Internal,它不是一個真實的用戶名,而是具有SYSDBA優先順序的Sys用戶的別名,它由DBA用戶使用來完成資料庫的管理任務,包括啟動和關閉資料庫;Sys,它是一個 DBA用戶名,具有最大的資料庫操作許可權;System,它也是一個 DBA用戶名,許可權僅次於 Sys用戶。
客戶端:
為資料庫用戶操作端,由應用、工具、SQL* NET組成,用戶操作資料庫時,必須連接到一伺服器,該資料庫稱為本地資料庫(Local DB)。在網路環境下其它伺服器上的 DB稱為遠程資料庫(Remote DB)。用戶要存取遠程 DB上的數據時,必須建立資料庫鏈。
Oracle資料庫的體系結構包括物理存儲結構和邏輯存儲結構。由於它們是相分離的,所以在管理數據的物理存儲結構時並不會影響對邏輯存儲結構的存取。
1.邏輯存儲結構
它由至少一個表空間和資料庫模式對象組成。這里,模式是對象的集合,而模式對象是直接引用資料庫數據的邏輯結構。模式對象包括這樣一些結構:表、視圖、序列、存儲過程、同一詞、索引、簇和資料庫鏈等。邏輯存儲結構包括表空間、段和范圍,用於描述怎樣使用資料庫的物理空間。而其中的模式對象和關系形成了資料庫的關系設計。
數據塊(Block):是資料庫進行UO操作的最小單位,它與操作系統的塊不是一個概念。oracle資料庫不是以操作系統的塊為單位來請求數據,而是以多個Oracle資料庫塊為單位。
段(Segment):是表空間中一個指定類型的邏輯存儲結構,它由一個或多個范圍組成,段將佔用並增長存儲空間。
其中包括:
數據段:用來存放表數據;.
索引段:用來存放表索引;
臨時段:用來存放中間結果;
回滾段:用於出現異常時,恢復事務。
范圍(Extent):是資料庫存儲空間分配的邏輯單位,一個范圍由許多連續的數據塊組成,范圍是由段依此分配的,分配的第一個范圍稱為初始范圍,以後分配的范圍稱為增量范圍。
年表
約70年代 一間名為Ampex的軟體公司,正為中央情報局設計一套名叫Oracle的資料庫,Ellison是程序員之一。
1977 年艾利森與女上司Robert Miner創立「軟體開發實驗室」(Software Development Labs),當時IBM發表「關聯資料庫」的論文,艾利森以此造出新資料庫,名為甲骨文。
1978 年 公司遷往矽谷,更名為「關系式軟體公司」 (RSI),兩年後,共有8名員工,年收入少於100萬美金。最先提出「關聯資料庫」的IBM採用RSI的資料庫。1982年再更名為甲骨文(Oracle)。
1984年 三年內,先後進軍加、荷、英、奧地利、日、德、瑞士、瑞典、澳洲、芬蘭、法、香港、挪威、西班牙。1986年上市時,年收入暴升至5500 萬美元,同年3月招股,集資3150萬美元。
1987年 年收入達到 1.31 億美元,甲骨文一年後成為世界第四大軟體公司。兩年內再進軍墨西哥、巴、中、塞普勒斯、馬來西亞及紐西蘭。一年後,收入再升一倍至2.82億美元。
1990年 甲骨文兩年內揮軍進入智利、希臘、韓、葡、土、委內瑞拉、台、比利是、阿根延、哥倫比亞、哥斯大黎加及菲等地,但市甲骨文首次錄得虧蝕,市值急跌80%,艾利森首次安排資深管理人員參與經營。
1992年 旗鑒產品Oracle 7面世,該公司重拾升軌,年收入達到 11.79 億美元。曾被視為甲骨文接班人、但後來被踼出局的Raymond Lane擔任營運總監。
1995年 艾利森宣布PC已死,把全數產品推向網際網路發展,並另組「網路電腦公司」(Network Computer),銷售「網路電腦」,最終被淘汰收場。
2000年 科網接近尾聲時,推出E-Business Suite,搶占應用產品市場,與昔日的生意夥伴構成嚴重利益沖突。同期微軟及IBM數據技術提升,此後Oracle新增訂單數目的佔有率,在兩年內下跌6.6%,業務倒退10%。
2003年 敵意收購仁科軟體公司(Peoplesoft),引起業界轟動。兩公司的爭嗌新聞層出不窮。同年美國司法部落案阻止甲骨文收購。
補充內容:
oracle11g
2007年7月12日,甲骨文公司在美國紐約宣布推出資料庫Oracle 11g,這是Oracle資料庫的最新版本。甲骨文介紹說,Oracle 11g有400多項功能,經過了1500萬個小時的測試,開發工作量達到了3.6萬人/月。
有意思的是,根據甲骨文以往幾個版本的發行經驗,發布新版Oracle資料庫的頻率在3年左右,以此類推,Oracle 11g應該在07年年底發布,選擇在7月份發布,不知道是否和代號Katmai的SQL Server 2008有關,因為目前還處於測試階段的SQL Server 2008將在08年2月發布,業內用Oracle 10g和SQL Server 2003做比較也曾一度惹惱了甲骨文。
XML顯高溫
當XML面世之時,也許沒有哪個資料庫廠商會對這種技術給以足夠的關注,然而在今天,XML已經開始對數據存儲產生巨大的影響。到現在,這種可擴展標記語言已是各種數據,特別是文檔的首選格式,國際主流的資料庫廠商們自然也隨行就市,全都推出了兼容傳統關系型數據與XML數據混合應用的新一代資料庫產品。
XML在數據存儲方面有一個明顯的優點,那就是可以直接將邏輯關系編寫在XML文件當中。一個時髦的XML資料庫應該提供哪些功能呢?歸納起來應該有四個基本功能:使用、存儲、查詢和產生XML的能力。
在Oracle 10g中,曾被人們津津樂道的最重要的改進是增加了對XML schema(XML語法)轉換的支持,它允許用戶通過將現有的數據映射為新的schema來實現XML schema轉換。而不必把所有XML數據輸出後再重新輸入進去,其它事情將由資料庫自動完成。
在Oracle 11g中, XML DB的性能又獲得很大提高,XML DB是Oracle資料庫的一個組件,客戶可以以本機方式存儲和操作XML數據。11g增加了對二進制XML數據的支持,現在客戶可以選擇適合自己特定應用及性能需求的XML存儲選項。
當然,不僅僅是甲骨文看好XML,為吸引Oracle用戶,IBM公司DB2 9打XML旗號直接把XML作為其新產品的最大賣點;微軟和Sybase也宣稱它們的產品也可以實現高性能XML存儲與查詢,使現有應用更好地與XML並存。
網格計算有點冷
新的Oracle 11g仍使用g(Grid)作為後綴,以代表這是一個包含了網格技術基礎的資料庫。甲骨文稱,Oracle 11g能更方便地在低成本伺服器和存儲設備組成的網格上運行。不過,目前僅有IBM DB2資料庫也支持網格計算技術。
網格計算將多個伺服器和存儲器當作一台大型電腦協調使用,使它們在高速網路上動態地共享計算機資源,以滿足不斷變化的計算需求。簡而言之,即將多個伺服器和存儲器當作一台主機協調使用。網格計算被廣泛視為未來的計算方式。
盡管微軟對網格計算的興趣也很濃厚,承諾要讓Windows能夠更好地適應高數據強度的計算網格。但微軟除了在內部研究之外,似乎一直在這個話題上非常沉默。對於資料庫中網格計算,微軟和Sybase方面表示,網格應用在技術上還需解決一些問題(如:多節點性能問題) ,網格技術要成為商業應用的主流,還需要幾年時間在應用和產品上進一步完善。
不容樂觀的是,在咨詢公司Quocirca發布的調查顯示,我國網格實際採用率仍然偏低,總體網格指數在15個被調查國家中只排第9位,處於中下游,甲骨文表示,中國用戶可能對網格的價值還沒有真正接受。很多中國企業有一種觀望的心態,覺得應用網格存在風險。
11g安全了嗎?
有業內人士曾表示,Oracle 10g只能算是一個過渡版本。因為06年,下一代安全軟體機構NGSS對微軟SQL Server和Oracle資料庫做了一個弱點對比,結果表明Oracle的資料庫產品存在更多的弱點。
NGSS的研究人員稱,Oracle有233個缺陷點,而SQL Server只有59個。這些缺陷在SQL Server7、2000以及2005中,在Oracle8、9以及10g版本中被報道,並被修復。分析機構ESG也發布調查報告表示,在安全性方面微軟擊敗了甲骨文,似乎甲骨文資料庫「無懈可擊」的安全神話已不復存在。
針對那些不斷對甲骨文安全性能表示批評的專家,甲骨文終於開始猛烈還擊。2006年底,甲骨文全球技術事業部的安全經理Eric Maurice在公司的博客上表示,甲骨文在開發和安全方面的技術水平居業界領先位置。與微軟資料庫的安全性能比較,不過是別有用心的人在玩數字游戲,甲骨文不會讓外部的壓力改變其既定的安全策略。
到現在,起碼可以從資料上看到,Oracle的安全認證獲得最高認證級別的ISO標准認證,而SQL Server並沒有獲得什麼安全認證。從這方面證明了Oracle的安全性不應該被受到如此指責。
從甲骨文此次推出的11g可以看到,在安全方面除了10g已經存在的數據閥門和加密外,11g又增加了四項安全功能,即安全備份、非對稱數據的授權安全檢索、監控、管理和報警。
Oracle 11g資料庫增強了Oracle透明數據加密功能,將這種功能擴展到了卷級加密之外。11g還增加了表空間加密功能,可用來加密整個表、索引和所存儲的其它數據。存儲在資料庫中的大型對象也可以加密。
看來甲骨文很注重11g在安全上的表現,閃回交易技術可以撤銷錯誤交易以及任何相關交易,並行備份和恢復功能。另外,一種新的顧問軟體—數據恢復顧問,可自動調查問題,智能地確定恢復計劃並處理多種故障情況。
Oracle 11g的Oracle Data Guard組件可用於對生產資料庫的報告、備份、測試和「滾動」升級。通過將工作量從生產系統卸載到備用系統,並組成一個更經濟的災難恢復解決方案。
也許正是在安全性上的增強,才使得甲骨文公司資料庫伺服器技術高級副總裁Andy Mendelsohn自信地表示:「Oracle 11g真正克服了挑戰並實現了真正的創新。」
一個瘋狂的發燒友在自家的車庫中改造了小型IDC,並利用Sun Enterprise 220R Server架設了Oracle 10g資料庫
增強信息生命周期管理和存儲管理能力:引入了更多的自助式管理和自動化功能;
◆透明的加密:Oracle將這種功能擴展到了卷級加密之外;
◆提高信息可用性:免受計劃停機和意外宕機影響;
◆更快的XML:通過XML DB組件,客戶可以本機方式存儲和操作XML數據;
◆增強了自助式管理和自動化能力:增加了自動SQL和存儲器微調等管理功能;
◆增強了應用開發能力:提供多種開發工具供開發人員選擇,包括Java實時編譯器。
開源資料庫成熟時
以MySQL、PostgreSQL為代表的開源資料庫系統,已成為取代閉源資料庫的一種頗具吸引力的選擇。
成熟的開源資料庫,讓Oracle這樣的閉源廠商難以騰飛
知名的網路游戲The Matrix Online(駭客帝國Online),每天有數萬名網上玩家同時在線,為了能夠支撐龐大的在線游戲玩家同時進行游戲,Sony Online Entertainment(索尼在線娛樂公司,以下簡稱SOE)需要密集使用資料庫。
以往SOE會使用大量的Oracle RAC集群提供服務,但是由於Oracle資料庫的授權證十分昂貴及欠缺彈性,加上公司需要更多額外資料庫。所以從2005年開始,該公司就開始尋求既具有較低總擁有成本,又具有較好靈活性的開源資料庫以取代Oracle資料庫。
踢開Oracle
SOE對資料庫的需求相當可觀,其資料庫應用程序是關鍵任務應用程序的最恰當詮釋:每天有數十萬在線玩家在玩SOE的游戲,而每款游戲都是一個資料庫及其密集的應用程序。
事實上,SOE在應用開放源代碼的應用上有很長歷史,曾經就使用過Linux、Tomcat、Apache、Hibernate架設系統,此次的開源抉擇,SOE更注重尋覓能夠利用其寶貴資產(內部能夠熟練使用Oracle的資料庫人才)的方法,在選擇開源資料庫時,列出了四項標准:
1、能夠充分發揮其現有資料庫管理員和開發人員的潛能;
2、易於將SOE現有的Oracle應用程序遷移到新的資料庫;
3、能夠提供商用級別質量可靠性,包括備份和恢復標准,以支持關鍵任務應用程序;
4、可擴展,具有高性能。
在選擇開源資料庫之前,SOE需要使用許多Oracle 9i RAC群集。另外,SOE在其後台運營中部署了資料庫。與如今的很多企業一樣,SOE希望開源軟體能夠提供應對這些業務挑戰的解決方案。
根據SOE對不同開放源碼資料庫的評估,他們選擇了兼容Oracle資料庫的EnterpriseDB,因為SOE有八成以上的特定Oracle應用程式,可以在極少、甚至無需修改的情況下在EnterpriseDB執行,以現有開支比較,利用EnterpriseDB後,每款線上游戲的整體擁有成本可降低80%,每年節省總額過百萬,在2007至2008年度,SOE將使用數百台EnterpriseDB資料庫集群伺服器。
開源更有前途
使用Oracle資料庫的企業一般都會對開源資料庫感興趣,主要有三個方面原因:首先,通過部署開源資料庫,這些企業可以顯著降低資料庫的總擁有成本(TCO),有時降幅甚至高達90%;其次,他們通常可以從其他廠商獲得更大的許可靈活性以及業務便利;最後,這些企業會發現其他廠商更渴望為他們提供出色技術。
對於開源資料庫,企業多少也會有些擔心,因為許多企業僅限於將開源資料庫用於一些簡單的應用程序,如一些網站的支持應用。因為這些企業普遍認為開源資料庫可能不夠穩定,可靠性或者可擴展性不夠高,因而無法滿足他們的關鍵任務應用需求。另外,企業可能還覺得更改資料庫的代價,例如,與應用程序重新編碼,人員重新培訓相關的成本,可能會超出預期的節省目標。
MySQL、FireBird、EnterpriseDB和Postgre(PostgreSQL的前身)都是非常健壯的開源資料庫,而EnterpriseDB又是基於PostgreSQL進行開發的,不僅保留了PostgreSQL的穩定性,而且可實現50%的速度增長,系統可以自動監測是否有補丁程序存在,大大減輕管理員的工作。
近幾年來,美國一些大企業紛紛採用開放源碼資料庫,它們往往在總部採用商業資料庫,而在分支機構的Linux伺服器上採用開源產品。這些資料庫除了費用便宜,還各有獨到之處。與商業化產品相比,開源資料庫結構簡單,但功能不簡單,讀取操作快捷,易管理,甚至不需要全職的管理員。由此吸引了像Cisco、Yahoo這樣的大公司,以及眾多的中小企業。而在國內,我們熟悉的新浪、網易等大型門戶網站也是開源資料庫的使用者。
該企業品牌在世界品牌實驗室(World Brand Lab)編制的2006年度《世界品牌500強》排行榜中名列第三十六。