hana列存储
‘壹’ hana数据库有running sum吗
HANA数据库同时支持行存储和列存储。列存储读性能好,拥有较高的压缩比,一些特性如分区只适用于列存储。常用于批量更新的大数据量表。行存储更新插入性能好,常用于经常单独操作的小数据量表。
‘贰’ sap hana和sap软件的区别
SAP HANA 是市场上首个 translytical 数据平台,也是数据库领域的领导者。SAP HANA提供多用途的内存应用设备,企业可以利用它即时掌握业务运营情况,从而对所有可用的数据进行分析,并对快速变化的业务环境作出迅速响应。通过SAP HANA,企业可以在业务运作期间基于海量实时详细信息分析业务运营情况。企业可以探索和分析来源于所有数据源的全部交易数据和分析数据。运营数据在产生时由内存获取,并通过灵活的视图迅速将分析信息呈现给用户。外部数据可轻松的被添加至分析模型,与整个企业的数据进行整合。
通过SAP HANA 可直接访问运营数据,而不影响SAP ERP和其他运营系统的性能。企业可以近乎实时地将主要交易表同步到内存中,以便在分析或查找时能够轻松对这些表进行访问。一旦数据可通过内存访问,各个部门就可以从预订单据、销售线索、服务要求等大量列表中查找单个行项目,而不会对运营系统造成任何影响。这种高效的建模流程支持提供明细行项目的直接访问模型,以及支持更为复杂的分析流程的分析模型。
‘叁’ sap hana是什么
HANA(High-Performance Analytic Appliance)高性能分析设备
定义1:HANA是一个软硬件结合体,提供高性能的数据查询功能,用户可以直接对大量实时业务数据进行查询和分析,而不需要对业务数据进行建模、聚合等。用户拿到的是一个装有预配置软件的设备。至于HANA的云服务,只是对用户而言可以在不购买相关硬件的情况下享受HANA的高性能,而HANA云服务的背后还是需要更高性能的硬件支撑的。
定义2: 基于内存计算技术的高性能实时数据计算平台,是全球一个发布商用的基于内存计算的产品,通过 SAP 内存计算技术优化应用,转变人们的思考、规划和工作方式。
SAP 提供一系列前所未有的新型企业应用,其中结合了大量交易与实时分析能力,能够显着优化现有的计划流程、预测流程、定价优化流程等数据密集型流程。借助 SAP 内存数据库,充分发挥实时数据的潜力。 SAP 内存数据库采用改进的数据压缩、多栏式数据存储和内存计算技术,支持新一代企业数据管理。基于 SAP 内存工具的创新型业务分析功能可使您获得洞察力。 作为一款灵活、多用途且与数据源无关的内存工具,SAP 内存工具(SAP HANA)整合了通过硬件(由 SAP 领先的硬件合作伙伴提供)进行优化的 SAP 软件组件。 借助 SAP HANA,企业能够根据大量实时的详细信息分析业务运营状况。
HANA的内存数据库(SAP In-Memory Database, IMDB)是其重要组成部分,包括数据库服务器(In-Memory Database Server)、建模工具(Studio)和客户端工具(ODBO、JDBC、ODBC、sqlDBC等)。HANA的计算引擎(Computing Engine)是其核心,负责解析并处理对大量数据的各类CRUDQ操作,支持SQL和MDX语句、SAP和non-SAP数据。比较显而易见的一点是,HANA计算引擎要快速处理用户复杂的查询请求,快速返回查询结果。
SAP内存数据库的数据并不是只在内存里,也会不停写到硬盘里,这就用到复制服务器Replication Server,包括Log-based,Trigger-based和ETL-based。这些复制服务器需要用到Sybase Replication Server、Sybase Replication Server Agent、Sybase Adaptive Server EntERPrise (AES,适用性服务器)等,以及HANA Load Controller和BO Data Services。
操作系统方面
HANA只能运行在Suse Linux 企业版(SLES)上。
硬件方面
SAP和多个硬件厂商合作生产支持HANA的高性能服务器,包括Dell R910、Fujitsu、HP DL580、IBM x3850等,以及和Cisco(Cisco Unified Computing System. UCS)等公司的合作。直观地说,这些机器的硬盘可能是数个600GB、转速10k rpm的硬盘组成RAID,内存可能有1T,文件系统可能是ext3或GPFS(IBM通用并行文件系统,General Parallel File System)。
和HANA类似,Oracle的Exadata也是一个预配置的软硬件结合体,提供高性能的数据读写操作。Exadata机器由Exadata数据库机器、Exadata数据库服务器、Exadata存储服务器以及高速网络接口等组成。InfiniBand端口的传输速度可以达到40Gb/秒。
HANA的快在于用大内存提供内存数据库,并在内存数据库里采用列式存储从而可以将更多的数据装进内存(列式存储更适合数据压缩)。
Exadata的快在于把大部分数据库操作push到硬件,通过高性能硬件提高数据查询速度,通过采用列式结构减少需要在存储和内存间移动的数据量,通过高速网络接口提供数据传输的效率。
‘肆’ SAP HANA的主要功能是什么
是sap内存计算技术,hana也是一个软硬件结合的产品,硬件是专门的hana服务器(其他服务器是不能用的),软件也就是数据库是sap
sybase。hana的优势就是将传统的行存储革新为列存储,同时服务器是内存服务器,无论是数据存储和读取速度都是非常快的。
‘伍’ hana数据库与数据仓库区别
hana数据库与数据仓库区别分别是:
数据库(Database)是:
1、相对复杂的表格结构,存储结构相对紧致,少冗余数据。
2、读和写都有优化。
3、相对简单的read/write query,单次作用于相对的少量数据。
数据仓库(Datawarehouse)是:
1、相对简单的(Denormalized)表格结构,存储结构相对松散,多冗余数据。
2、一般只是读优化。
3、相对复杂的read query,单次作用于相对大量的数据(历史数据)。
并且数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Amazon Redshift, Hive)主要用于数据分析。
数据仓库的弱势之处是:
并不是所有的读操作,数据仓库一直都有优势。比如在如下两种情况时,数据仓库的读表现并不如数据库:
1、在对小量数据进行读取操作的时候,由于数据仓库要进行找Node的location之类的预运算,整体效率上反倒不如数据库。
2、如果读取操作的目标不是主键(PrimaryKey)或者分配键(PartitionKey),那么数据仓库的查询也需要进行全局扫描,效率上就不好说是否胜过数据库了。
‘陆’ hdfs 列式存储和行式存储的区别
列式数据库是将同一个数据列的各个值存放在一起。插入某个数据行时,该行的各个数据列的值也会存放到不同的地方。
列式存储: 每一列单独存放,数据即是索引。
只访问涉及得列,如果我们想访问单独一列(比如NAME)会相当迅捷。
一行数据包含一个列或者多个列,每个列一单独一个cell来存储数据。而行式存储,则是把一行数据作为一个整体来存储。
在HANA的世界中,并不是只存在列式存储,行式存储也是存在的。
各自的优缺点:
‘柒’ 公司原来上的SAP ERP,最近又要引入HANA,有谁对SAP HANA比较了解,能否介绍一下
我们是一家服装集团公司,用了SAP HANA,主要目的是为了对大量的客户和销售数据进行分析。现在应用的不错,我们现在对门店、电商的销售数据能快速整合分析,调货补货也快了很多
‘捌’ 如何在sap 调用hana存储过程
l_stmt1 = 'CALL "ZBO001"."ZPROC_FI_001" (?,?,?)' .
* create db connection
lr_conn = cl_sql_connection=>get_connection( ls_dbcon-con_name ).
* create a statement object
l_stmt_ref1 = lr_conn->create_statement( ).
GET REFERENCE OF l_param1 INTO lr_var_01.
l_stmt_ref1->set_param( data_ref = lr_var_01
inout = cl_sql_statement=>c_param_in ).
l_res_ref1 = l_stmt_ref1->execute_query( l_stmt1 ).
* l_stmt_ref->execute_procere( proc_name = 'ZBO001.ZPROC_FI_001').
lr_conn->COMMIT( ).
‘玖’ 如何获取HANA数据库的在服务器上的存储位置
通过配置本地数据库的tns配置文件实现:
去oracle安装目录下oracle\proct\10.2.0\db_2\NETWORK\ADMIN\ 找到tnsnames.ora,用记事本打开,里边有远程数据库的tns连接配置串如下
ORCL23 =
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.3.23)(PORT = 1521))
)
(CONNECT_DATA =
(SID = ORCL)
)
)
添加好ip、端口和目标数据库的实例名(SID),然后确保tns名称(ORCL23)在整个文档中唯一,保存后打开数据库连接工具,输入远程数据库上的用户名密码,选择数据库对象为你配置的连接名就可以了!
‘拾’ SAP HANA是什么
HANA是一个软硬件结合体,提供高性能的数据查询功能,用户可以直接对大量实时业务数据进行查询和分析,而不需要对业务数据进行建模、聚合等。用户拿到的是一个装有预配置软件的设备。至于HANA的云服务,只是对用户而言可以在不购买相关硬件的情况下享受HANA的高性能,而HANA云服务的背后还是需要更高性能的硬件支撑的。
软件方面,HANA的内存数据库(SAP In-Memory Database, IMDB)是其重要组成部分,包括数据库服务器(In-Memory Database Server)、建模工具(Studio)和客户端工 具(ODBO、JDBC、ODBC、SQLDBC等)。HANA的计算引擎(Computing Engine)是其核心,负责解析并处理对大量数据的各类CRUDQ操作,支持SQL和MDX语句、SAP和non-SAP数据。比较显而易见的一点 是,HANA计算引擎要快速处理用户复杂的查询请求,快速返回查询结果。
SAP内存数据库的 数据并不是只在内存里,也会不停写到硬盘里,这就用到复制服务器Replication Server,包括Log-based,Trigger-based和ETL-based。这些复制服务器需要用到Sybase Replication Server、Sybase Replication Server Agent、Sybase Adaptive Server EntERPrise (AES,适用性服务器)等,以及HANA Load Controller和BO Data Services。
操作系统方面,HANA目前只能运行在Suse Linux 企业版(SLES)上。
硬件方面
,SAP和多个硬件厂商合作生产支 持HANA的高性能服务器,包括Dell R910、Fujitsu、HP DL580、IBM x3850等,以及和Cisco(Cisco Unified Computing System. UCS)等公司的合作。直观地说,这些机器的硬盘可能是数个600GB、转速10k rpm的硬盘组成RAID,内存可能有1T,文件系统可能是ext3或GPFS(IBM通用并行文件系统,General Parallel File System)。
和HANA类似,Oracle的Exadata也是一个预配置的软硬件结合体,提供高性能的数据读写操作。Exadata机器由Exadata数据库机器、Exadata数据库服务器、Exadata存储服务器以及高速网络接口等组成。InfiniBand端口的传输速度可以达到40Gb/秒。
HANA的快在于用大内存提供内存数据库,并在内存数据库里采用列式存储从而可以将更多的数据装进内存(列式存储更适合数据压缩)。