kettle存储过程
❶ 使用kettle的output时怎么让id自增
可以的,一个是在oracle写个存储过程规范化sequence后,调用存储过程得到规范的id
还有就是 直接选择左边菜单的“转换”里的“增加序列”
❷ 如何使用Kettle调度存储过程
如附件为例子,顺次执行的话,放3个调用DB的存储过程即可
❸ 如何利用kettle官网查找关于carte服务的设置
sp_databases 列出服务器上的所有数据库 sp_server_info 列出服务器信息,如字符集,版本和排列顺序 sp_stored_proceres 列出当前环境中的所有存储过程 sp_tables 列出当前环境中所有可以查询的对象 sp_password 添加或修改登录帐户的密码
❹ 为什么用kettle调度存储过程的时候,明明是一个参数的函数,在调度时候显示2个参数呢数据库postgres
在每个函数中都io.output一个文件,然后往里面写数据。其他4个都有写,就这个两个没有。我换其他代码,通通没用,我要崩溃了
❺ kettle的调用DB存储过程步骤,查找不到数据库里面的存储过程(数据库已经正确的连接上了)
sp_databases
列出服务器上的所有数据库
sp_server_info
列出服务器信息,如字符集,版本和排列顺序
sp_stored_proceres
列出当前环境中的所有存储过程
sp_tables
列出当前环境中所有可以查询的对象
sp_password
添加或修改登录帐户的密码
sp_configure
显示(不带选项)或更改(带选项)当前服务器的全局配置设置
sp_help
返回表的列名,数据类型,约束类型等
sp_helptext
显示规则,默认值,未加密的存储过程,用户定义的函数,触发器或视图的实际文本
sp_helpfile
查看当前数据库信息
sp_dboption
显示或更改数据库选项
sp_detach_db
分离数据库
sp_attach_db
附加数据库
sp_admpdevice
添加设备
sp_dropdevice
删除设备
sp_pkeys
查看主键
sp_fkeys
查看外键
sp_helpdb
查看指定数据库相关文件信息
sp_addtype
自建数据类型
sp_droptype
删除自建数据类型
sp_rename
重新命名数据库
sp_executesql
执行SQL语句
sp_addlogin
添加登陆
sp_droplogin
删除登录
sp_grantdbaccess
把用户映射到登录,即添加一个数据库安全帐户并授予塔访问权限
sp_revokedbaccess
撤销用户的数据访问权,即从数据库中删除一个安全帐户
sp_addrole
添加角色
sp_addrolemember
向角色中添加成员,使其成为数据库角色的成员
sp_addsrvrolemember
修改登录使其成为固定服务器角色的成员
sp_grantlogin
允许使用组帐户或系统用户使用Windows身份验证连接到SQL
sp_defaultdb
修改一个登录的默认数据库
sp_helpindex
用于查看表的索引
sp_cursoropen
定义与游标和游标选项相关的SQL语句,然后生成游标
sp_cursorfetch
从游标中提取一行或多行
sp_cursorclose
关闭并释放游标
sp_cursoroption
设置各种游标选项
sp_cursor
用于请求定位更新
sp_cursorprepare
把与游标有关的T-SQL语句或批处理编译成执行计划,但并不创建游标
sp_cursorexecute
从由sp_cursorprepare创建的执行计划中创建并填充游标
sp_cursorunprepare
废弃由sp_cursorprepare生成的执行计划
sp_settriggerorder
指定第一个或最后一个激发的、与表关联的AFTER 触发器。在第一个和最后一个触发器之间激发的AFTER 触发器将按未定义的顺序执行
sp_start_job
立即启动自动化任务
sp_stop_job
停止正在执行的自动化任务
❻ kettle调用存储过程的时候,找不到数据库中的存储过程(数据库已经正确的连接上了)
无参数的存储过程吗,kettle是不显示的,直接手动输入存储过程名称就可以了
❼ etl是什么
对于做过 BI 开发的朋友,ETL 并不陌生,只要涉及到数据源的数据抽取、数据的计算和处理过程的开发,都是 ETL,ETL 就这三个阶段,Extraction 抽取,Transformation 转换,Loading 加载。
从不同数据源抽取数据 EXTRACTION ,按照一定的数据处理规则对数据进行加工和格式转换 TRASFORMATION,最后处理完成的输出到目标数据表中也有可能是文件等等,这个就是 LOADING。
再通俗一点讲,ETL 的过程就跟大家日常做菜一样,需要到菜市场的各个摊位买好菜,把菜买回来要摘一下,洗一洗,切一切最后下锅把菜炒好端到饭桌上。菜市场的各个摊位就是数据源,做好的菜就是最终的输出结果,中间的所有过程像摘菜、洗菜、切菜、做菜就是转换。
在开发的时候,大部分时候会通过 ETL 工具去实现,比如常用的像 KETTLE、PENTAHO、IBM DATASTAGE、INFORNAICA、微软 SQL SERVER 里面的 SSIS 等等,在结合基本的 SQL 来实现整个 ETL 过程。
也有的是自己通过程序开发,然后控制一些数据处理脚本跑批,基本上就是程序加 SQL 实现。
哪种方式更好,也是需要看使用场景和开发人员对那种方式使用的更加得心应手。我看大部分软件程序开发人员出身的,碰到数据类项目会比较喜欢用程序控制跑批,这是程序思维的自然延续。纯 BI 开发人员大部分自然就选择成熟的 ETL 工具来开发,当然也有一上来就写程序脚本的,这类 BI 开发人员的师傅基本上是程序人员转过来的。
用程序的好处就是适配性强,可扩展性强,可以集成或拆解到到任何的程序处理过程中,有的时候使用程序开发效率更高。难就难在对维护人员有一定的技术要求,经验转移和可复制性不够。
用 ETL 工具的好处,第一是整个 ETL 的开发过程可视化了,特别是在数据处理流程的分层设计中可以很清晰的管理。第二是链接到不同数据源的时候,各种数据源、数据库的链接协议已经内置了,直接配置就可以,不需要再去写程序去实现。第三是各种转换控件基本上拖拉拽就可以使用,起到简化的代替一部分 SQL 的开发,不需要写代码去实现。第四是可以非常灵活的设计各种 ETL 调度规则,高度配置化,这个也不需要写代码实现。
所以在大多数通用的项目中,在项目上使用 ETL 标准组件开发会比较多一些。
ETL 从逻辑上一般可以分为两层,控制流和数据流,这也是很多 ETL 工具设计的理念,不同的 ETL 工具可能叫法不同。
控制流就是控制每一个数据流与数据流处理的先后流程,一个控制流可以包含多个数据流。比如在数据仓库开发过程中,第一层的处理是ODS层或者Staging 层的开发,第二层是 DIMENSION维度层的开发,后面几层就是DW 事实层、DM数据集市层的开发。通过ETL的调度管理就可以让这几层串联起来形成一个完整的数据处理流程。
数据流就是具体的从源数据到目标数据表的数据转换过程,所以也有 ETL 工具把数据流叫做转换。在数据流的开发设计过程中主要就是三个环节,目标数据表的链接,这两个直接通过 ETL 控件配置就可以了。中间转换的环节,这个时候就可能有很多的选择了,调 SQL 语句、存储过程,或者还是使用 ETL 控件来实现。
有的项目上习惯使用 ETL 控件来实现数据流中的转换,也有的项目要求不使用标准的转换组件使用存储过程来调用。也有的是因为数据仓库本身这个数据库不支持存储过程就只能通过标准的SQL来实现。
我们通常讲的BI数据架构师其实指的就是ETL的架构设计,这是整个BI项目中非常核心的一层技术实现,数据处理、数据清洗和建模都是在ETL中去实现。一个好的ETL架构设计可以同时支撑上百个包就是控制流,每一个控制流下可能又有上百个数据流的处理过程。之前写过一篇技术文章,大家可以搜索下关键字 BIWORK ETL 应该在网上还能找到到这篇文章。这种框架设计不仅仅是ETL框架架构上的设计,还有很深的ETL项目管理和规范性控制器思想,包括后期的运维,基于BI的BI分析,ETL的性能调优都会在这些框架中得到体现。因为大的BI项目可能同时需要几十人来开发ETL,框架的顶层设计就很重要。
❽ kettle里更新/插入后什么时候提交
没图没真相
❾ kettle调用存储过程提示找不到出参
您好
下载文件:存储过程实例.ktr|如附件为例子,顺次执行的话,放3个调用DB的存储过程即可
仅供参考~