kettle存儲過程
❶ 使用kettle的output時怎麼讓id自增
可以的,一個是在oracle寫個存儲過程規范化sequence後,調用存儲過程得到規范的id
還有就是 直接選擇左邊菜單的「轉換」里的「增加序列」
❷ 如何使用Kettle調度存儲過程
如附件為例子,順次執行的話,放3個調用DB的存儲過程即可
❸ 如何利用kettle官網查找關於carte服務的設置
sp_databases 列出伺服器上的所有資料庫 sp_server_info 列出伺服器信息,如字元集,版本和排列順序 sp_stored_proceres 列出當前環境中的所有存儲過程 sp_tables 列出當前環境中所有可以查詢的對象 sp_password 添加或修改登錄帳戶的密碼
❹ 為什麼用kettle調度存儲過程的時候,明明是一個參數的函數,在調度時候顯示2個參數呢資料庫postgres
在每個函數中都io.output一個文件,然後往裡面寫數據。其他4個都有寫,就這個兩個沒有。我換其他代碼,通通沒用,我要崩潰了
❺ kettle的調用DB存儲過程步驟,查找不到資料庫裡面的存儲過程(資料庫已經正確的連接上了)
sp_databases
列出伺服器上的所有資料庫
sp_server_info
列出伺服器信息,如字元集,版本和排列順序
sp_stored_proceres
列出當前環境中的所有存儲過程
sp_tables
列出當前環境中所有可以查詢的對象
sp_password
添加或修改登錄帳戶的密碼
sp_configure
顯示(不帶選項)或更改(帶選項)當前伺服器的全局配置設置
sp_help
返回表的列名,數據類型,約束類型等
sp_helptext
顯示規則,默認值,未加密的存儲過程,用戶定義的函數,觸發器或視圖的實際文本
sp_helpfile
查看當前資料庫信息
sp_dboption
顯示或更改資料庫選項
sp_detach_db
分離資料庫
sp_attach_db
附加資料庫
sp_admpdevice
添加設備
sp_dropdevice
刪除設備
sp_pkeys
查看主鍵
sp_fkeys
查看外鍵
sp_helpdb
查看指定資料庫相關文件信息
sp_addtype
自建數據類型
sp_droptype
刪除自建數據類型
sp_rename
重新命名資料庫
sp_executesql
執行SQL語句
sp_addlogin
添加登陸
sp_droplogin
刪除登錄
sp_grantdbaccess
把用戶映射到登錄,即添加一個資料庫安全帳戶並授予塔訪問許可權
sp_revokedbaccess
撤銷用戶的數據訪問權,即從資料庫中刪除一個安全帳戶
sp_addrole
添加角色
sp_addrolemember
向角色中添加成員,使其成為資料庫角色的成員
sp_addsrvrolemember
修改登錄使其成為固定伺服器角色的成員
sp_grantlogin
允許使用組帳戶或系統用戶使用Windows身份驗證連接到SQL
sp_defaultdb
修改一個登錄的默認資料庫
sp_helpindex
用於查看錶的索引
sp_cursoropen
定義與游標和游標選項相關的SQL語句,然後生成游標
sp_cursorfetch
從游標中提取一行或多行
sp_cursorclose
關閉並釋放游標
sp_cursoroption
設置各種游標選項
sp_cursor
用於請求定位更新
sp_cursorprepare
把與游標有關的T-SQL語句或批處理編譯成執行計劃,但並不創建游標
sp_cursorexecute
從由sp_cursorprepare創建的執行計劃中創建並填充游標
sp_cursorunprepare
廢棄由sp_cursorprepare生成的執行計劃
sp_settriggerorder
指定第一個或最後一個激發的、與表關聯的AFTER 觸發器。在第一個和最後一個觸發器之間激發的AFTER 觸發器將按未定義的順序執行
sp_start_job
立即啟動自動化任務
sp_stop_job
停止正在執行的自動化任務
❻ kettle調用存儲過程的時候,找不到資料庫中的存儲過程(資料庫已經正確的連接上了)
無參數的存儲過程嗎,kettle是不顯示的,直接手動輸入存儲過程名稱就可以了
❼ etl是什麼
對於做過 BI 開發的朋友,ETL 並不陌生,只要涉及到數據源的數據抽取、數據的計算和處理過程的開發,都是 ETL,ETL 就這三個階段,Extraction 抽取,Transformation 轉換,Loading 載入。
從不同數據源抽取數據 EXTRACTION ,按照一定的數據處理規則對數據進行加工和格式轉換 TRASFORMATION,最後處理完成的輸出到目標數據表中也有可能是文件等等,這個就是 LOADING。
再通俗一點講,ETL 的過程就跟大家日常做菜一樣,需要到菜市場的各個攤位買好菜,把菜買回來要摘一下,洗一洗,切一切最後下鍋把菜炒好端到飯桌上。菜市場的各個攤位就是數據源,做好的菜就是最終的輸出結果,中間的所有過程像摘菜、洗菜、切菜、做菜就是轉換。
在開發的時候,大部分時候會通過 ETL 工具去實現,比如常用的像 KETTLE、PENTAHO、IBM DATASTAGE、INFORNAICA、微軟 SQL SERVER 裡面的 SSIS 等等,在結合基本的 SQL 來實現整個 ETL 過程。
也有的是自己通過程序開發,然後控制一些數據處理腳本跑批,基本上就是程序加 SQL 實現。
哪種方式更好,也是需要看使用場景和開發人員對那種方式使用的更加得心應手。我看大部分軟體程序開發人員出身的,碰到數據類項目會比較喜歡用程序控制跑批,這是程序思維的自然延續。純 BI 開發人員大部分自然就選擇成熟的 ETL 工具來開發,當然也有一上來就寫程序腳本的,這類 BI 開發人員的師傅基本上是程序人員轉過來的。
用程序的好處就是適配性強,可擴展性強,可以集成或拆解到到任何的程序處理過程中,有的時候使用程序開發效率更高。難就難在對維護人員有一定的技術要求,經驗轉移和可復制性不夠。
用 ETL 工具的好處,第一是整個 ETL 的開發過程可視化了,特別是在數據處理流程的分層設計中可以很清晰的管理。第二是鏈接到不同數據源的時候,各種數據源、資料庫的鏈接協議已經內置了,直接配置就可以,不需要再去寫程序去實現。第三是各種轉換控制項基本上拖拉拽就可以使用,起到簡化的代替一部分 SQL 的開發,不需要寫代碼去實現。第四是可以非常靈活的設計各種 ETL 調度規則,高度配置化,這個也不需要寫代碼實現。
所以在大多數通用的項目中,在項目上使用 ETL 標准組件開發會比較多一些。
ETL 從邏輯上一般可以分為兩層,控制流和數據流,這也是很多 ETL 工具設計的理念,不同的 ETL 工具可能叫法不同。
控制流就是控制每一個數據流與數據流處理的先後流程,一個控制流可以包含多個數據流。比如在數據倉庫開發過程中,第一層的處理是ODS層或者Staging 層的開發,第二層是 DIMENSION維度層的開發,後面幾層就是DW 事實層、DM數據集市層的開發。通過ETL的調度管理就可以讓這幾層串聯起來形成一個完整的數據處理流程。
數據流就是具體的從源數據到目標數據表的數據轉換過程,所以也有 ETL 工具把數據流叫做轉換。在數據流的開發設計過程中主要就是三個環節,目標數據表的鏈接,這兩個直接通過 ETL 控制項配置就可以了。中間轉換的環節,這個時候就可能有很多的選擇了,調 SQL 語句、存儲過程,或者還是使用 ETL 控制項來實現。
有的項目上習慣使用 ETL 控制項來實現數據流中的轉換,也有的項目要求不使用標準的轉換組件使用存儲過程來調用。也有的是因為數據倉庫本身這個資料庫不支持存儲過程就只能通過標準的SQL來實現。
我們通常講的BI數據架構師其實指的就是ETL的架構設計,這是整個BI項目中非常核心的一層技術實現,數據處理、數據清洗和建模都是在ETL中去實現。一個好的ETL架構設計可以同時支撐上百個包就是控制流,每一個控制流下可能又有上百個數據流的處理過程。之前寫過一篇技術文章,大家可以搜索下關鍵字 BIWORK ETL 應該在網上還能找到到這篇文章。這種框架設計不僅僅是ETL框架架構上的設計,還有很深的ETL項目管理和規范性控制器思想,包括後期的運維,基於BI的BI分析,ETL的性能調優都會在這些框架中得到體現。因為大的BI項目可能同時需要幾十人來開發ETL,框架的頂層設計就很重要。
❽ kettle里更新/插入後什麼時候提交
沒圖沒真相
❾ kettle調用存儲過程提示找不到出參
您好
下載文件:存儲過程實例.ktr|如附件為例子,順次執行的話,放3個調用DB的存儲過程即可
僅供參考~