db2sql函數

發布時間: 2023-03-25 03:37:12

㈠【DB2】sql優化

於我來說，我喜歡技術，不偏執於某一類開發語言，願意花時間精力去解決問題。

1.去除在謂詞列上編寫的任何標量函數

優化前：(耗時3.1s)

優化後：(耗時0.922s)

總結：

DB2可以選擇使用START_DATE上的列索引，但是在列上使用了函數後，DB2就無法使用列索引了，從而導致查詢效率變低。

2.去除在謂詞列上編寫的任何數學運算

優化前：(耗時10.265)

優化後：(耗時3.39s)

總結：

DB2查詢時候，會優先選擇列CONTRACT_AMT上的索引，如果直接對列CONTRACT_AMT應用數學運算，DB2就無法使用索引了。一定要做到：列本身(不加數學運算)放在操作符的一邊，而所有的計算都放在另外一邊。

3.SQL語句中指定查詢列

優化前：(耗時13.15s)

優化後：(耗時2.922s)

總結：

如果Select包含不需要的列，優化工具會選擇Indexonly=』N』,這會強制DB2必須進入數據頁來得到所請求的特定列，這就要求更多的I/O操作，梁歪，這些多餘的列可能是某些排序的部分，這樣一來就需要和傳遞一個更大的排序文件，相應的會使排序成本更高。

4.盡可能不使用distinct

優化前：(耗時0.687s)

優化後：(耗時0.437s)

總結：

在測試distinct與group by性能的過程中，在列CST_ID上添加索引後，發現group by 確實比distinct快一些，但是在數據分布比較離散的情況下使用group by ，比較集中的情況下使用distinct.表數據量較少的情況隨便使用哪個都一樣， 不管選擇誰，都要建立索引

5.Exists、in、not in 、not exists的使用場景選擇

5.1 in跟exists的區別：

例如：表A(小表)，表B(大表)

優化前：(耗時1.93s)

優化後：(耗時1.125s)

相反的，

優化前：(耗時1.9s)

優化後：(耗時1.0s)

總結：

in是把外表和內表作hash連接，而exists是對外表作loop循環，每次loop循環再對內表進行查詢，一直以來認為exists比in效率高的說法是不準確的。 如果查詢的兩個表大小相當，那麼用in和exists差別不大；如果兩個表中一個較小一個較大，則子查詢表大的用exists，子查詢表小的用in；

簡稱：子大Exists,子小in

5.2 not in 與 not exists區別：

如果查詢語句使用了not in，那麼對內外表都進行全表掃描，沒有用到索引；而not exists的子查詢依然能用到表上的索引。所以無論哪個表大，用not exists都比not in 要快。

6.盡可能使用union all來代替union

優化前：(耗時15.344s)

優化後：(耗時2.719s)

總結：

在union中，DB2最後會自動執行一個排序來消除重復值，這樣是很耗費資源的，所以在不需要去重復的情況下，盡可能使用UNION ALL 代替union

N.模板

優化前：(耗時3.1s)

優化後：(耗時0.922s)

總結：

㈡ Db2 中的sql 怎樣實現正則表達式的功能

盡管上面的函數按照預期的方式工作，但還可以改進它以獲得更佳的性能。註：函數內部的執行完成得越快，DB2 處理整個 SQL 語句的速度也就越快。
SQL 旨在處理多組行，這意味著通常會針對一個模式匹配多個行。在大多數情況下，模式本身對於整個 SQL 語句都是不變的；即，它不會隨行的更改而更改。清單 5 中的 C 代碼展示了對每一行都調用函數 pcre_compile() ，該函數將給定模式轉換成內部表示法。

DB2 通過使用所謂的「高速暫存（scratchpad）」提供了在 UDF 調用之間傳遞信息的機制。此外，您可以標識特定調用「類型」；即它是對該 UDF 的第一次調用、普通調用還是最後一次（最終）調用。使用高速暫存和調用類型，有可能只對模式編譯一次，然後將該已編譯模式的內部表示法重用於對該 UDF 的所有後續調用。在最後一次調用時，釋放在處理期間分配的資源。

如清單 6所示，對 CREATE FUNCTION 語句進行修改，告訴 DB2 向外部 C 代碼提供高速暫存和調用類型：

清單 6. 將高速暫存和調用類型添加到 CREATE FUNCTION 語句

CREATE FUNCTION regex2(pattern VARCHAR(2048), string CLOB(10M))
RETURNS INTEGER
SPECIFIC regexPerf
EXTERNAL NAME 'regexUdf!regexpPerf'
LANGUAGE C
PARAMETER STYLE DB2SQL
DETERMINISTIC
NOT FENCED
RETURNS NULL ON NULL INPUT
NO SQL
NO EXTERNAL ACTION

SCRATCHPAD 50
FINAL CALL

ALLOW PARALLEL;

UDF 入口點看起來很不一樣，因為必須改寫函數內部的邏輯。參數方面唯一的更改是使用 SQLUDF_TRAIL_ARGS_ALL 代替了 SQLUDF_TRAIL_ARGS ，如清單 7所示。

清單 7. regex2 的 C UDF 入口點

#include <pcre.h>
#include <sqludf.h>
// data structure mapped on the scratchpad for easier use and access
// to the objects
// the size of the scratchpad defined in the CREATE FUNCTION statement
// must be at least as large as sizeof(scratchPadMapping)
struct scratchPadMapping {
pcre *re;
pcre_extra *extra;
const char *error;
int errOffset;
};
void regexpPerf(
// input parameters
SQLUDF_VARCHAR *pattern, SQLUDF_CLOB *str,
// output
SQLUDF_INTEGER *match,
// null indicators
SQLUDF_NULLIND *pattern_ind, SQLUDF_NULLIND *str_ind,
SQLUDF_NULLIND *match_ind,
SQLUDF_TRAIL_ARGS_ALL) // SQLUDF_SCRAT & SQLUDF_CALLT
{
int rc = 0;
struct scratchPadMapping *scratch = NULL;
// map the buffer of the scratchpad and assume successful return
scratch = (struct scratchPadMapping *)SQLUDF_SCRAT->data;
*match_ind = 0;
switch (SQLUDF_CALLT) {
case SQLUDF_FIRST_CALL:
// initialize data on the scratchpad
scratch->re = NULL;
scratch->extra = NULL;
scratch->error = NULL;
scratch->errOffset = 0;
// compile the pattern (only in the FIRST call
scratch->re = pcre_compile(pattern, 0 /* default options */,
&scratch->error, &scratch->errOffset, NULL);
if (scratch->re == NULL) {
snprintf(SQLUDF_MSGTX, 70, "Regexp compilation failed at "
"offset %d: %s\\n", scratch->errOffset, scratch->error);
strcpy(SQLUDF_STATE, "38900");
rc = -1;
break;
}
// further analyze the pattern (might return NULL)
scratch->extra = pcre_study(scratch->re,
0 /* default options */, &scratch->error);
/* fall through to NORMAL call because DB2 expects a result
already in the FIRST call */
case SQLUDF_NORMAL_CALL:
// match the current string
rc = pcre_exec(scratch->re, scratch->extra, str->data,
str->length, 0, 0 /* default options */, NULL, 0);
switch (rc) {
case PCRE_ERROR_NOMATCH:
*match = 0;
rc = 0;
break;
case PCRE_ERROR_BADOPTION:
snprintf(SQLUDF_MSGTX, 70, "An unrecognized bit was set "
"in the options argument");
strcpy(SQLUDF_STATE, "38901");
rc = -1;
break;
case PCRE_ERROR_NOMEMORY:
snprintf(SQLUDF_MSGTX, 70, "Not enough memory available.");
strcpy(SQLUDF_STATE, "38902");
rc = -1;
break;
default:
if (rc < 0) {
snprintf(SQLUDF_MSGTX, 70, "A regexp match error "
"occured: %d", rc);
strcpy(SQLUDF_STATE, "38903");
rc = -1;
}
else {
*match = 1;
rc = 0;
}
break;
}
break;
}
// cleanup in FINAL call, or if we encountered an error in
// the FIRST call (DB2 will make a FINAL call if we encounter
// an error in any NORMAL call)
if (SQLUDF_CALLT == SQLUDF_FINAL_CALL ||
(SQLUDF_CALLT == SQLUDF_FIRST_CALL && rc < 0)) {
(*pcre_free)(scratch->re);
(*pcre_free)(scratch->extra);
}
return;
}

為了進一步改進該函數的性能，我添加了對函數 pcre_study() 的調用，該函數是由模式匹配引擎提供的。該函數進一步分析了該模式，並將額外的信息存儲在獨立的結構中。然後，在實際的匹配期間使用這些額外的信息來加快處理速度。通過使用一個非常簡單的模式和大約 4000 行的表，我獲得了 5% 的執行時間的改善。當然，模式越復雜，差異將越顯著。

我先前提到該實現假定模式在處理期間不會隨行的不同而更改。當然，如果模式確實更改了，您可以進行少量的改寫以再次編譯一個模式。要這樣做，有必要跟蹤當前（已編譯的）模式並在每次調用中將它與所提供的模式進行比較。也可以在高速暫存中維護當前模式。但必須將它復制到獨立的緩沖區，並且不能通過指針模式直接引用它，因為這個指針或它所引用的數據可能會更改或變為無效。至於相應的代碼更改，就當作練習留給讀者了。

返回匹配子串

大多數模式匹配引擎提供了一種方法，返回與指定模式或其一部分相匹配的子串。如果想在 SQL 中使用這種能力，則必須使用不同的方法來實現匹配函數。給定的字元串可能包含不止一個匹配的子串。例如，當解析類似「abc = 123;」或「def = 'some text';」這樣的字元串時，用戶可能會希望檢索由等號分隔的兩個子串。您可以使用模式「\\w+\\s*=\\s*(\\d+|'[\\w\\s] *');」來表示適用於該字元串的語法規則。Perl 兼容的正則表達式允許您捕獲等號兩邊的子串。最後，必須將要捕獲的子串用括弧括起來。我已經用該方式編寫了第二個子串，但第一個子串不是這樣編寫的。用於該用途的最終模式是這樣的：

(\\w+)\\s*=\\s*(\\d+|'[\\w\\s]*');

當把這個模式應用於字元串「abc= 123;」或「def = 'some text';」時，「abc」或「def」分別與「(\\w+)」匹配，空格和等號是通過「\\s*=\\s*」查找的，並用另外的「(\\d+|'[\ \w\\s*]')」涵蓋了餘下的子串。在「(\\d+|'[\\w\\s*]')」中，第一個選項與任何至少由一個數字「\\d+」組成的數匹配，而第二個選項解析任何由字母和空格組成的由單引號括起的字元串「'[\\w\\s]*'」。

在 DB2 中做到這一點的需求可以描述成：為一次 UDF 調用返回多個結果。換句話說，就是返回針對模式進行匹配的單個字元串的多個子串。DB2 的表函數是完成這一任務的完美工具。

實現表 UDF

和以前一樣，必須在資料庫中創建該函數。清單 8中的下列語句正是用於這一任務的：

清單 8. 注冊名為 regex3 的表 UDF

CREATE FUNCTION regex3(pattern VARCHAR(2048), string CLOB(10M))
RETURNS TABLE ( position INTEGER, substring VARCHAR(2048) )
SPECIFIC regexSubstr
EXTERNAL NAME 'regexUdf!regexpSubstr'
LANGUAGE C
PARAMETER STYLE DB2SQL
DETERMINISTIC
NOT FENCED
RETURNS NULL ON NULL INPUT
NO SQL
NO EXTERNAL ACTION
SCRATCHPAD 50
NO FINAL CALL
DISALLOW PARALLEL;

實現該函數的實際邏輯的 C 代碼與清單 7中的代碼非常相似，但根據表函數所必須滿足的特殊需求對它進行了改編，如清單 9所示
你還是看一下這個網站
http://news.weixiuwang.com/server/2006-6/2006E6Y2;1057E89818855_1.htm

㈢有沒有函數在SQL查詢時將DB2資料庫中一個數字型的欄位轉換為字元串類型

可以用convert或cast。
select cast(123 as varchar)
select convert(varchar,123)

㈣ db2在linux後台執行創建存儲過程以及函數的.sql文件報錯，但是在toad中執行沒問題

在toad的左邊窗口中找到存儲過程標簽，選中存儲過程，然後右鍵--execute procere。會彈出窗口，輸入參數，就可以調試存儲過程的。

閱讀全文

熱點內容

java返回this 發布：2025-10-20 08:28:16 瀏覽：1070

製作腳本網站發布：2025-10-20 08:17:34 瀏覽：1346

python中的init方法發布：2025-10-20 08:17:33 瀏覽：1031

圖案密碼什麼意思發布：2025-10-20 08:16:56 瀏覽：1205

怎麼清理微信視頻緩存發布：2025-10-20 08:12:37 瀏覽：1077

c語言編譯器怎麼看執行過程發布：2025-10-20 08:00:32 瀏覽：1428

郵箱如何填寫發信伺服器發布：2025-10-20 07:45:27 瀏覽：636

shell腳本入門案例發布：2025-10-20 07:44:45 瀏覽：531

怎麼上傳照片瀏覽上傳發布：2025-10-20 07:44:03 瀏覽：1206

python股票數據獲取發布：2025-10-20 07:39:44 瀏覽：1215

db2sql函數

與db2sql函數相關的資訊