Úvod do funkce Hive String
Řetězec je posloupnost znaků. V podregistru se řetězcové funkce používají k provádění různých operací, jako je obrácení bodnutí, převedení na velká a malá písmena, odstranění mezer atd. Funkce podregistru vypadají jako funkce řetězců SQL. Podívejme se na tyto řetězcové funkce podrobně, abychom pochopili koncept snadno.
Funkce úlu String
Níže jsou uvedeny některé řetězcové funkce úlu s několika příklady.
1. Opakujte
Tato funkce String String se používá k opakování daného řetězce s N počtem času.
Syntax:
Repeat(string str, n);
např:
Repeat('Apple', 3);
Výstup: Apple Apple Apple
2. Reverzní
Tato funkce obrácení vrátí daný řetězcový vstup a poskytne výsledek, jak je ukázáno níže.
Syntax:
Reverse(string str);
Např:
ReverseE('Apple');
Výstup: elppA
3. Oříznout
Tato funkce Trim se používá k odstranění všech mezer z řetězce a dává nový řetězec bez mezer.
Syntax:
Trim(string str);
Např:
Trim('Apple');
Výstup:
Jablko
4. Rtrim
Tato funkce Rtrim se používá k odstranění všech mezer z pravé strany řetězce a dává nový řetězec.
Syntax:
RTRIM(string str);
Např:
RTRIM('Apple');
Výstup:
Jablko
5. LTRIM
Tato funkce LTRIM se používá k odstranění všech mezer z levé strany řetězce a dává nový řetězec.
Syntax:
LTRIM(stringstr);
Např:
LTRIM('Apple');
Výstup:
Jablko
6. NIŽŠÍ nebo LCASE
Tato řetězcová funkce se používá k převodu všech znaků daného řetězce na malá písmena.
Syntax:
LOWER(string str);or LCASE(string str);
Např:
LOWER('ApPle'); or LCASE('ApPle');
Výstup:
jablko
7. HORNÍ nebo UCASE
Tato funkce UPPER se používá k převodu všech znaků daného řetězce na velká písmena.
Syntax:
UPPER(string str);or UCASE(string str);
Např:
UPPER('apple'); or UCASE('apple');
Výstup:
JABLKO
8. KONCAT
Všechny řetězce jsou integrovány s funkcí CONCAT.
Syntax:
CONCAT(stringstr1, stringstr2, stringstr3….)
Např:
CONCAT( 'Apple', '-', 'eat' );
Výstup:
„Jablko jíst“
9. CONCAT_WS
Funkce CONCAT a CONCAT_WS mají obě stejné vlastnosti. V této funkci CONCAT_WS můžete zadat oddělovač, který lze použít mezi řetězci CONCAT
Např:
CONCAT_WS( '-', 'apple', 'eat' );
Výstup:
'jablko-jíst'
10. DÉLKA
Tato funkce DÉLKA se používá k získání počtu znaků, které jsou v daném řetězci přítomny.
Syntax:
LENGTH(string str);
Např:
LENGTH( 'Apple' );
Výstup:
5
11. MEZERNÍK
Tato funkce MEZERNÍK se používá k zadání zadaného počtu mezer v řetězci
Syntax:
SPACE(intnum_of_spaces);
Např:
SPACE(5);
Výstup:
''
12. SPLIT
Funkce SPLIT rozdělí řetězec kolem pat vzoru a vrací řadu řetězců. Jako vzory můžete určit regulární výrazy.
Syntax:
SPLIT(string str, string pat)
Příklad:
SPLIT('hive:Hadoop', ':'
Výstup:
(„Úl“, „Hadoop“)13. LPAD
Funkce LPAD se používá k zadání řetězce s délkou řádkových znaků, které jsou vlevo vycpané znakem pad.
Syntax:
LPAD(string str, int len, string pad)
Např:
LPAD ('Hadoop', 8, 'H');
Výstup:
hhhadoop
14. RPAD
Funkce RPAD se používá k tomu, aby řetězec s délkou len znaků byl vyplněn pravým znakem.
Syntax:
RPAD(string str, int len, string pad)
Výstup:
hadooppp
15. INSTRING
Tato funkce se používá k určení polohy prvního výskytu podřetězce v str. Pokud je jeden z argumentů řetězce null, pak jako výstup dává NULL. Pokud sub str chybí nebo jej nelze najít v str, vrátí se 0. Hodnota indexu prvního znaku v str je 1.
Syntax:
INSTR(string str, string substring);
např:
INSTR('Rachel', 'el');
Výstup:
4
16. Vyhledejte
Tato funkce se používá k určení polohy prvního výskytu podřetězce v řetězci za pozicí pos.
Syntax:
LOCATE(string substring, string str(, int pos));
např
LOCATE('el', 'Rachel', 2);
Výstup:
4
17. Přeložit
Tato funkce se používá k překladu znaků daného řetězce s odpovídajícími znaky uvedenými v řetězci to. Je-li jakýkoli argument v daném řetězci NULL, dá jako výstup NULL.
Syntax:
TRANSLATE(string|char|varchar input, string|char|varchar from, string|char|varchar to);
např:
TRANSLATE('Make sure u knew that code', 'e', 'o');
Výstup:
Mako, víš, že codo
18. ASCII (str. Str);
Funkce ASCII se používá k zadání hodnoty ASCII prvního znaku daného řetězce.
Příklad 1:
ASCII('hadoop') ;
Výstup:
104
Příklad 2:
ASCII('A') ;
Výstup:
65
19. PRINTF
Vrací vstupní formát podle řetězců formátu stylu PRINTF.
Syntax:
PRINTF(Obj…args);
20. regxp_replace
Syntax:
regxp_replace(string A, string B, String C)
Tato funkce vrací řetězec, který je výstupem nahrazení všech podřetězců v B, které odpovídají pravidelné syntaxi Java, s C.
21. From_unix čas
Syntax:
from_unixtime(int Unix time)
Tato funkce převádí počet sekund z epochy Unix na řetězec představující časové razítko aktuální systémové časové zóny. například časové razítko je ve formátu následujícím způsobem (2019-01-01 00:00:00 UTC), tato funkce jej převede do formátu „2019-01-01 00:00:00“.
Např:
from_unixtime(int 2011-01-06 12:00:00 UTC)
Výstup:
2011-01-06 12:00:00
22. get_json_object
Syntax:
get_json_object(string json_string, string path)
Na základě zadané cesty JSON tato funkce extrahuje objekt JSON z řetězce JSON a vrací řetězec JSON extrahovaného objektu JSON. Pokud jsou řetězce JSON neplatné, vrátí NULL.
23. To_Date
Syntax:
to_date(string timestamp)
Tato funkce vrátí datovou část řetězce časových razítek.
např:
to_date("2019-03-04 00:04:12)
Výstup:
2019-03-04
Doporučené články
Toto byl průvodce funkcemi Hive String. Zde jsme diskutovali koncept a různé řetězcové funkce používané v Úlu. Další informace naleznete také v našich dalších doporučených článcích -
- Funkce PostgreSQL String
- Hive Interview Otázky
- Funkce řetězce JavaScriptu
- Příklady funkcí řetězců VB.Net
- Jak používat funkce řetězce VBScript
- Komponenty architektury úlu
- Hive Order By
- Instalace podregistru