Úvod do funkce Hive String

Řetězec je posloupnost znaků. V podregistru se řetězcové funkce používají k provádění různých operací, jako je obrácení bodnutí, převedení na velká a malá písmena, odstranění mezer atd. Funkce podregistru vypadají jako funkce řetězců SQL. Podívejme se na tyto řetězcové funkce podrobně, abychom pochopili koncept snadno.

Funkce úlu String

Níže jsou uvedeny některé řetězcové funkce úlu s několika příklady.

1. Opakujte

Tato funkce String String se používá k opakování daného řetězce s N počtem času.

Syntax:

Repeat(string str, n);

např:

Repeat('Apple', 3);

Výstup: Apple Apple Apple

2. Reverzní

Tato funkce obrácení vrátí daný řetězcový vstup a poskytne výsledek, jak je ukázáno níže.

Syntax:

Reverse(string str);

Např:

ReverseE('Apple');

Výstup: elppA

3. Oříznout

Tato funkce Trim se používá k odstranění všech mezer z řetězce a dává nový řetězec bez mezer.

Syntax:

Trim(string str);

Např:

Trim('Apple');

Výstup:

Jablko

4. Rtrim

Tato funkce Rtrim se používá k odstranění všech mezer z pravé strany řetězce a dává nový řetězec.

Syntax:

RTRIM(string str);

Např:

RTRIM('Apple');

Výstup:

Jablko

5. LTRIM

Tato funkce LTRIM se používá k odstranění všech mezer z levé strany řetězce a dává nový řetězec.

Syntax:

LTRIM(stringstr);

Např:

LTRIM('Apple');

Výstup:

Jablko

6. NIŽŠÍ nebo LCASE

Tato řetězcová funkce se používá k převodu všech znaků daného řetězce na malá písmena.

Syntax:

LOWER(string str);or LCASE(string str);

Např:

LOWER('ApPle'); or LCASE('ApPle');

Výstup:

jablko

7. HORNÍ nebo UCASE

Tato funkce UPPER se používá k převodu všech znaků daného řetězce na velká písmena.

Syntax:

UPPER(string str);or UCASE(string str);

Např:

UPPER('apple'); or UCASE('apple');

Výstup:

JABLKO

8. KONCAT

Všechny řetězce jsou integrovány s funkcí CONCAT.

Syntax:

CONCAT(stringstr1, stringstr2, stringstr3….)

Např:

CONCAT( 'Apple', '-', 'eat' );

Výstup:

„Jablko jíst“

9. CONCAT_WS

Funkce CONCAT a CONCAT_WS mají obě stejné vlastnosti. V této funkci CONCAT_WS můžete zadat oddělovač, který lze použít mezi řetězci CONCAT

Např:

CONCAT_WS( '-', 'apple', 'eat' );

Výstup:

'jablko-jíst'

10. DÉLKA

Tato funkce DÉLKA se používá k získání počtu znaků, které jsou v daném řetězci přítomny.

Syntax:

LENGTH(string str);

Např:

LENGTH( 'Apple' );

Výstup:

5

11. MEZERNÍK

Tato funkce MEZERNÍK se používá k zadání zadaného počtu mezer v řetězci

Syntax:

SPACE(intnum_of_spaces);

Např:

SPACE(5);

Výstup:

''

12. SPLIT

Funkce SPLIT rozdělí řetězec kolem pat vzoru a vrací řadu řetězců. Jako vzory můžete určit regulární výrazy.

Syntax:

SPLIT(string str, string pat)

Příklad:

SPLIT('hive:Hadoop', ':'

Výstup:

(„Úl“, „Hadoop“)

13. LPAD

Funkce LPAD se používá k zadání řetězce s délkou řádkových znaků, které jsou vlevo vycpané znakem pad.

Syntax:

LPAD(string str, int len, string pad)

Např:

LPAD ('Hadoop', 8, 'H');

Výstup:

hhhadoop

14. RPAD

Funkce RPAD se používá k tomu, aby řetězec s délkou len znaků byl vyplněn pravým znakem.

Syntax:

RPAD(string str, int len, string pad)

Výstup:

hadooppp

15. INSTRING

Tato funkce se používá k určení polohy prvního výskytu podřetězce v str. Pokud je jeden z argumentů řetězce null, pak jako výstup dává NULL. Pokud sub str chybí nebo jej nelze najít v str, vrátí se 0. Hodnota indexu prvního znaku v str je 1.

Syntax:

INSTR(string str, string substring);

např:

INSTR('Rachel', 'el');

Výstup:

4

16. Vyhledejte

Tato funkce se používá k určení polohy prvního výskytu podřetězce v řetězci za pozicí pos.

Syntax:

LOCATE(string substring, string str(, int pos));

např

LOCATE('el', 'Rachel', 2);

Výstup:

4

17. Přeložit

Tato funkce se používá k překladu znaků daného řetězce s odpovídajícími znaky uvedenými v řetězci to. Je-li jakýkoli argument v daném řetězci NULL, dá jako výstup NULL.

Syntax:

TRANSLATE(string|char|varchar input, string|char|varchar from, string|char|varchar to);

např:

TRANSLATE('Make sure u knew that code', 'e', 'o');

Výstup:

Mako, víš, že codo

18. ASCII (str. Str);

Funkce ASCII se používá k zadání hodnoty ASCII prvního znaku daného řetězce.

Příklad 1:

ASCII('hadoop') ;

Výstup:

104

Příklad 2:

ASCII('A') ;

Výstup:

65

19. PRINTF

Vrací vstupní formát podle řetězců formátu stylu PRINTF.

Syntax:

PRINTF(Obj…args);

20. regxp_replace

Syntax:

regxp_replace(string A, string B, String C)

Tato funkce vrací řetězec, který je výstupem nahrazení všech podřetězců v B, které odpovídají pravidelné syntaxi Java, s C.

21. From_unix čas

Syntax:

from_unixtime(int Unix time)

Tato funkce převádí počet sekund z epochy Unix na řetězec představující časové razítko aktuální systémové časové zóny. například časové razítko je ve formátu následujícím způsobem (2019-01-01 00:00:00 UTC), tato funkce jej převede do formátu „2019-01-01 00:00:00“.

Např:

from_unixtime(int 2011-01-06 12:00:00 UTC)

Výstup:

2011-01-06 12:00:00

22. get_json_object

Syntax:

get_json_object(string json_string, string path)

Na základě zadané cesty JSON tato funkce extrahuje objekt JSON z řetězce JSON a vrací řetězec JSON extrahovaného objektu JSON. Pokud jsou řetězce JSON neplatné, vrátí NULL.

23. To_Date

Syntax:

to_date(string timestamp)

Tato funkce vrátí datovou část řetězce časových razítek.

např:

to_date("2019-03-04 00:04:12)

Výstup:

2019-03-04

Doporučené články

Toto byl průvodce funkcemi Hive String. Zde jsme diskutovali koncept a různé řetězcové funkce používané v Úlu. Další informace naleznete také v našich dalších doporučených článcích -

  1. Funkce PostgreSQL String
  2. Hive Interview Otázky
  3. Funkce řetězce JavaScriptu
  4. Příklady funkcí řetězců VB.Net
  5. Jak používat funkce řetězce VBScript
  6. Komponenty architektury úlu
  7. Hive Order By
  8. Instalace podregistru

Kategorie: