Úvod do R řetězcových funkcí

Jazyk R nebo funkce String R se převážně předpokládají pro grafické znázornění dat, statistickou analýzu dat a hlášení. je to otevřený zdrojový jazyk. jmenovací konvence tohoto jazyka byla odvozena z prvních písmen zakladatelů tohoto jazyka, kterými jsou Ross Ihaka a Robert Gentleman. Je to interpretovaný programovací jazyk. Má schopnost integrace s různými dalšími jazykovými postupy, jmenovitě C ++, Python, atd. V současné době je R nejrozšířenějším programovacím jazykem na světě.

Vlastnosti funkcí R String

Klíčové vlastnosti jazyka R jsou uvedeny níže,

  • Jemně vyvinutý a velmi jednoduchý statistický jazyk.
  • Úložiště a zpracování dat jsou velmi efektivně zabudovány do R.
  • Nabízí velké množství klasifikovaných nástrojů, které pomáhají při analýze dat
  • R také nabízí knihovny pro dosažení grafického znázornění dat

R Řetězcové funkce Manipulace

Níže je uveden seznam funkcí manipulace s řetězci R.

1. Grep () ve funkci R String

Slouží k přiřazení vzoru k datům a k nahrazení vzoru jiným řetězcem. Funkci grep lze v jazyce R vyjádřit několika způsoby: regexpr, gregexpr grep, grepl a regexec.

Příklad: grep (vzor, ​​x, ignorovat. Případ = FALSE, perl = FALSE, hodnota = FALSE, pevná = FALSE, použijte Bajty = FALSE, invertovat = FALSE)

Argumenty:

  • Vzor - Řetězec znaků, který obsahuje obvyklý výraz, který by se měl rovnat danému znakovému vektoru.
  • X, Text - Objekt, který lze omezit jako znak na znakový vektor.
  • Ignorovat. Případ - (False - Práce se sladěním vzorů nerozlišují velká a malá písmena, True - Práce se sladěním vzorů rozlišují malá a velká písmena)
  • Perl - K určení výrazů kompatibilních s Perl se používají zejména regexprns.
  • Hodnota - Pokud nalezená shoda vrací true true false,
  • Použít bajty - Pokud bude PRAVDA poté, bude přiřazování prováděno bajt po bajtu namísto znak po znaku.
  • Invertovat - Vrací indexy, pokud jsou true,
  • Náhrada - náhradní řetězec,

2. Nchar ()

Používá se k počítání počtu znaků ve vektoru. Jako argument vezme vektor ve formátu řetězce a vrací další číselný vektor, který drží počet řetězců.

Příklad: nchar (x, type = “chars”, allowNA = FALSE, keepNA = NA)

Argumenty:

  • X - řetězec vektorů.
  • Type - Type, znakový řetězec, použité tři uvedené společné znaky („bytes“, „chars“, „width“).
  • AllowNA - Představuje, zda může být jako výstup vráceno „Nelze použít“.
  • KeepNA - Mělo by být vráceno „Nelze použít“, pokud není X nalezeno.

3.Substr ()

Slouží k výběru hodnoty podřetězce znakového vektoru.

Příklad: subst (x, start, stop)

Argumenty:

  • X, text - Řetězec vektorových charterů.
  • Start, First - celé číslo. Začátek prvku, který má být nahrazen
  • Stop, Last - celé číslo. zde je nahrazení provedeno na konci řetězce

4. strsplit () ve funkci R String

Používá se k rozdělení existujícího vektorového řetězce na více podřetězců podle shody podřetězců nalezených v nich

Příklad: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

Argumenty:

  • X - znakový vektor, který bude plivat.
  • Split - znakový vektor, který funguje jako oddělovač.
  • Opraveno - Provede stejné rozdělení, když je předáno jako pravdivé
  • Perl - Měly by být použity regulární soubory kompatibilní s Perl?
  • UseBytes - Pokud je předán jako true, spouští byte byte byte matching namísto shody znaků po znaku

5. Regexpr ()

Více než grep regexpr dává index, kde začíná platná shoda a odpovídající délka řetězce, když není nalezena žádná shoda, je vrácena hodnota -1.

Příklad: regexpr (pattern, text, ignore.case = FALSE, perl = FALSE, pevná = FALSE, useBytes = FALSE)

Argumenty:

  • Pattern - Řetězec znaků obsahující obvyklý výraz, který se má rovnat danému znakovému vektoru.
  • X - znakový vektor
  • Ignore.case - (False - Rozlišující malá a velká písmena, True - Rozlišující malá a velká písmena)
  • Perl - K určení výrazů kompatibilních s Perl se používají zejména regexprns
  • Hodnota - Pokud nalezená shoda vrátí true, jinak false
  • UseBytes - Pokud bude TRUE poté, bude shoda prováděna bajt po bajtu namísto znak po znaku.
  • Invertovat - Vrací indexy, pokud jsou true

6. Gregexpr () ve funkci R String

Gregexpr poskytuje vrací seznam podobné délky jako text, jehož každý prvek má podobnou formu jako návratová hodnota pro regexpr, kromě toho, že jsou uvedeny předběžné pozice každé (disjunktní) shody.

Syntaxe: gregexpr (pattern, text, ignore.case = FALSE, perl = FALSE, pevná = FALSE, useBytes = FALSE, extrakt = FALSE)

Argumenty:

  • Vzor - Řetězec znaků, který obsahuje obvyklý výraz, který by se měl rovnat danému znakovému vektoru.
  • X - znakový vektor
  • Ignore.case - (False - Rozlišující malá a velká písmena, True - Rozlišující malá a velká písmena)
  • Perl - K určení výrazů kompatibilních s Perl se používají zejména regexprns
  • Hodnota - Pokud nalezená shoda vrátí true, jinak false
  • UseBytes - Pokud bude TRUE poté, bude shoda prováděna bajt po bajtu namísto znak po znaku.
  • Invertovat - Vrací indexy, pokud jsou true
  • Extrahovat - Když je přiřazena logická indikace, je vytvořen a vrácen extrakt podřetězce

7. Regexec ()

Regexec () ve funkcích R String je velmi podobný regexpr () s výjimkou indexů, které jsou v závorkách v závorkách

Syntaxe: regexec (vzor, ​​text, ignore.case = FALSE, perl = FALSE, pevná = FALSE, useBytes = FALSE)

Argumenty:

  • Pattern - Řetězec znaků obsahující obvyklý výraz, který lze považovat za rovný danému znakovému vektoru.
  • X - znakový vektor
  • Ignore.case - (False - Rozlišující malá a velká písmena, True - Rozlišující malá a velká písmena)
  • Perl - K určení Perl kompatibilních výrazů se používají zejména regexprns
  • Hodnota - Pokud nalezená shoda vrací true true false
  • UseBytes - Pokud bude TRUE poté, bude shoda prováděna bajt po bajtu namísto znak po znaku.
  • Invertovat - Vrací indexy, pokud jsou true

Doporučené články

Toto byl průvodce funkcemi R String. Zde jsme diskutovali koncept, funkce, manipulaci s R řetězcovými funkcemi s příkladem a argumenty. Další informace naleznete také v našich dalších doporučených článcích -

  1. Funkce řetězce JavaScriptu
  2. Funkce Oracle String
  3. Funkce řetězce T-SQL
  4. Funkce řetězce VBScript
  5. Funkce Regex v Pythonu (příklad)

Kategorie: