Jak používat funkci merge () s datovými sadami v R.

Autor: Andrie de Vries, Joris Meys

V R použijetejít()funkce pro kombinaci datových rámců. Tato výkonná funkce se pokouší identifikovat sloupce nebo řádky, které jsou společné mezi dvěma různými datovými rámci.

Jak pomocí sloučení najít průnik dat

Nejjednodušší formajít()najde průnik mezi dvěma různými soubory dat. Jinými slovy, k vytvoření datového rámce, který se skládá ze stavů, které jsou studené i velké, použijte výchozí verzijít():



> merge(cold.states, large.states) Name Frost Area 1 Alaska 152 566432 2 Colorado 166 103766 3 Montana 155 145587 4 Nevada 188 109889

Pokud znáte databázový jazyk, jako je SQL, asi jste to uhodlijít()je velmi podobný připojení k databázi. To je skutečně případ a různé argumentyjít()vám umožní provádět přirozené spojení, stejně jako levé, pravé a úplné vnější spojení.

bílá oválná pilulka 44 175

Thejít()funkce trvá poměrně velké množství argumentů. Tyto argumenty mohou vypadat docela zastrašujícím způsobem, dokud si neuvědomíte, že tvoří menší počet souvisejících argumentů:

zolpidem tartrát 10 mg
  • X : Datový rámec.

  • Y : Datový rámec.

  • podle , od .x , by.y. : Názvy sloupců, které jsou společné pro obaXaY. Výchozí nastavení je použití sloupců se společnými názvy mezi dvěma datovými rámci.

  • all, all.x, all.y : Logické hodnoty, které určují typ sloučení. Výchozí hodnota jeall = FALSE(to znamená, že jsou vráceny pouze odpovídající řádky).

Ta poslední skupina argumentů -Všechno,all.xavše. a- zaslouží si nějaké vysvětlení. Tyto argumenty určují typ sloučení, ke kterému dojde.

jak vypadá lexapro

Jak pochopit různé typy sloučení

Thejít()funkce umožňuje čtyři způsoby kombinování dat:

  • Přirozené spojení: Chcete-li zachovat pouze řádky, které odpovídají datovým rámcům, zadejte argumentall = FALSE.

  • Úplné vnější spojení: Chcete-li zachovat všechny řádky z obou datových rámců, zadejtevše = PRAVDA.

  • Levý vnější spoj: Zahrnout všechny řádky datového rámceXa jen ti zYtuto shodu, upřesněteall.x = PRAVDA.

    multivitamin s fluoridovými žvýkacími tabletami
  • Pravý vnější spoj: Zahrnout všechny řádky datového rámceYa jen ti zXtuto shodu, upřesněteall.y = PRAVDA.

    image0.jpg

Jak najít odbor (úplné vnější spojení)

Vrátíme-li se k příkladům amerických států, provedeme úplné sloučení studených a velkých států pomocíjíta upřesnitvše = PRAVDA:

> merge(cold.states, large.states, all=TRUE) Name Frost Area 1 Alaska 152 566432 2 Arizona NA 113417 3 California NA 156361 .... 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA

Oba datové rámce mají proměnnounázev, takže R odpovídá případům na základě názvů států. ProměnnáMrázpochází z datového rámcestudené státya proměnnáPlochapochází z datového rámcevelké státy.

Všimněte si, že to provede úplné sloučení a vyplní sloupceNAhodnoty, kde neexistují žádná odpovídající data.