Úvod do regulárních výrazů (Regex) v Looker Data Studiu

7. 10. 2023 | Martin Štícha

1. část

Vítejte v blogu o regulárních výrazech, které jsou běžně používány v nástroji Looker Data Studio. Regulární výrazy, často nazývané jako „regex”, jsou nástroje pro vytváření vlastních definic a sestav. V rámci Looker Data Studia jsou regexy důležitou součástí transformace a filtrace dat, což umožňuje uživatelům provádět sofistikované analýzy a získávat relevantní informace z různých zdrojů dat. V tomto blogu si ukážeme základní metaznaky a příklady, jak je použít v Looker Data Studiu.

Použití metaznaků a praktický příklad

Stříška ^

Stříška se shoduje s počátkem řetězce. Jinými slovy to znamená, že něco začíná s určitým vzorem.

  • ^social se shoduje se „social media" a „social network", ale ne s „online social"

Praktické použití v Looker Data Studio

Představte si, že máte v Google Analytics 4 placené zdroje:

  • Google / cpc,
  • Sklik / cpc,
  • Facebook / cpc

A chcete zařadit všechna média, která začínají řetězcem „cpc", do skupiny s názvem „Placené" a cokoli jiného třeba do skupiny „Other".

Hvězdička *

Tento znak říká, že se shoduje s předchozím znakem 0 nebo vícekrát.

  • go*gle se shoduje s google, gooogle, gooooogle a gogle, ale ne s goegle

Jedna z nejsilnějších kombinací hvězdičky je kombinace s tečkou (.*). Shoduje se vlastně se vším, co poté následuje.

Praktické použití v Looker Data Studio

V Google Ads máme spuštěné kampaně a potřebujeme je roztřídit, aby bylo možné porovnávat jejich výkonnost.

  • Performance Max (PM_nazev_kampane)
  • Search (SE_ nazev_kampane)
  • Display (GDN_ nazev_kampane)

Tento regex v podstatě znamená, že roztřídí kampaně podle zadané zkratky, která se nachází na začátku řetězce. Přidáním .* před zkratku by znamenalo, že se shoda bude hledat i uvnitř řetězce.

Roura |

V překladu řečeno NEBO.

Praktické použití v Looker Data Studiu

Potřebujeme vyfiltrovat návštěvnost pro Facebook a Instagram, ale ve zdroji a médiu se nachází více alternativ zápisu. Lze použít variantu s hvězdičkou a stříškou, ale postup by byl příliš zdlouhavý, proto je zde lepší využít znak |.

Závěr

Regulární výrazy jsou užitečným nástrojem v Looker Data Studiu pro práci s textovými daty. V této 1. části blogu jsme si prohlédli základní syntaxi a několik příkladů jejich použití. Doufáme, že vám blog pomohl lépe porozumět regexům a inspiruje vás k jejich využití v analýzách a vizualizacích dat v Looker Data Studiu.