
Kako pisati i testirati regularne filtre za Google Analytics (s primjerima)
Kao i kod mnogih mojih članaka ovdje, istražujem klijenta i o tome ovdje pišem. Da budem iskren, postoji nekoliko razloga zašto ... prvi je taj što se užasno sjećam i često istražujem vlastitu web stranicu radi informacija. Drugo je pomoći drugima koji također mogu tražiti informacije.
Što je regularni izraz (Regex)?
Regex je razvojna metoda za pretraživanje i prepoznavanje uzorka znakova u tekstu kako bi se tekst podudarao ili zamijenio. Svi moderni programski jezici podržavaju regularne izraze.
Volim regularne izraze (Regularni izraz), ali mogu biti pomalo frustrirajuće ili bijesne za učenje i testiranje. Google Analytics ima neke nevjerojatne mogućnosti ... gdje možete stvoriti poglede pomoću regularnih izraza ili filtrirati podatke unutar regularnih izraza.
Na primjer, ako bih želio vidjeti samo promet na svojim stranicama s oznakama, mogao bih filtrirati / tag / u svojoj strukturi stalne veze pomoću:
/tag\/
Sintaksa je tu presudna. Da sam samo upotrijebio "tag", dobio bih sve stranice s pojmom tag u njima. Ako upotrijebim "/ tag", tada bi bio uključen bilo koji URL koji započinje s tagom, poput / upravljanje oznakama jer Google Analytics zadano uključuje bilo koji znak nakon regularnog izraza. Dakle, moram osigurati da uključim sljedeću kosu crtu ... ali na njoj mora biti znak za bijeg.

Osnove sintaksi regularnog izraza
Sintaksa | Opis |
^ | počinje sa |
$ | Završava sa |
. | Zamjenski znak za bilo koji lik |
* | Nula ili više prethodne stavke |
.* | Podudara se sa bilo kojim znakovima u |
? | Nula ili jedno vrijeme prethodne stavke |
+ | Jedan ili više puta prethodne stavke |
| | Operator OR |
[abc] | A ili b ili c (može biti bilo koji broj znakova) |
[the] | Raspon od a do z (može biti bilo koji broj znakova) |
[AZ] | Raspon od A do Z (velika slova) |
[0-9] | Raspon od 0 do 9 (može biti bilo koji broj) |
[a-zA-Z] | Raspon od a do Z ili od A do Z |
[a-zA-Z0-9] | Svi alfanumerički znakovi |
1 {} | Točno 1 instanca (može biti bilo koji broj) |
{1-4} | Raspon od 1 do 4 primjerka (može biti bilo koji broj) |
{1,} | 1 ili više slučajeva (može biti bilo koji broj) |
() | Grupirajte svoja pravila |
\ | Pobjegnite od posebnih likova |
\d | Znamenkasti znak |
\D | Znamenka koja nije znamenka |
\s | bijeli prostor |
\S | Nebijeli prostor |
\w | riječ |
\W | Ne-riječ (interpunkcija) |
Primjeri regularnih izraza za Google Analytics
Dakle, stavimo neke primjere za neke Prilagođeni filtri. Jedan od mojih kolega zamolio me za pomoć da identificiram internu stranicu s putanjom /indeks uz sve postove na blogu koji su napisani s godinom na trajnoj poveznici:
Moj prilagođeni obrazac filtra za polje filtra URL zahtjeva:
^/(index|[0-9]{4}\/)
To u osnovi navodi da treba tražiti / indeksirati ILI bilo koji 4-znamenkasti numerički put koji završava s kosom crtom. Izradio sam vlasnički pregled u Analyticsu i dodao ga kao filtar:

Evo još nekoliko primjera:
- Imate blog s godinom na putu stalne veze URL-a i želite filtrirati popis prema bilo kojoj godini. Dakle, želim bilo koje 4 numeričke znamenke nakon kojih slijedi kosa crta. Zatraži obrazac URl filtra:
^/[0-9]{4}\/
- Želite usporediti sve svoje stranice na kojima je naslov potvrda or potvrda u njoj. Uzorak filtra naslova stranice:
(.*)certificat(.*)
- Želite usporediti dvije odredišne stranice na temelju njihovog medijuma kampanje proslijeđenog u URL kampanje Google Analytics kao utm_medium = izravna pošta or plaćeni za pretraživanje.
(direct\smail|paid\ssearch)
- Želite usporediti sve proizvode koji su muške košulje na temelju URL puta. Zatraži obrazac URl filtra:
^/mens/shirt/(.*)
- Želite usporediti sve stranice s brojem URL puta koji završava brojem. Zatraži obrazac URl filtra:
^/page/[1-9]*/$
- Želite izuzeti niz IP adresa. Izuzmite obrazac filtra IP adrese:
123\.456\.789\.[0-9]
- Želite uključiti zahvalnu stranicu.html na kojoj je predaja uspješna na temelju niza upita success = true. Zatraži obrazac URl filtra:
thankyou\.html\?success=true
Kako testirati svoje izraze regularnih izraza
Umjesto pokušaja i pogrešaka u Google Analyticsu, često samo pređem na regularni izraz101, fantastičan alat za testiranje vaših regularnih izraza. Čak i raščlanjuje vašu sintaksu i pruža detalje vašeg regularnog izraza:

Izrada, testiranje i uklanjanje pogrešaka regularnog izraza