Regulaaravaldised (regex) on võimas tööriist teksti töötlemiseks ja andmete eraldamiseks. Selles artiklis käsitleme üksikasjalikult märgiklasside ja kvantorite, regexi oluliste komponentide üksikasju, mis aitavad teha täpsemaid otsinguid ja tekstiga manipuleerimisi.

Regulaaravaldiste mõistmine

Regulaaravaldised on märgijadad, mis moodustavad otsingumustreid. Neid kasutatakse stringide sobitamiseks, otsimiseks ja manipuleerimiseks konkreetsete mustrite alusel. See on eriti kasulik selliste ülesannete puhul nagu sisendi kinnitamine, andmete ekstraheerimine ja teksti teisendamine.

Mis on Regexi iseloomuklassid?

Regulaarse väljendi märgiklassid võimaldavad teil määratleda märkide komplekti, mida soovite sobitada. Need on täpsustatud nurksulgudega []. Siin on mõned levinumad märgiklasside tüübid:

  • Põhitegelaste klass: sobib ühele sulgudes olevale märgile. Näiteks, [abc] vastab mis tahes tähemärgile "a", "b" või "c".
  • Vahemik Tähemärgi klass: vastab mis tahes märgile määratud vahemikus. Näiteks, [a-z] sobib mis tahes väiketähtedega.
  • Negeeritud tegelaste klass: sobib iga tähemärgiga, mis pole sulgudes. Näiteks, [^a-z] vastab igale märgile, mis ei ole väiketäht.

Tähemärgiklasside tabel

Tegelaste klassKirjeldusNäideTikud
[abc]Ükskõik milline "a", "b" või "c"bTõsi
[a-z]Mis tahes väiketähtdTõsi
[^a-z]Mis tahes märk, mitte väiketäht1Tõsi
[0-9]Ükskõik milline number5Tõsi

Mis on Regexis kvantaatorid?

Regexi kvantorid määravad, mitu märgi, rühma või märgiklassi eksemplari peab vaste leidmiseks sisendis olema. Siin on mõned sagedamini kasutatavad kvantorid:

  • * (Tärn): vastab 0 või enamale eelneva elemendi kordusele. Näiteks, a* vastab nullile või enamale "a" tähemärgile.
  • + (Pluss): sobib 1 või enama eelneva elemendi kordusega. Näiteks, a+ vastab ühele või mitmele "a" tähemärgile.
  • ? (Küsimärk): vastab 0 või 1 eelneva elemendi eksemplarile. Näiteks, a? vastab nullile või ühele "a" märgile.
  • {n}: Sobib täpselt n eelneva elemendi esinemised. Näiteks, a{3} vastab täpselt kolmele "a" tähemärgile.
  • {n,}: Tikud n või mitu eelneva elemendi esinemist. Näiteks, a{2,} vastab kahele või enamale "a" tähemärgile.
  • {n,m}: Vasted vahel n ja m eelneva elemendi esinemised. Näiteks, a{2,4} sobib kahe kuni nelja "a" tähemärgi vahel.

Kvantorite tabel

KvantifikaatorKirjeldusNäideTikud
*0 või enam kordusta*"", "a", "aa"
+1 või enam kordusta+"a", "aa"
?0 või 1 kordusa?"", "a"
{n}Täpselt n juhtumida{3}"aaa"
{n,}n või rohkem juhtumeida{2,}"aa", "aaa"
{n,m}vahel n ja m juhtumida{2,4}"aa", "aaa"

Märgiklasside ja kvantorite kasutamine koos

Kombineerides võivad märgiklassid ja kvantorid luua väga võimsaid otsingumustreid. Näiteks, [a-zA-Z]{3,5} sobib mis tahes 3–5 tähega sõnaga.

Praktilised näited

  1. Kõigi telefoninumbrite leidmine: erinevas vormingus telefoninumbrite leidmiseks võite kasutada regexit nagu \+?[0-9]{1,3}?[-.\s]?[0-9]{1,4}?[-.\s]?[0-9]{1,4}?[-.\s]?[0-9]{1,9}. See sobitab numbrid valikuliste riigikoodide ja erinevate eraldajatega, nagu sidekriipsud, punktid ja tühikud.
  2. Meiliaadresside eraldamine: meiliaadresside eraldamiseks võite kasutada regexit, näiteks [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}. See muster ühtib e-posti aadresside ühise struktuuriga.

Tööriistad Regexi testimiseks ja koostamiseks

Internetis on saadaval mitu tööriista, mis aitavad teil regulaaravaldisi testida ja luua.

  • Regex101: interaktiivne regexi tester reaalajas selgitustega.
  • RegExr: regexi redaktor ja testija koos kogukonna mustrite ja näidetega.
  • RegexPal: JavaScripti toega lihtne regex-tester.

SEO näpunäited Regexi kasutamiseks

Regulaarset väljendit sisaldava sisu loomisel veenduge, et:

  • Kasutage oma pealkirjades ja alampealkirjades asjakohaseid märksõnu, nagu "regulaarne väljend", "märgiklassid" ja "kvantorid".
  • Struktureerige oma sisu selgete ja lühikeste jaotistega, et parandada loetavust ja SEO-d.
  • Manustage näidistabeleid, et illustreerida regexi toimimist ja parandada kasutajate seotust.

Kokkuvõte

Märgiklasside ja kvantorite mõistmine ja kasutamine regulaaravaldistes võib oluliselt parandada teie võimet teksti otsida ja sellega manipuleerida. Neid tööriistu valdades saate hõlpsalt hakkama keerukate tekstitöötlustoimingutega. Kasutage pakutavaid näiteid ja tööriistu oma oskuste harjutamiseks ja täiustamiseks.

Ärge unustage regulaarselt oma regulaaravaldisi testida ja püsida kursis uute regex-funktsioonide ja parimate tavadega, et jätkata oma tekstitöötlusvõimaluste täiustamist.

Kommentaarid (0)

Siin pole veel kommentaare, võite olla esimene!

Lisa kommentaar

Sinu e-postiaadressi ei avaldata. Nõutavad väljad on tähistatud *-ga


Vali ja osta proxy

Andmekeskuse proksid

Pöörlevad proksid

UDP Proxy'd

Usaldab üle 10 000 kliendi kogu maailmas

Puhverklient
Puhverklient
Puhverklient flowch.ai
Puhverklient
Puhverklient
Puhverklient