ടെക്സ്റ്റ് പ്രോസസ്സിംഗിനും ഡാറ്റ എക്സ്ട്രാക്ഷനുമുള്ള ഒരു ശക്തമായ ഉപകരണമാണ് റെഗുലർ എക്സ്പ്രഷനുകൾ (regex). ഈ ലേഖനത്തിൽ, നൂതനമായ തിരയലുകളും ടെക്സ്റ്റ് കൃത്രിമത്വങ്ങളും നടത്താൻ സഹായിക്കുന്ന റെജക്സിൻ്റെ അവശ്യ ഘടകങ്ങളായ പ്രതീക ക്ലാസുകളുടെയും ക്വാണ്ടിഫയറുകളുടെയും വിശദാംശങ്ങളിലേക്ക് ഞങ്ങൾ പരിശോധിക്കും.
റെഗുലർ എക്സ്പ്രഷനുകൾ മനസ്സിലാക്കുന്നു
സെർച്ച് പാറ്റേണുകൾ രൂപപ്പെടുത്തുന്ന പ്രതീകങ്ങളുടെ ക്രമങ്ങളാണ് റെഗുലർ എക്സ്പ്രഷനുകൾ. നിർദ്ദിഷ്ട പാറ്റേണുകളെ അടിസ്ഥാനമാക്കി സ്ട്രിംഗുകൾ പൊരുത്തപ്പെടുത്താനും തിരയാനും കൈകാര്യം ചെയ്യാനും അവ ഉപയോഗിക്കുന്നു. ഇൻപുട്ട് സാധൂകരിക്കുക, ഡാറ്റ എക്സ്ട്രാക്റ്റുചെയ്യൽ, ടെക്സ്റ്റ് രൂപാന്തരപ്പെടുത്തൽ തുടങ്ങിയ ജോലികൾക്ക് ഇത് പ്രത്യേകിച്ചും ഉപയോഗപ്രദമാണ്.
Regex-ലെ ക്യാരക്ടർ ക്ലാസുകൾ എന്തൊക്കെയാണ്?
നിങ്ങൾ പൊരുത്തപ്പെടുത്താൻ ആഗ്രഹിക്കുന്ന ഒരു കൂട്ടം പ്രതീകങ്ങൾ നിർവചിക്കാൻ റീജക്സിലെ പ്രതീക ക്ലാസുകൾ നിങ്ങളെ അനുവദിക്കുന്നു. സ്ക്വയർ ബ്രാക്കറ്റുകൾ ഉപയോഗിച്ചാണ് അവ വ്യക്തമാക്കിയിരിക്കുന്നത് []
. ചില സാധാരണ തരത്തിലുള്ള പ്രതീക ക്ലാസുകൾ ഇതാ:
- അടിസ്ഥാന സ്വഭാവ ക്ലാസ്: ബ്രാക്കറ്റിനുള്ളിലെ ഏതെങ്കിലും പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു. ഉദാഹരണത്തിന്,
[abc]
'a', 'b', അല്ലെങ്കിൽ 'c' എന്നീ ഏതെങ്കിലും പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടും. - റേഞ്ച് ക്യാരക്ടർ ക്ലാസ്: നിർദ്ദിഷ്ട ശ്രേണിയിലുള്ള ഏതെങ്കിലും ഒരു പ്രതീകവുമായി പൊരുത്തപ്പെടുന്നു. ഉദാഹരണത്തിന്,
[a-z]
ഏതെങ്കിലും ചെറിയ അക്ഷരവുമായി പൊരുത്തപ്പെടും. - നിരാകരിച്ച പ്രതീക ക്ലാസ്: ബ്രാക്കറ്റിൽ ഇല്ലാത്ത ഏത് പ്രതീകവുമായും പൊരുത്തപ്പെടുന്നു. ഉദാഹരണത്തിന്,
[^a-z]
ചെറിയക്ഷരമല്ലാത്ത ഏത് അക്ഷരവും പൊരുത്തപ്പെടും.
പ്രതീക ക്ലാസുകളുടെ ഉദാഹരണ പട്ടിക
പ്രതീക ക്ലാസ് | വിവരണം | ഉദാഹരണം | മത്സരങ്ങൾ |
---|---|---|---|
[abc] | 'a', 'b', അല്ലെങ്കിൽ 'c' എന്നിവയിൽ ഏതെങ്കിലും | b | സത്യം |
[a-z] | ഏതെങ്കിലും ചെറിയ അക്ഷരം | d | സത്യം |
[^a-z] | ഏത് അക്ഷരവും ചെറിയക്ഷരമല്ല | 1 | സത്യം |
[0-9] | ഏതെങ്കിലും അക്കം | 5 | സത്യം |
Regex-ലെ ക്വാണ്ടിഫയറുകൾ എന്തൊക്കെയാണ്?
ഒരു പൊരുത്തം കണ്ടെത്തുന്നതിന് ഇൻപുട്ടിൽ ഒരു പ്രതീകത്തിൻ്റെയോ ഗ്രൂപ്പിൻ്റെയോ പ്രതീക ക്ലാസിൻ്റെയോ എത്ര സന്ദർഭങ്ങൾ ഉണ്ടായിരിക്കണമെന്ന് റീജക്സിലെ ക്വാണ്ടിഫയറുകൾ വ്യക്തമാക്കുന്നു. സാധാരണയായി ഉപയോഗിക്കുന്ന ചില ക്വാണ്ടിഫയറുകൾ ഇതാ:
*
(നക്ഷത്രചിഹ്നം): മുമ്പത്തെ ഘടകത്തിൻ്റെ 0 അല്ലെങ്കിൽ കൂടുതൽ ആവർത്തനങ്ങളുമായി പൊരുത്തപ്പെടുന്നു. ഉദാഹരണത്തിന്,a*
പൂജ്യമോ അതിലധികമോ 'a' പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു.+
(കൂടാതെ): മുമ്പത്തെ ഘടകത്തിൻ്റെ ഒന്നോ അതിലധികമോ ആവർത്തനങ്ങളുമായി പൊരുത്തപ്പെടുന്നു. ഉദാഹരണത്തിന്,a+
ഒന്നോ അതിലധികമോ 'a' പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു.?
(ചോദ്യചിഹ്നം): മുമ്പത്തെ ഘടകത്തിൻ്റെ 0 അല്ലെങ്കിൽ 1 ഉദാഹരണവുമായി പൊരുത്തപ്പെടുന്നു. ഉദാഹരണത്തിന്,a?
പൂജ്യം അല്ലെങ്കിൽ ഒരു 'a' പ്രതീകവുമായി പൊരുത്തപ്പെടുന്നു.{n}
: കൃത്യമായി പൊരുത്തപ്പെടുന്നുn
മുമ്പത്തെ മൂലകത്തിൻ്റെ സംഭവങ്ങൾ. ഉദാഹരണത്തിന്,a{3}
കൃത്യമായി മൂന്ന് 'എ' പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു.{n,}
: മത്സരങ്ങൾn
അല്ലെങ്കിൽ മുമ്പത്തെ മൂലകത്തിൻ്റെ കൂടുതൽ സംഭവങ്ങൾ. ഉദാഹരണത്തിന്,a{2,}
രണ്ടോ അതിലധികമോ 'a' പ്രതീകങ്ങളുമായി പൊരുത്തപ്പെടുന്നു.{n,m}
: തമ്മിലുള്ള മത്സരങ്ങൾn
ഒപ്പംm
മുമ്പത്തെ മൂലകത്തിൻ്റെ സംഭവങ്ങൾ. ഉദാഹരണത്തിന്,a{2,4}
രണ്ട് മുതൽ നാല് 'a' പ്രതീകങ്ങൾ തമ്മിലുള്ള പൊരുത്തങ്ങൾ.
ക്വാണ്ടിഫയറുകളുടെ ഉദാഹരണ പട്ടിക
ക്വാണ്ടിഫയർ | വിവരണം | ഉദാഹരണം | മത്സരങ്ങൾ |
---|---|---|---|
* | 0 അല്ലെങ്കിൽ കൂടുതൽ ആവർത്തനങ്ങൾ | a* | "", "a", "aa" |
+ | ഒന്നോ അതിലധികമോ ആവർത്തനങ്ങൾ | a+ | "a", "aa" |
? | 0 അല്ലെങ്കിൽ 1 ആവർത്തനം | a? | "", "എ" |
{n} | കൃത്യമായി n സംഭവങ്ങൾ | a{3} | "aaa" |
{n,} | n അല്ലെങ്കിൽ കൂടുതൽ സംഭവങ്ങൾ | a{2,} | "ആ", "ആആ" |
{n,m} | ഇടയിൽ n ഒപ്പം m സംഭവങ്ങൾ | a{2,4} | "ആ", "ആആ" |
പ്രതീക ക്ലാസുകളും ക്വാണ്ടിഫയറുകളും ഒരുമിച്ച് ഉപയോഗിക്കുന്നു
സംയോജിപ്പിക്കുമ്പോൾ, പ്രതീക ക്ലാസുകളും ക്വാണ്ടിഫയറുകളും വളരെ ശക്തമായ തിരയൽ പാറ്റേണുകൾ സൃഷ്ടിക്കാൻ കഴിയും. ഉദാഹരണത്തിന്, [a-zA-Z]{3,5}
3 മുതൽ 5 വരെ അക്ഷരങ്ങളുള്ള ഏത് പദവുമായും പൊരുത്തപ്പെടും.
പ്രായോഗിക ഉദാഹരണങ്ങൾ
- എല്ലാ ഫോൺ നമ്പറുകളും കണ്ടെത്തുന്നു: വ്യത്യസ്ത ഫോർമാറ്റുകളിൽ ഫോൺ നമ്പറുകൾ കണ്ടെത്താൻ, നിങ്ങൾക്ക് ഒരു റീജക്സ് പോലുള്ളവ ഉപയോഗിക്കാം
\+?[0-9]{1,3}?[-.\s]?[0-9]{1,4}?[-.\s]?[0-9]{1,4}?[-.\s]?[0-9]{1,9}
. ഇത് ഓപ്ഷണൽ കൺട്രി കോഡുകളുമായും ഡാഷുകൾ, ഡോട്ടുകൾ, സ്പെയ്സുകൾ എന്നിവ പോലുള്ള വിവിധ ഡിലിമിറ്ററുകളുമായും സംഖ്യകളുമായി പൊരുത്തപ്പെടും. - ഇമെയിൽ വിലാസങ്ങൾ വേർതിരിച്ചെടുക്കുന്നു: ഇമെയിൽ വിലാസങ്ങൾ എക്സ്ട്രാക്റ്റുചെയ്യുന്നതിന്, നിങ്ങൾക്ക് ഒരു റീജക്സ് ഉപയോഗിക്കാം
[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
. ഈ പാറ്റേൺ ഇമെയിൽ വിലാസങ്ങളുടെ പൊതുവായ ഘടനയുമായി പൊരുത്തപ്പെടുന്നു.
Regex പരീക്ഷിക്കുന്നതിനും നിർമ്മിക്കുന്നതിനുമുള്ള ഉപകരണങ്ങൾ
നിങ്ങളുടെ പതിവ് എക്സ്പ്രഷനുകൾ പരീക്ഷിക്കാനും നിർമ്മിക്കാനും സഹായിക്കുന്ന നിരവധി ടൂളുകൾ ഓൺലൈനിൽ ലഭ്യമാണ്:
- Regex101: തത്സമയ വിശദീകരണങ്ങളുള്ള ഒരു ഇൻ്ററാക്ടീവ് റീജക്സ് ടെസ്റ്റർ.
- RegExr: കമ്മ്യൂണിറ്റി പാറ്റേണുകളും ഉദാഹരണങ്ങളും ഉള്ള ഒരു റീജക്സ് എഡിറ്ററും ടെസ്റ്ററും.
- RegexPal: JavaScript പിന്തുണയുള്ള ഒരു ലളിതമായ regex ടെസ്റ്റർ.
Regex ഉപയോഗിക്കുന്നതിനുള്ള SEO നുറുങ്ങുകൾ
regex ഉൾപ്പെടുന്ന ഉള്ളടക്കം സൃഷ്ടിക്കുമ്പോൾ, ഉറപ്പാക്കുക:
- നിങ്ങളുടെ തലക്കെട്ടുകളിലും ഉപശീർഷകങ്ങളിലും "regex", "character Classes", "quantifiers" എന്നിവ പോലുള്ള പ്രസക്തമായ കീവേഡുകൾ ഉപയോഗിക്കുക.
- വായനാക്ഷമതയും എസ്ഇഒയും വർദ്ധിപ്പിക്കുന്നതിന് വ്യക്തവും സംക്ഷിപ്തവുമായ വിഭാഗങ്ങൾ ഉപയോഗിച്ച് നിങ്ങളുടെ ഉള്ളടക്കം രൂപപ്പെടുത്തുക.
- റീജക്സ് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്നും ഉപയോക്തൃ ഇടപഴകൽ മെച്ചപ്പെടുത്തുന്നതിനും ഉദാഹരണ പട്ടികകൾ ഉൾച്ചേർക്കുക.
ഉപസംഹാരം
സാധാരണ എക്സ്പ്രഷനുകളിലെ ക്യാരക്ടർ ക്ലാസുകളും ക്വാണ്ടിഫയറുകളും മനസിലാക്കുകയും ഉപയോഗിക്കുകയും ചെയ്യുന്നത് ടെക്സ്റ്റ് തിരയാനും കൈകാര്യം ചെയ്യാനുമുള്ള നിങ്ങളുടെ കഴിവിനെ ഗണ്യമായി വർദ്ധിപ്പിക്കും. ഈ ഉപകരണങ്ങൾ മാസ്റ്റേഴ്സ് ചെയ്യുന്നതിലൂടെ, നിങ്ങൾക്ക് സങ്കീർണ്ണമായ ടെക്സ്റ്റ് പ്രോസസ്സിംഗ് ജോലികൾ എളുപ്പത്തിൽ കൈകാര്യം ചെയ്യാൻ കഴിയും. നിങ്ങളുടെ കഴിവുകൾ പരിശീലിക്കാനും പരിഷ്കരിക്കാനും നൽകിയിരിക്കുന്ന ഉദാഹരണങ്ങളും ഉപകരണങ്ങളും ഉപയോഗിക്കുക.
നിങ്ങളുടെ റെഗുലർ എക്സ്പ്രെഷനുകൾ പതിവായി പരിശോധിക്കാനും പുതിയ റീജക്സ് ഫീച്ചറുകളും മികച്ച രീതികളും ഉപയോഗിച്ച് അപ്ഡേറ്റ് ചെയ്യാനും ഓർമ്മിക്കുക.
അഭിപ്രായങ്ങൾ (0)
ഇവിടെ ഇതുവരെ അഭിപ്രായങ്ങളൊന്നുമില്ല, നിങ്ങൾക്ക് ആദ്യത്തെയാളാകാം!