티스토리 뷰

Others

정규표현식 (Regular Expressions)

nauni 2020. 12. 27. 20:25

알고리즘 공부를 하면서 문자열을 다루는데 정규표현식을 사용하는 경우를 종종 보았다. 그동안 공부해야지 미뤄놨던 내용을 학습하면서 정리해보았다.

위치기호

  • ^ : 캐럿이라고 읽으며, 앞에서부터 탐색
  • $ : 뒤에서부터 탐색
예시 문자열 : who is who
^who 
who is who
who$
who is who
  • \b : 공백을 기준으로 위치에 따라 단어(\w)의 앞 또는 뒤에서부터 탐색
  • \B : \b로 선택된 것의 반대
  • \A : 문자열의 처음에서부터 탐색
  • \Z : 문자열의 끝에서부터 탐색

문자기호

  • . : 모든 문자 아무거나
예시 문자열 : any characters
.
first match : any characters
all matches : any characters
...
first match :any characters
all matches :any characters
  • [] : 배열 안 문자 (예시 [ouy] : o,u,y 중 하나)
  • [-] : 두 값 사이의 의미 (예시 [c-e] : c,d,e 중 하나)
  • [^] : 배열 값 이외, not의 의미를 가짐
  • (|) : 둥근괄호 속 파이프라인은 or의 의미를 가짐 (예시 (ou|to|wp) : ou, to, wp 중 하나)
  • \w : [A-z0-9_]와 같음. 대소문자 알파벳, 숫자, _ 를 포함하는 문자
  • \W : [^A-z0-9_]와 같음. 대소문자, 알파벳, 숫자, _를 제외한 문자
  • \s : 공백
  • \S : 공백 아닌 것
  • \d : [0-9]와 같음. 숫자
  • \D : [^0-9]와 같음. 숫자를 제외한 문자
  • (?=pattern) : 탐색시에는 패턴을 포함하나 선택시에는 미포함
  • (?!pattern) : 탐색시에 패턴이 존재하는지 확인하고 존재한다면 선택하지 않음
예시 문자열 : AAAX---aaax---111
\w+(?=X)
all matches : AAAX---aaax---111
\w+
all matches : AAAX---aaax---111
\w+(?=\w)
all matches : AAAX---aaax---111

예시 문자열 : AAAX-AAA
AAA(?!X)
all matches: AAAX-AAA

수량자

  • * : 0~다수
  • + : 1~다수
  • ? : 0~1
  • 수량자 뒤의 ? : 최소 수량을 나타냄 (예시 *? : 0, +? : 1, ?? : 0)
  • {} : 범위를 나타냄 (예시 {5} : 5개, {2,5} : 2이상 5이하, {3,} : 3이상)
예시 문자열 : aabc abc bc
a*b
all matches : aababbc
a+b
all matches : aababc bc
a?b
all matches : aababbc

 

참고

아래 두 링크를 참고하여 작성하였습니다.

생활코딩 정규표현식
정규표현식 학습 페이지 - zvon

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
글 보관함