Others
정규표현식 (Regular Expressions)
nauni
2020. 12. 27. 20:25
알고리즘 공부를 하면서 문자열을 다루는데 정규표현식을 사용하는 경우를 종종 보았다. 그동안 공부해야지 미뤄놨던 내용을 학습하면서 정리해보았다.
위치기호
- ^ : 캐럿이라고 읽으며, 앞에서부터 탐색
- $ : 뒤에서부터 탐색
예시 문자열 : who is who
^who
who is who
who$
who is who
- \b : 공백을 기준으로 위치에 따라 단어(\w)의 앞 또는 뒤에서부터 탐색
- \B : \b로 선택된 것의 반대
- \A : 문자열의 처음에서부터 탐색
- \Z : 문자열의 끝에서부터 탐색
문자기호
- . : 모든 문자 아무거나
예시 문자열 : any characters
.
first match : any characters
all matches : any characters
...
first match :any characters
all matches :any characters
- [] : 배열 안 문자 (예시 [ouy] : o,u,y 중 하나)
- [-] : 두 값 사이의 의미 (예시 [c-e] : c,d,e 중 하나)
- [^] : 배열 값 이외, not의 의미를 가짐
- (|) : 둥근괄호 속 파이프라인은 or의 의미를 가짐 (예시 (ou|to|wp) : ou, to, wp 중 하나)
- \w : [A-z0-9_]와 같음. 대소문자 알파벳, 숫자, _ 를 포함하는 문자
- \W : [^A-z0-9_]와 같음. 대소문자, 알파벳, 숫자, _를 제외한 문자
- \s : 공백
- \S : 공백 아닌 것
- \d : [0-9]와 같음. 숫자
- \D : [^0-9]와 같음. 숫자를 제외한 문자
- (?=pattern) : 탐색시에는 패턴을 포함하나 선택시에는 미포함
- (?!pattern) : 탐색시에 패턴이 존재하는지 확인하고 존재한다면 선택하지 않음
예시 문자열 : AAAX---aaax---111
\w+(?=X)
all matches : AAAX---aaax---111
\w+
all matches : AAAX---aaax---111
\w+(?=\w)
all matches : AAAX---aaax---111
예시 문자열 : AAAX-AAA
AAA(?!X)
all matches: AAAX-AAA
수량자
- * : 0~다수
- + : 1~다수
- ? : 0~1
- 수량자 뒤의 ? : 최소 수량을 나타냄 (예시 *? : 0, +? : 1, ?? : 0)
- {} : 범위를 나타냄 (예시 {5} : 5개, {2,5} : 2이상 5이하, {3,} : 3이상)
예시 문자열 : aabc abc bc
a*b
all matches : aabc abc bc
a+b
all matches : aabc abc bc
a?b
all matches : aabc abc bc
참고
아래 두 링크를 참고하여 작성하였습니다.