정규표현식
정규 표현식(正規表現式, 영어: regular expression, 간단히 regexp 또는 regex, rational expression) 또는 정규식(正規式)은 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어이다. 정규 표현식은 많은 텍스트 편집기와 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있으며, 특히 펄과 Tcl은 언어 자체에 강력한 정규 표현식을 구현하고 있다. (출처 : 위키피디아)
샘플
문자열을 다루다보면 정규표현식을 무조건 써야 하는 상황이 생기는데 매번 검색하고 정규표현식 표를 펴놓고 만들기 힘들어서(귀찮아서) 정리 해본다.
Whitespace 삭제
1 | str.replaceAll("\\s+", ""); |
알파벳 및 특수문자 삭제
1 | str.replaceAll("[\\s+a-zA-Z :%]", ""); |
이 예제에서 특수문자 삭제는 :%
이다.
숫자를 제외한 모든 것을 삭제
1 | str.replaceAll("[^\\d]", ""); |