IT모아

REGEXP_REPLACE 정의 및 예제(활용법) 본문

Oracle

REGEXP_REPLACE 정의 및 예제(활용법)

아롱사태남 2014.05.29 14:02

REGEXP_REPLACE 정의!!

- 이 함수는 REPLACE 함수를 확장한 개념으로 주어진 문자열에서 특정 패텅을 찾아서 주어진 다른

모양으로 치환하는 함수입니다. 사용법이 다소 복잡하지만

유용하게 사용되는 함수이므로 꼭 숙지 하시기 바랍니다.

 

REGEXP_REPLACE(컬럼명 , 패턴) AS 별칭

 

 

 

컬럼명에 올 수 있는 데이터 타입은 CHAR,  VARCHAR2, NCHAR, NAVARCHAR2, CLOB, NCLOB 입니다.

패턴에서는 찾고자 하는 패턴을 512바이트까지 정규 표현식을 사용하시면 됩니다.

 

 

 

정규식--------------------------

. 문자 1개의 문자와 일치한다. 단일행 모드에서는 새줄 문자를 제외한다.
\ 이스케이프 특수 문자를 식에 문자 자체로 포함한다.
¦ 선택 여러 식 중에서 하나를 선택한다. 예를 들어, "abc¦adc"는 abc와 adc 문자열을 모두 포함한다.
^ 부정 문자 클래스 안의 문자를 제외한 나머지를 선택한다. 예를 들면 [^abc]d는 ad, bd, cd는 포함하지 않고 ed, fd 등을 포함한다. [^a-z]는 알파벳 소문자로 시작하지 않는 모든 문자를 의미한다.
[] 문자 클래스 "["과 "]" 사이의 문자 중 하나를 선택한다. "¦"를 여러 개 쓴 것과 같은 의미이다. 예를 들면 [abc]d는 ad, bd, cd를 뜻한다. 또한, "-" 기호와 함께 쓰면 범위를 지정할 수 있다. "[a-z]"는 a부터 z까지 중 하나, "[1-9]"는 1부터 9까지 중의 하나를 의미한다.
() 하위식 여러 식을 하나로 묶을 수 있다. "abc¦adc"와 "a(b¦d)c"는 같은 의미를 가진다.
* 0회 이상 0개 이상의 문자를 포함한다. "a*b"는 "b", "ab", "aab", "aaab"를 포함한다.
+ 1회 이상 "a+b"는 "ab", "aab", "aaab"를 포함하지만 "b"는 포함하지 않는다.
 ? 0 또는 1회 "a?b"는 "b", "ab"를 포함한다.
{m} m회 "a{3}b"는 "aaab"만 포함한다.
{m,} m회 이상 "a{2,}b"는 "aab", "aaab", "aaaab"를 포함한다. "ab"는 포함되지 않는다.
{m, n} m회 이상 n회 이하 "a{1,3}b"는 "ab", "aab", "aaab"를 포함하지만, "b"나 "aaaab"는 포함하지 않는다

 

POSIX 비표준 펄/Tcl Vim ASCII 설명
[:alnum:] [A-Za-z0-9] 영숫자
[:word:] \w \w [A-Za-z0-9_] 영숫자 + "_"
\W \W [^A-Za-z0-9_] 낱말이 아닌 문자
[:alpha:] \a [A-Za-z] 알파벳 문자
[:blank:] \s [ \t] 공백과 탭
\b \< \> (?<=\W)(?=\w)|(?<=\w)(?=\W) 낱말 경계
[:cntrl:] [\x00-\x1F\x7F] 제어 문자
[:digit:] \d \d [0-9] 숫자
\D \D [^0-9] 숫자가 아닌 문자
[:graph:] [\x21-\x7E] 보이는 문자
[:lower:] \l [a-z] 소문자
[:print:] \p [\x20-\x7E] 보이는 문자 및 공백 문자
[:punct:] [][!"#$%&'()*+,./:;<=>?@\^_`{|}~-] 구두점
[:space:] \s \_s (단순히 줄 끝에 추가) [ \t\r\n\v\f] 공백 문자
\S [^ \t\r\n\v\f] 공백이 아닌 모든 문자
[:upper:] \u [A-Z] 대문자
[:xdigit:] \x [A-Fa-f0-9] 16진수

 

 

-------------------------------

 

그럼 예제를 보실까요?

 

실제  데이터 값 = 20101122

 

- 쿼리 -

REGEXP_REPLACE(컬럼명,'([[:digit:]]{4})([[:digit:]]{2})([[:digit:]]{2})','\\1-\\2-\\3') as 별칭

 

DIGIT 은 정규식에서 숫자를 의미 하며 {4}는 2010을 {2} 11을 {2}는 22를 뜻합니다

이 패턴에서 1번째 값과 2번째 값과 3번째 값을 불러와서 각 자리에 - 를 이용하여 2010-11-22 가 나오게 됩니다

 

 

이때 포인트!!!

오라클 에서는 \1-\2-\3 를 이용해서 결과 값이 나오지만 자바에서는 \\를 이용해야지 결과 값이 나옵니다^^ 컴파일 할때 \는 못읽고 \\부터 읽을 수 있는거 같습니다.

 

0 Comments
댓글쓰기 폼