정규표현식의 기본구조 > 개발강좌

개발강좌

프로그램 강좌 :
1. 유창화님의 썸네일, 정규표현식, 이미지관련 강좌
2. Sphinx 검색엔진을 이용한 도로명 주소 검색 시스템 구축

정규표현식의 기본구조 정보

정규표현식 정규표현식의 기본구조

본문

대단할것은 없는 강좌이지만,
제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.

강좌는 php 5. 대를 기준으로 하며, PCRE (펄과 호환 되는 정규표현식)을 다룹니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.

PCRE > 정규표현식의 기본구조

정규표현식의 기본 구조는
[패턴구분자] [정규표현식] [패턴구분자] [패턴변경자]
입니다.

패턴구분자는 영어 알파벳, 숫자, \ (역슬래쉬) 를 제외한 1byte 문자 를 사용합니다.
` ~ ! @ # / ......

다음과 같은, 정규표현식 내에서 사용되는 의미 있는 메타 문자 는 패턴구분자로서 사용할수 있지만,
패턴구분자로 사용을 권장하지 않습니다.

나중에 다시 설명하겠지만 정규표현식에서 의미 있는 메타 문자는
$ ^ * ( ) + | \ { } ? ......
등이 있습니다.

`[정규표현식]`[패턴변경자]
@[정규표현식]@[패턴변경자]
......


그런데 여기서 평소에 정규표현식을 접해 보던 분들든

"`[정규표현식]`[패턴변경자]"

'`[정규표현식]`[패턴변경자]'
형태로 쓰이는 것을 보셨을 겁니다.

이것은 뭐지? (' 나 " 로 항상 싸여 있는데 왜 기본구조에 포함되지 않지?)
라고 생각하시는 분이 있을지도 모릅니다.

PCRE 는 preg_ 계열의 함수와 쓰이는데
정규표현식이 들어 가는 부분이 함수의 하나의 인자입니다.

즉, 해당 인자가 문자열로 값을 받기 때문에 문자열로 만들기 위한 것입니다.
$a = 'abcde';
또는
$a = "abcde";

$a라는 변수에 abcde 라는 문자열을 할당하는 것과 같은 이치입니다.

많이 쓰는 다른 함수로 예를 들면,
$a = str_replace('abc', 'ABC', $a);
와 같은 것입니다.


아래의 예제는 이메일주소에서 아이디 부분만 뽑는 것입니다.

예제1> test1.php

<?php

$email = '*** 개인정보보호를 위한 이메일주소 노출방지 ***';
preg_match("`^([^@]+)@`", $email, $match);
echo $match[1];

?>


결과 :

dbckdghk1




아래의 예제는 회원가입 등에서 올바른 아이디 인지를 체크하는 것입니다.
이해를 돕기위해 여러가지 경우의 아이디를 동시에 체크하도록 만들어 보았습니다.

예제2> test2.php

<?php

$ids = Array();
$ids[] = 'dbckdghk';
$ids[] = 'dbckdghk1';
$ids[] = 'dbckdghk1_';
$ids[] = 'DBCKDGHK';
$ids[] = 'DbCKdGHk1_';
$ids[] = 'dbc';//3자
$ids[] = 'dbckdghkdbckdghk';//16자
$ids[] = 'dbckdghk&';//_ 이외의 특수 문자
$ids[] = '유창화';//한글

foreach($ids as $id){

    echo $id . ' ==> ';

    //영어 알파벳(대소문자 구분없음), 숫자, _ 만 사용 가능하며, 4자이상 10자 이하
    if (preg_match("`^[0-9a-z_]{4,10}$`i", $id)) {

        echo "<font color='blue'>사용 가능한 아이디 입니다.</font> <br />" . PHP_EOL;
    }
    else {

        echo "<font color='red'>사용 할수 없는 아이디 입니다.</font> <br />" . PHP_EOL;
    }
}

?>


결과 :

dbckdghk ==> 사용 가능한 아이디 입니다.
dbckdghk1 ==> 사용 가능한 아이디 입니다.
dbckdghk1_ ==> 사용 가능한 아이디 입니다.
DBCKDGHK ==> 사용 가능한 아이디 입니다.
DbCKdGHk1_ ==> 사용 가능한 아이디 입니다.
dbc ==> 사용 할수 없는 아이디 입니다.
dbckdghkdbckdghk ==> 사용 할수 없는 아이디 입니다.
dbckdghk& ==> 사용 할수 없는 아이디 입니다.
유창화 ==> 사용 할수 없는 아이디 입니다.


나중에 설명하겠지만,
위의 예제에서는
` 를 패턴구분자로 하며
^, $, {, }, [, ] 메타 문자 와
대소문자를 구분하지 않는 i 패턴변경자
가 사용 된 정규표현식 패턴 입니다.

추천
10

댓글 17개

전체 103
개발강좌 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT