파싱 예제입니다. > 개발자팁

개발자팁

개발과 관련된 유용한 정보를 공유하세요.
질문은 QA에서 해주시기 바랍니다.

파싱 예제입니다. 정보

정규표현식 파싱 예제입니다.

첨부파일

test2.php (1.8K) 663회 다운로드 2015-11-12 22:20:22

본문

사용자가 직접 에디터를 통해 올린 글이라 규칙 잡기가 쉽지 않지만 

대략 샘플 소스 같이 한다면

거의 대부분 가져올수 있습니다.

 

ps) 공부용입니다. 

대상 페이지가 문제 된다면 삭제하도록 하겠습니다.

추천
1

댓글 11개

Snoopy 클래스
http://sourceforge.net/projects/snoopy/

Simple HTML DOM Parser
http://simplehtmldom.sourceforge.net/manual.htm

Snoopy로 긁어와서 HTML DOM Parser 로 접근하면 jquery로 요소에 접근하듯이 개별 요소를 가져오기 쉽더라구요.
어려운 정규표현식 안써도 되서 너무 좋더라구요. ㅎㅎ
네에 그렇게 해도 되죠

스누피는 기본이 1.0 통신이고 경우에 따라 안되는 경우도 제법 있습니다.
조금 많이 손봐야 할 경우가 제법있고

스누피보다는 curl 을 쓰는게 났습니다.

HTML DOM Parser 는 좋긴 한데
대량 처리하기에는 리소스를 많이 잡아 먹습니다.
그냥 쓰기에는 좋습니다. ㅎㅎ

그리고 위 예제 페이지는
사용자가 에디터에서 직접 입력한 내용들이라 매우 불규칙합니다.
HTML DOM Parser 를 써도 제대로 가져오기 어려운 내용입니다.

그냥 위 예제는 심심풀이 땅콩용입니다 ㅎㅎ
아... 그렇군요... 또 그런 문제가 숨겨져 있군요...
거의 안쓰다가 최근에야 잠깐 만져본거라 자세히는 몰라서요~ ㅎㅎㅎ
질문좀하나드려도될가요 답을못찾아서요..
네이버비공개카페글을 가져오려고하는데요 카페는본인이 주인장으로되있구요.
위방법으로하니 로그인페이지가나오고 진행이안되서요
fwrite($fp 이부분에 뭘넣어줘야하는지요?
네 그런 경우라면
로그인을 처리하고 쿠키를 따로 저장하는 부분도 있어야 합니다.
여기서 다룰 내용은 아니구요......
전체 5,352
개발자팁 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT