[Scrapy] 07. Selectors(css, xpath)

content

1. Css Selector

2. xpath Selector

3 . 크롤링 실습

4. 참고 사이트

* Xpath 도움 사이트

* css 선택자 도움 사이트

들어가기 전에...

타겟 데이터는 크롬 개발자 도구 사용

선택자 연습 팁 : scrapy shell 에서 테스트(효율성)

scrapy shell 도메인

css 선택자

A B : 자손

A -> B : 자식

::text : 노드 텍스트만 추출

::attr(name) : 노드 속성 값 추출

get(), getall() 사용

get(default='') 사용가능

nodename : 이름이 nodename 선택

text() : 노드 텍스트만 추출

/ : 루트부터 시작

// : 현재 node 부터 문서상의 모든 노드 조회

. : 현재 노드

.. : 현재 노드의 부모 노드

@ 속성 선택자

extract(), extract_first() 사용

get() == extract_first()

get_all() == extract()

response.css('img').xpath('@src').getall()

순서 : 쉘 실행 -> 선택자 확인 -> 코딩 -> 데이터 저장

Kya - Gramming