import requests
from bs4 import BeautifulSoup
url = 'https://movie.naver.com/movie/bi/mi/basic.nhn?code=171539'
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(url,headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
# 여기에 코딩을 해서 meta tag를 먼저 가져와보겠습니다.
# 이 방법대로 하면 안나옴
# title = soup.select_one('head > meta:nth-child(9)')
title = soup.select_one('meta[property="og:title"]')['content']
image = soup.select_one('meta[property="og:image"]')['content']
desc = soup.select_one('meta[property="og:description"]')['content']
print(title, image, desc)
크롤링이 수공업이라고 누가 말했던가..
정말 명언이다
사이트 마다 / 데이터 마다 하나하나 방법이 다르고,,, 메타태그를 활용한 방법은 이번에 알게 되었다.!!
ajax 결과 파이썬으로 크롤링 하기 (0) | 2023.03.13 |
---|---|
세션 vs 토큰 vs 쿠키 개념잡기 (0) | 2023.02.27 |
태그에서 display:block을 구분해서 크롤링 할때 (0) | 2023.02.15 |
실습으로 끝장내는 파이썬 웹 크롤링(4) (0) | 2023.02.08 |
자바스크립트 메소드를 사용해서 스크롤 이동 (0) | 2023.02.06 |