午夜视频免费看_日韩三级电影网站_国产精品久久一级_亚洲一级在线播放_人妻体内射精一区二区三区_91夜夜揉人人捏人人添红杏_91福利在线导航_国产又粗又猛又黄又爽无遮挡_欧美日韩一区在线播放_中文字幕一区二区三区四区不卡 _日日夜夜精品视频免费观看_欧美韩日一区二区三区

主頁 > 知識庫 > Python爬蟲入門教程01之爬取豆瓣Top電影

Python爬蟲入門教程01之爬取豆瓣Top電影

熱門標簽:上海企業外呼系統 河南虛擬外呼系統公司 萬利達百貨商場地圖標注 熱門電銷機器人 智能機器人電銷神器 okcc外呼系統怎么調速度 電話機器人哪里有賣 外呼電信系統 惠州龍門400電話要怎么申請

前言

本文的文字及圖片來源于網絡,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理

基本開發環境

  •  Python 3.6
  • Pycharm

相關模塊的使用

  •  requests
  • parsel
  • csv

安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。

爬蟲基本思路

一、明確需求

爬取豆瓣Top250排行電影信息

  • 電影名字
  • 導演、主演
  • 年份、國家、類型
  • 評分、評價人數
  • 電影簡介

 

二、發送請求

Python中的大量開源的模塊使得編碼變的特別簡單,我們寫爬蟲第一個要了解的模塊就是requests。


請求url地址,使用get請求,添加headers請求頭,模擬瀏覽器請求,網頁會給你返回response對象

# 模擬瀏覽器發送請求
import requests
url = 'https://movie.douban.com/top250'
headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
print(response)

200是狀態碼,表示請求成功

2xx (成功)
3xx (重定向)
4xx(請求錯誤)
5xx(服務器錯誤)

常見狀態碼

  • 200 - 服務器成功返回網頁,客戶端請求已成功。
  • 302 - 對象臨時移動。服務器目前從不同位置的網頁響應請求,但請求者應繼續使用原有位置來進行以后的請求。
  • 304 - 屬于重定向。自上次請求后,請求的網頁未修改過。服務器返回此響應時,不會返回網頁內容。
  • 401 - 未授權。請求要求身份驗證。 對于需要登錄的網頁,服務器可能返回此響應。
  • 404 - 未找到。服務器找不到請求的網頁。
  • 503 (服務不可用) 服務器目前無法使用(由于超載或停機維護)。

通常,這只是暫時狀態。

 三、獲取數據

import requests
url = 'https://movie.douban.com/top250'
headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
print(response.text)

requests.get(url=url, headers=headers) 請求網頁返回的是response對象

response.text: 獲取網頁文本數據

response.json: 獲取網頁json數據

這兩個是用的最多的,當然還有其他的

apparent_encoding cookies  	history
iter_lines  ok						close   
elapsed  is_permanent_redirect 	json   
raise_for_status	 connection  	encoding  
is_redirect  links   	raw   
content  headers  	iter_content  
next   reason					url

四、解析數據

常用解析數據方法: 正則表達式、css選擇器、xpath、lxml…

常用解析模塊:bs4、parsel…

我們使用的是 parsel 無論是在之前的文章,還是說之后的爬蟲系列文章,我都會使用 parsel 這個解析庫,無它就是覺得它比bs4香。

parsel 是第三方模塊,pip install parsel 安裝即可

parsel 可以使用 css、xpath、re解析方法

所有的電影信息都包含在 li 標簽當中。

# 把 response.text 文本數據轉換成 selector 對象
selector = parsel.Selector(response.text)
# 獲取所有li標簽
lis = selector.css('.grid_view li')
# 遍歷出每個li標簽內容
for li in lis:
 # 獲取電影標題 hd 類屬性 下面的 a 標簽下面的 第一個span標簽里面的文本數據 get()輸出形式是 字符串獲取一個 getall() 輸出形式是列表獲取所有
 title = li.css('.hd a span:nth-child(1)::text').get() # get()輸出形式是 字符串
 movie_list = li.css('.bd p:nth-child(1)::text').getall() # getall() 輸出形式是列表
 star = movie_list[0].strip().replace('\xa0\xa0\xa0', '').replace('/...', '')
 movie_info = movie_list[1].strip().split('\xa0/\xa0') # ['1994', '美國', '犯罪 劇情']
 movie_time = movie_info[0] # 電影上映時間
 movie_country = movie_info[1] # 哪個國家的電影
 movie_type = movie_info[2] # 什么類型的電影
 rating_num = li.css('.rating_num::text').get() # 電影評分
 people = li.css('.star span:nth-child(4)::text').get() # 評價人數
 summary = li.css('.inq::text').get() # 一句話概述
 dit = {
 '電影名字': title,
 '參演人員': star,
 '上映時間': movie_time,
 '拍攝國家': movie_country,
 '電影類型': movie_type,
 '電影評分': rating_num,
 '評價人數': people,
 '電影概述': summary,
 }
 # pprint 格式化輸出模塊
 pprint.pprint(dit)

以上的知識點使用到了

  • parsel 解析模塊的方法
  • for 循環
  • css 選擇器
  • 字典的創建
  • 列表取值
  • 字符串的方法:分割、替換等
  • pprint 格式化輸出模塊

所以扎實基礎是很有必要的。不然你連代碼都不知道為什么要這樣寫。

五、保存數據(數據持久化)

常用的保存數據方法 with open

像豆瓣電影信息這樣的數據,保存到Excel表格里面會更好。

所以需要使用到 csv 模塊

# csv模塊保存數據到Excel
f = open('豆瓣電影數據.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['電影名字', '參演人員', '上映時間', '拍攝國家', '電影類型',
      '電影評分', '評價人數', '電影概述'])

csv_writer.writeheader() # 寫入表頭


這就是爬取了數據保存到本地了。這只是一頁的數據,爬取數據肯定不只是爬取一頁數據。想要實現多頁數據爬取,就要分析網頁數據的url地址變化規律。

可以清楚看到每頁url地址是 25 遞增的,使用for循環實現翻頁操作

for page in range(0, 251, 25):
 url = f'https://movie.douban.com/top250?start={page}filter='

完整實現代碼

""""""
import pprint
import requests
import parsel
import csv
'''
1、明確需求:
 爬取豆瓣Top250排行電影信息
 電影名字
 導演、主演
 年份、國家、類型
 評分、評價人數
 電影簡介
'''
# csv模塊保存數據到Excel
f = open('豆瓣電影數據.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['電影名字', '參演人員', '上映時間', '拍攝國家', '電影類型',
      '電影評分', '評價人數', '電影概述'])

csv_writer.writeheader() # 寫入表頭

# 模擬瀏覽器發送請求
for page in range(0, 251, 25):
 url = f'https://movie.douban.com/top250?start={page}filter='
 headers = {
 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
 }
 response = requests.get(url=url, headers=headers)
 # 把 response.text 文本數據轉換成 selector 對象
 selector = parsel.Selector(response.text)
 # 獲取所有li標簽
 lis = selector.css('.grid_view li')
 # 遍歷出每個li標簽內容
 for li in lis:
 # 獲取電影標題 hd 類屬性 下面的 a 標簽下面的 第一個span標簽里面的文本數據 get()輸出形式是 字符串獲取一個 getall() 輸出形式是列表獲取所有
 title = li.css('.hd a span:nth-child(1)::text').get() # get()輸出形式是 字符串
 movie_list = li.css('.bd p:nth-child(1)::text').getall() # getall() 輸出形式是列表
 star = movie_list[0].strip().replace('\xa0\xa0\xa0', '').replace('/...', '')
 movie_info = movie_list[1].strip().split('\xa0/\xa0') # ['1994', '美國', '犯罪 劇情']
 movie_time = movie_info[0] # 電影上映時間
 movie_country = movie_info[1] # 哪個國家的電影
 movie_type = movie_info[2] # 什么類型的電影
 rating_num = li.css('.rating_num::text').get() # 電影評分
 people = li.css('.star span:nth-child(4)::text').get() # 評價人數
 summary = li.css('.inq::text').get() # 一句話概述
 dit = {
  '電影名字': title,
  '參演人員': star,
  '上映時間': movie_time,
  '拍攝國家': movie_country,
  '電影類型': movie_type,
  '電影評分': rating_num,
  '評價人數': people,
  '電影概述': summary,
 }
 pprint.pprint(dit)
 csv_writer.writerow(dit)

實現效果


到此這篇關于Python爬蟲入門教程01之爬取豆瓣Top電影的文章就介紹到這了,更多相關Python爬取豆瓣Top電影內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python爬蟲獲取豆瓣電影并寫入excel
  • Python爬蟲實現的根據分類爬取豆瓣電影信息功能示例
  • python爬蟲豆瓣網的模擬登錄實現
  • Python爬蟲——爬取豆瓣電影Top250代碼實例
  • 一個簡單的python爬蟲程序 爬取豆瓣熱度Top100以內的電影信息
  • Python爬蟲實戰:分析《戰狼2》豆瓣影評
  • Python制作豆瓣圖片的爬蟲
  • 實踐Python的爬蟲框架Scrapy來抓取豆瓣電影TOP250
  • 編寫Python爬蟲抓取豆瓣電影TOP100及用戶頭像的方法
  • python 開心網和豆瓣日記爬取的小爬蟲

標簽:淮安 綏化 綿陽 周口 合肥 秦皇島 周口 百色

巨人網絡通訊聲明:本文標題《Python爬蟲入門教程01之爬取豆瓣Top電影》,本文關鍵詞  Python,爬蟲,入門教程,之爬,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Python爬蟲入門教程01之爬取豆瓣Top電影》相關的同類信息!
  • 本頁收集關于Python爬蟲入門教程01之爬取豆瓣Top電影的相關信息資訊供網民參考!
  • 推薦文章
    欧美mv日韩mv国产网站app| 国产精品久久久久久亚洲影视 | 亚洲の无码国产の无码步美| 蜜桃视频在线观看91| 久久久久久久久久久人体| 日韩写真欧美这视频| 亚洲乱码中文字幕综合| 老色鬼精品视频在线观看播放| 少妇太紧太爽又黄又硬又爽| 素人fc2av清纯18岁| 久久久999视频| 久久偷看各类wc女厕嘘嘘偷窃| 91国内免费在线视频| 日韩国产欧美精品一区二区三区| 精品久久久久久国产| 丁香婷婷综合五月| 免费观看黄色一级视频| 亚洲精品www久久久久久| 国产黄色网址在线观看| 成人黄色一区二区| 四虎免费在线观看视频| aaa级精品久久久国产片| 午夜精品视频在线| 国产亚洲日本欧美韩国| 欧美日韩精品系列| 夜夜嗨av一区二区三区四季av| 豆国产96在线|亚洲| 粉嫩av一区二区夜夜嗨| 激情五月婷婷网| 看黄色录像一级片| 91超薄肉色丝袜交足高跟凉鞋| 成人午夜视频在线观看免费| 青青草成人网| 99在线视频首页| 国产成人午夜视频网址| 久久综合国产精品台湾中文娱乐网| 日韩欧美黄色影院| 日本精品视频一区二区| 一区二区三区日本| 国产色婷婷亚洲99精品小说| 国产一区二区91| 美女久久一区| 中国精品一区二区| 日韩av电影网| 亚洲熟女www一区二区三区| 蜜桃精品成人影片| 波多野结衣三级视频| 久久久久久三级| 国产美女主播在线播放 | 欧美一区二区三区四| 免费看一级黄色| 无套内谢大学处破女www小说| 亚洲一区二区福利视频| 男人透女人免费视频| 欧美精品在欧美一区二区| 日韩在线观看电影完整版高清免费| 成人毛片网站| 91精品啪aⅴ在线观看国产| 日本一本a高清免费不卡| 欧美日韩国产91| 久久综合色影院| 中文字幕欧美日韩在线| 亚洲美女av在线播放| 精品福利av导航| 欧美一区二区三区电影| 欧美日韩国产区一| 欧美视频日韩视频| 色伊人久久综合中文字幕| 亚洲成人一区二区在线观看| 亚洲精品成人天堂一二三| 国产精品久久久久桃色tv| 国产欧美精品在线观看| 国产午夜精品一区二区三区四区| 99这里只有久久精品视频| 国产成人亚洲综合a∨婷婷 | 91在线看www| 国产一区视频在线| 国产欧美在线视频| 日本最新高清不卡中文字幕| 2019中文字幕在线| 91wwwcom在线观看| 日本精品性网站在线观看| 日本精品性网站在线观看| 欧美孕妇与黑人孕交| 欧美在线视频一区| 日韩美女在线观看一区| 日韩免费在线免费观看| 国产精品成av人在线视午夜片| 日本精品久久久久久久| 日韩av免费看| 国产一区在线播放| 91在线观看免费高清| 成人情视频高清免费观看电影| 亚洲最大av网站| 91香蕉视频在线下载| 高清视频在线观看一区| 加勒比在线一区二区三区观看| 国严精品久久久久久亚洲影视| 国产一区免费在线| 日本不卡一区二区三区在线观看| 手机在线观看国产精品| 国产又粗又大又爽的视频| 黄色三级中文字幕| 国产精品视频一区二区三区四区五区| 欧美视频第一区| 亚洲小视频网站| 一区二区三区人妻| 亚洲熟妇一区二区三区| 色欲AV无码精品一区二区久久| 成人午夜免费影院| 亚洲一区 视频| 中文字幕免费视频观看| 99久久精品免费看国产交换| 先锋av资源站| 国产一区二区三区免费播放| 99久久99久久免费精品蜜臀| 国产精品沙发午睡系列990531| 亚洲日本一区二区三区| 欧美性猛交xxxx免费看| 91精品国产入口| 精品视频一区在线视频| 久久精品国产综合| 538国产精品视频一区二区| 国产精品美女www| 国产亚洲情侣一区二区无| 亚洲欧美影院| 欧美二区在线视频| 日本黄色www| 免费成人深夜天涯网站| 久久久久久久极品| 亚洲精品911| 六月丁香婷婷色狠狠久久| 99久久99久久久精品齐齐| 综合在线观看色| 色乱码一区二区三区88| 亚洲国产古装精品网站| 久久99精品国产99久久6尤物| 国产精品91在线观看| 国产一区再线| 免费看欧美一级片| 久久婷婷综合色| 伊人网在线视频观看| 日本在线小视频| 丰满少妇高潮在线观看| 国产mv日韩mv欧美| 一区二区三区在线视频播放| 欧美亚洲国产一区在线观看网站| 亚洲黄页视频免费观看| 欧美大学生性色视频| 91精品免费看| 在线观看精品视频| 亚洲综合欧美在线| 欧美巨胸大乳hitomi| 欧美 日韩 精品| 久久久青草婷婷精品综合日韩| 播五月开心婷婷综合| 亚洲一区二区欧美日韩| 欧美videossexotv100| 精品自在线视频| 99国内精品久久久久久久软件| 一本一道久久a久久综合精品 | 久久综合影音| 久久久综合精品| 一本一本大道香蕉久在线精品| 亚洲国产精品久久| 欧美一区二三区| 欧美中日韩免费视频| 日韩中文字幕组| 无码人中文字幕| 国产精品视频久久久久久| 国产精品综合二区| 亚洲国产精品久久久久婷婷884| 欧美xingq一区二区| 91国内免费在线视频| 欧美精品久久| av网站在线不卡| 男女性高潮免费网站| 亚洲a视频在线观看| 26uuu亚洲| 精品视频全国免费看| 久久天天躁夜夜躁狠狠躁2022| 亚洲自拍小视频免费观看| 性高湖久久久久久久久aaaaa| 四川一级毛毛片| 99热国产在线观看| 免费久久99精品国产| 亚洲精品中文在线影院| 亚洲成人av在线播放| 日韩免费av在线| 人人妻人人澡人人爽精品欧美一区| 毛片毛片毛片毛片毛| 日韩精品无码一区二区| 日本少妇一区二区| 亚洲在线视频一区| 国产亚洲精品va在线观看| 91青草视频久久| 浮妇高潮喷白浆视频| 波多野结衣家庭教师在线观看 | 亚洲视频一二三四| 在线观看 中文字幕| 久久99精品网久久| 岛国av在线不卡| 久久精品国产一区二区三区| 久久国产精品免费一区| 亚洲综合av在线播放| 日韩成人高清视频| 国产乱色国产精品免费视频| 日韩欧美国产网站| 欧美猛男性生活免费| 亚洲精品国产精品久久| 国产婷婷在线观看| 国产精品自产拍| 国产女人18水真多18精品一级做| 精品日韩在线一区| 国产主播精品在线| 国产97色在线 | 日韩| 日本网站在线免费观看| 国产高清精品网站| 欧美群妇大交群的观看方式| 人九九综合九九宗合| 日韩小视频网站| 中文字幕另类日韩欧美亚洲嫩草| 欧美a一区二区| 日韩欧美亚洲国产一区| 久久久之久亚州精品露出| 中文字幕剧情在线观看一区| 91网站免费入口| 亚洲av成人精品一区二区三区在线播放| 日韩毛片一二三区| 综合国产在线观看| 午夜精品亚洲一区二区三区嫩草 | 91蜜桃免费观看视频| 欧美成人女星排行榜| 91久久久久久久久久久| 男人的天堂最新网址| 在线观看免费高清视频| 欧美韩国日本一区| 一本色道久久88精品综合| 欧美欧美一区二区| 波多野结衣 在线| 久久五月激情| 色女孩综合影院| 国产精品第2页| 污污的网站18| 一区二区三区黄色片| 亚洲欧美日韩国产综合在线| 久久亚洲一区二区三区四区五区高| 亚洲最新在线| 久久久久久久久久97| 国产精品一区二区不卡| 日韩欧美一级在线播放| eeuss一区二区三区| 男人女人拔萝卜视频| 亚洲精品国产手机| 欧美日韩视频在线| 国产成一区二区| 中文字幕成人免费视频| jlzzjlzzjlzz亚洲人| 亚洲最大色网站| 午夜精品蜜臀一区二区三区免费| 国产精品免费入口| 中文字幕资源网| 亚洲一区二区精品久久av| 欧美国产欧美亚洲国产日韩mv天天看完整| 白白操在线视频| 特级做a爱片免费69| 中文字幕在线免费不卡| 久久亚洲电影天堂| 久久精品视频16| 最新中文字幕免费| 亚洲成人一区二区| 国产成人一区二区| www.成年人| 少妇av一区二区| 欧美精品国产精品| 精品一区久久久| 国产精品综合激情| av网站免费线看精品| 中文字幕国产精品| 91免费黄视频| 国产麻豆免费视频| 91久久人澡人人添人人爽欧美| 国产欧美亚洲精品| 国产在线观看无码免费视频| 黑人巨大精品欧美一区| 日韩精品视频在线观看网址| 亚洲国产日韩欧美| 精品国产乱码一区二区| 亚洲丝袜精品丝袜在线| 日本三级韩国三级久久| 日本wwwxx| 国内精品视频一区二区三区八戒| 亚洲激情免费观看| 4444在线观看| 在线观看不卡的av| 色8久久人人97超碰香蕉987| 粉嫩精品一区二区三区在线观看 | www.天天射.com| 色噜噜在线播放| 精品日韩99亚洲| 午夜在线视频免费观看| 中文字幕精品视频在线观看| 午夜视频一区二区三区| 亚洲伊人久久综合| 91香蕉视频网| 国产精品福利在线播放| 国产成人黄色av| 三叶草欧洲码在线| av成人免费在线观看| 欧美区二区三区| 亚欧精品在线视频| 国产美女久久久久| 久久激情视频久久| 日韩av卡一卡二| 美女视频一区在线观看| 国产一区二区黄| 日本999视频| 日本不卡免费在线视频| 亚洲品质视频自拍网| 国产a级一级片| 久久国产主播| 亚洲色在线视频| av无码精品一区二区三区| 丝袜美腿一区二区三区| 亚洲欧洲一区二区三区在线观看| 国产伦精品一区二区三区四区视频_ | 国产成人一区二区三区电影| 波多野结衣a v在线| 国产肉丝袜一区二区| 日韩免费在线免费观看| 99精品欧美一区二区| 国产精品免费看片| 国产日韩精品在线播放| 黑人操日本美女| 亚洲一区二区五区| 国内外成人免费视频| 尤物视频在线观看国产| 91久久香蕉国产日韩欧美9色| 日韩欧美在线电影| 亚洲在线视频播放| 欧美成人三级在线| 国内外成人激情视频| 久久精品999| 九九九久久国产免费| 国产污在线观看| 久久精品一区二区| 国产玖玖精品视频| 精品99在线观看| 精品久久久久久中文字幕| 欧美日韩最好看的视频| 中文字幕一区二区三区人妻四季| 欧美电影在线免费观看| 成年人三级视频| 深爱激情五月婷婷| 日韩中文字幕亚洲| 国产在线不卡av| 中文字幕亚洲电影| 国产伦精品一区二区三区照片91 | 51妺嘿嘿午夜福利| 亚洲视频一区在线| 国产精品中出一区二区三区| 国产精品视频免费播放| 91精品午夜视频| 亚洲国产精品久久久久爰色欲| 国产一区欧美二区| 国产91精品久久久| 国产免费美女视频| 在线免费观看日韩欧美| 成人区一区二区| 精品一区在线看| 欧美洲成人男女午夜视频| 欧美日韩黄色网| 91精品办公室少妇高潮对白| 日韩精品一区二区三区电影| 日日摸夜夜添夜夜添国产精品| 久热99视频在线观看| 中文字幕一二三四区| 亚洲国产精品人人做人人爽| 亚洲精品无人区| 久久久国产免费| 亚洲精品美女在线| 久久久精品视频国产| 亚洲国产成人私人影院tom | 日本午夜精品一区二区| 国产夫妻自拍av| 久久久电影免费观看完整版| 九色porny自拍视频| 午夜精品影院在线观看| 久久最新免费视频| 久久99精品国产| 国产精品福利无圣光在线一区| 精品人妻在线播放| 日韩三级电影网址| 成年人三级黄色片| 国产精品久久久久久一区二区三区 | 中文字幕精品在线视频| 青青草福利视频| 色婷婷综合久久久中文字幕| 久久99久久99精品| 国产不卡视频在线播放| 91精品在线一区| 国产又粗又长又大视频| 中文字幕日韩专区| 美女被到爽高潮视频| 日韩欧美精品在线观看| 男人操女人逼免费视频| 99国产精品久久久久| 国产精品区一区二区三在线播放 | 国产精品视频一区二区三区不卡| 久久久久久久久久久久久久久久av |