无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

python爬取豆瓣影評(píng)用戶時(shí)間評(píng)價(jià)內(nèi)容

2023-06-16 12:34 作者:duokkshu  | 我要投稿


import requests
from bs4 import BeautifulSoup
import time
import random

# 如果想多爬幾頁(yè)可以將16修改為更大的偶數(shù)
for i in range(2, 16, 2):
? ?url = 'https://movie.douban.com/subject/34841067/comments?start={}0&limit=20&status=P&sort=new_score'.format(i)
? ?headers = {
? ? ? ?'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.5 Safari/605.1.15'
? ?}

? ?# 請(qǐng)求
? ?r=requests.get(url, headers=headers)

? ?if r.status_code == 200:
? ? ? ?# 獲取標(biāo)題
? ? ? ?html = BeautifulSoup(r.text, "html.parser")
? ? ? ?title = html.find("h1").text

? ? ? ?# 獲取用戶名、評(píng)論、評(píng)分、時(shí)間
? ? ? ?divs = html.find_all("div", class_="comment")

? ? ? ?s = {"力薦": "★★★★★", "推薦": "★★★★", "還行": "★★★", "較差": "★★", "很差": "★"}

? ? ? ?with open(f"{title}.txt", "a+", encoding="utf-8") as f:
? ? ? ? ? ?for div in divs:
? ? ? ? ? ? ? ?print("---------------------------------")
? ? ? ? ? ? ? ?name = div.find("a", class_="").text
? ? ? ? ? ? ? ?print("用戶名:", name)

? ? ? ? ? ? ? ?content = div.find("span", class_="short").text
? ? ? ? ? ? ? ?print("用戶評(píng)論:", content)

? ? ? ? ? ? ? ?score = None
? ? ? ? ? ? ? ?for i in range(1, 6):
? ? ? ? ? ? ? ? ? ?try:
? ? ? ? ? ? ? ? ? ? ? ?score = s[div.find(f"span", class_=f"allstar{i}0 rating")["title"]]
? ? ? ? ? ? ? ? ? ?except:
? ? ? ? ? ? ? ? ? ? ? ?continue

? ? ? ? ? ? ? ?if score is None:
? ? ? ? ? ? ? ? ? ?score = "用戶未評(píng)分"

? ? ? ? ? ? ? ?time_str = div.find('span', class_='comment-time')['title']
? ? ? ? ? ? ? ?time_tuple = time.strptime(time_str, '%Y-%m-%d %H:%M:%S')
? ? ? ? ? ? ? ?time_formatted = time.strftime('%Y-%m-%d %H:%M:%S', time_tuple)

? ? ? ? ? ? ? ?print("評(píng)分:", score)
? ? ? ? ? ? ? ?print("時(shí)間: ", time_formatted)
? ? ? ? ? ? ? ?print(f"[+]...{name} 的評(píng)論已爬取")
? ? ? ? ? ? ? ?f.write("\n")
? ? ? ? ? ? ? ?f.write(str([name, score, content, time_formatted]))

? ? ? ? ? ?f.close()

? ?random_sleep_time = random.randint(1, 3)
? ?time.sleep(random_sleep_time)

python爬取豆瓣影評(píng)用戶時(shí)間評(píng)價(jià)內(nèi)容的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
扶绥县| 新乡县| 旺苍县| 荆州市| 洛扎县| 乌鲁木齐市| 灵川县| 晋宁县| 腾冲县| 如皋市| 平山县| 古浪县| 云龙县| 壤塘县| 林州市| 高淳县| 景谷| 扶风县| 楚雄市| 施甸县| 新巴尔虎左旗| 汾西县| 麻江县| 紫金县| 平湖市| 牡丹江市| 新源县| 双牌县| 苏尼特右旗| 民丰县| 隆回县| 河曲县| 三亚市| 公主岭市| 治多县| 上饶县| 额敏县| 泽普县| 阜南县| 达孜县| 喀喇沁旗|