日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問(wèn)題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
用Python爬取了8262條微博評(píng)論,終于知道今天的微博評(píng)論為什么太好哭了!

本文轉(zhuǎn)載自微信公眾號(hào)「志斌的python筆記」,作者志斌。轉(zhuǎn)載本文請(qǐng)聯(lián)系志斌的python筆記公眾號(hào)。

站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到二七網(wǎng)站設(shè)計(jì)與二七網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:做網(wǎng)站、成都做網(wǎng)站、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、域名注冊(cè)、網(wǎng)頁(yè)空間、企業(yè)郵箱。業(yè)務(wù)覆蓋二七地區(qū)。

大家好,我是志斌~

在此建黨一百周年之際,祝愿我們的黨生日快樂(lè),祝愿我們的祖國(guó)繁榮昌盛!

剛剛志斌打開(kāi)微博,發(fā)現(xiàn)熱搜第一條是“今天的微博評(píng)論太好哭了“,它有263w+的熱度。 于是志斌將這條微博下的評(píng)論,給全部爬取了下來(lái),并做成詞云圖進(jìn)行展示,看看網(wǎng)友們到底評(píng)論了什么,讓人非常好哭!

需要源碼的讀者,加志斌微信獲取哈~

01數(shù)據(jù)采集

志斌在之前的兩篇文章中,詳細(xì)的介紹了如何獲取微博評(píng)論,有興趣的讀者可以看看這兩篇文章批量爬取不同微博下的評(píng)論!爬取微博下全部評(píng)論數(shù)據(jù)~。這里志斌直接展示核心代碼了,代碼如下:

 
 
 
 
  1. for page in range(1,10000):
  2.    if page == 1 :
  3.        params = (
  4.            ('id', '4654152979845247'),
  5.            ('mid', '4654152979845247'),
  6.            ('max_id_type', '0'),
  7.        )
  8.    #s = requests.Session()
  9.    response = requests.get('https://m.weibo.cn/comments/hotflow', headers=headers, params=params)
  10.    a = response.json()['data']['max_id']
  11.    b = response.json()['data']['max_id_type']
  12.    for i in response.json()['data']['data']:
  13.        pinglunshijian = i['created_at']
  14.        neirong = re.sub(r'<[^>]*>', '', i['text'])
  15.        id = i['user']['id']
  16.        yonghumingcheng = i['user']['screen_name']
  17.        with open(r'71.txt', 'a', encoding='utf-8') as f:
  18.            f.write(f'{neirong}\n')
  19.    params = (
  20.        ('id', '4654152979845247'),
  21.        ('mid', '4654152979845247'),
  22.        ('max_id', str(a)),
  23.        ('max_id_type', str(b)),
  24.         )
  25.    print(f'爬取第{page}頁(yè)數(shù)據(jù)......')
  26.    time.sleep(random.randint(1,3))

02詞云圖展示

我們一共獲取了8262條數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行詞云圖繪制,我們發(fā)現(xiàn)盛世、祖國(guó)、華夏、中國(guó)、我們、祝福、驕傲等詞較多??磥?lái)評(píng)論里面都是祝福我們的祖國(guó)和感謝這盛世的!

志斌也點(diǎn)開(kāi)這條熱搜看了一下,里面的評(píng)論確實(shí)很讓人淚目,尤其是這句:“我們生在國(guó)旗下,長(zhǎng)在春風(fēng)里;人民有信仰,國(guó)家有力量;目光所致皆為華夏,五星閃耀皆為信仰?!弊屩颈髢?nèi)心久久不能平靜!

代碼如下:

 
 
 
 
  1. with open("71.txt",encoding='utf-8') as f:
  2.    job_title_1 = f.read()
  3. contents_cut_job_title = jieba.cut(job_title_1)
  4. contents_list_job_title = " ".join(contents_cut_job_title)
  5. wc = WordCloud(stopwords=STOPWORDS.add("一個(gè)"), collocations=False,
  6.               background_color="white",
  7.               font_path=r"K:\蘇新詩(shī)柳楷簡(jiǎn).ttf",
  8.               width=400, height=300, random_state=42,
  9.               mask=imread('xin.jpg', pilmode="RGB")
  10.               )
  11. wc.generate(contents_list_job_title)
  12. wc.to_file("推薦語(yǔ).png")

03小結(jié)

1.  今天上午看建黨百年,聽(tīng)習(xí)近平總書(shū)記的重要講話,感覺(jué)自己何其有幸,生于華夏,生于盛世,不經(jīng)亂戰(zhàn),作為一名光榮的中共黨員,自己以后定當(dāng)不忘初心,牢記使命,以夢(mèng)為馬,不負(fù)韶華!

2. 本文僅作學(xué)習(xí)參考,不做它用。


文章名稱:用Python爬取了8262條微博評(píng)論,終于知道今天的微博評(píng)論為什么太好哭了!
分享網(wǎng)址:http://m.5511xx.com/article/coigoeh.html