抓取豆瓣上的《长津湖》的热评，我发现了这些

link之家
链接快照平台
输入网页链接，自动生成快照
标签化管理网页链接
相关文章推荐
考研的投影仪 · EVA 收官之作、豆瓣评分 ...· 1 月前 ·
开朗的麻辣香锅 · 内容超出表格<td>宽度则自动隐藏-阿里云开 ...· 1 年前 ·
淡定的创口贴 · 李长河中文主页实验一 Visual ...· 2 年前 ·
活泼的芹菜 · 用Python实现Modbus-RTU协议及 ...· 2 年前 ·
爽快的跑步机 · python - How to speed ...· 2 年前 ·
#读取test.csv文件中的A、B列，若不设置usecols参数，默认读取全部数据。 df = pd.read_csv( open (file_path, 'r' ,encoding= 'utf-8' ), names=[ "用户名" , "星评" , "评论时间" , "评论" ]) df.head()
star_num = df.星评.value_counts()
star_num = star_num.sort_index()
star_num
力荐        112
推荐         35
该用户未星评      2
较差         14
还行         37
Name: 星评, dtype: int64
豆瓣短评评分占比
from pyecharts.charts import Pie, Bar, Line, Page
from pyecharts import options as opts 
from pyecharts.globals import SymbolType
# 数据对
data_pair = [list(z) for z in zip([i for i in star_num.index], star_num.values.tolist())]
pie1 = Pie(init_opts=opts.InitOpts(width='800px', height='400px'))
pie1.add('', data_pair, radius=['35%', '60%'])
pie1.set_global_opts(title_opts=opts.TitleOpts(title='豆瓣短评评分占比'), 
                     legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%')
pie1.set_series_opts(label_opts=opts.LabelOpts(formatter='{b}:{d}%'))
pie1.render_notebook()
在这里插入图片描述
评论数量走势图
# 折线图
line1 = Line(init_opts=opts.InitOpts(width='800px', height='400px'))
line1.add_xaxis(comment_date.index.tolist())
line1.add_yaxis('', comment_date.values.tolist(),
                #areastyle_opts=opts.AreaStyleOpts(opacity=0.5),
                label_opts=opts.LabelOpts(is_show=False))
line1.set_global_opts(title_opts=opts.TitleOpts(title='评论数量走势图'), 
#                       toolbox_opts=opts.ToolboxOpts(),
                      visualmap_opts=opts.VisualMapOpts(max_=140))
line1.set_series_opts(linestyle_opts=opts.LineStyleOpts(width=4))
line1.render_notebook()
9月30号上映，9月29号就开始造势了，30号达到高峰，但是1号似乎势头大减啊。
import jieba
def get_cut_words(content_series):
    # 读入停用词表
    stop_words = [] 
    with open(r"hit_stopwords.txt", 'r', encoding='utf-8') as f:
        lines = f.readlines()
        for line in lines:
            stop_words.append(line.strip())
    # 添加关键词
    my_words = ['长津湖', '志愿军']  
    for i in my_words:
        jieba.add_word(i) 
#     自定义停用词
    my_stop_words = ['电影',"长津湖","战争"] 
    stop_words.extend(my_stop_words)               
    word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False)
    # 条件筛选
    word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2]
    return word_num_selected
text1 = get_cut_words(content_series=df[(df.星评=='力荐')|(df.星评=='推荐')]['评论'])
text1[:5]
['牺牲', '冰雪', '战士', '应该', '遗忘']
import stylecloud
from IPython.display import Image # 用于在jupyter lab中显示本地图片
# 绘制词云图
stylecloud.gen_stylecloud(text=' '.join(text1), 
                          max_words=1000,
                          collocations=False,
                          font_path=r'经典综艺体简.ttf',
                          icon_name='fas fa-thumbs-up',
                          size=360,
                          output_name='豆瓣正向评分词云图.png')
Image(filename='豆瓣正向评分词云图.png') 
text2 = get_cut_words(content_series=df[(df.星评=='还行')|(df.星评=='较差')]['评论'])
text2[:5]
['有点', '失望', '剧情', '一如既往', '人物']
# 绘制词云图
stylecloud.gen_stylecloud(text=' '.join(text2), 
                          max_words=1000,
                          collocations=False,
                          font_path=r'经典综艺体简.ttf',
                          icon_name='fas fa-thumbs-down',
                          size=350,
                          output_name='豆瓣负向评分词云图.png')
Image(filename='豆瓣负向评分词云图.png') 
        Neal_yang
          一个合格(优秀)的前端都应该阅读这些文章
 的确，有些标题党了。起因是微信群里，有哥们问我，你是怎么学习前端的呢？能不能共享一下学习方法。一句话也挺触动我的，我真的不算是什么大佬，对于学习前端知识，我也不能说是掌握了什么捷径。当然，我个人的学习方法这篇文章已经在写了，预计这周末会在我个人公众号发布。而在此之前，我想展(g…
  39.5w
 
 
        程序员依扬
      
    【1 月最新】前端 100 问：能搞懂 80% 的请把简历给我
 半年时间，几千人参与，精选大厂前端面试高频 100 题，这就是「壹题」。 在 2019 年 1 月 21 日这天，「壹题」项目正式开始，在这之后每个工作日都会出一道高频面试题，主要涵盖阿里、腾讯、头条、百度、网易等大公司和常见题型。得益于大家热情参与，现在每道题都有很多答案，提…
  65.4w
 
 
            11158
        非优秀程序员
        JavaScript
      
    如何用 CSS 中写出超级美丽的阴影效果
 「这是我参与11月更文挑战的第7天，活动详情查看：2021最后一次更文挑战」。 在我看来，最好的网站和Web应用程序对它们具有切实的"真实"质量。实现这种质量涉及很多因素，但阴影是一个关键因素。 然而
  116.0w
 




    
 
      
    中高级前端大厂面试秘籍，为你保驾护航金三银四，直通大厂(上)
 当下，正面临着近几年来的最严重的互联网寒冬，听得最多的一句话便是：相见于江湖~🤣。缩减HC、裁员不绝于耳，大家都是人心惶惶，年前如此，年后想必肯定又是一场更为惨烈的江湖厮杀。但博主始终相信，寒冬之中，人才更是尤为珍贵。只要有过硬的操作和装备，在逆风局下，同样也能来一波收割翻盘…
  66.8w
 
 
        随风而逝_风逝
        Vue.js
      
    30 道 Vue 面试题，内含详细讲解（涵盖入门到精通，自测 Vue 掌握程度）
 本文以前端面试官的角度出发，对 Vue 框架中一些重要的特性、框架的原理以问题的形式进行整理汇总，意在帮助作者及读者自测下 Vue 掌握的程度。本文章节结构以从易到难进行组织，建议读者按章节顺序进行阅读，当然大佬级别的请随意。希望读者读完本文，有一定的启发思考，也能对自己的 V…
  65.5w
 
 
        掘金翻译计划
      
    作为一名前端工程师，我浪费了时间学习了这些技术
 不要犯我曾经犯过的错误！ 我2015年刚刚开始学习前端开发的时候，我在文档和在线教程上了解到了许多技术，我浪费大量时间去学习这些技术。
  21.9w
 
 
        CUGGZ
      
    「2021」高频前端面试题汇总之JavaScript篇（上）
 2021 高频前端面试题汇总之JavaScript篇，前端面试题汇总系列文章的JavaScript篇，长期更新，欢迎收藏、点赞！
  51.4w
 
 
        程序员老鱼
        掘金·日新计划
        ChatGPT
        OpenAI
      
    ChatGPT保姆级教程，一分钟学会使用ChatGPT！
 最近ChatGPT大火！微软退出首款ChatGPT搜索引擎，阿里等国内巨头也纷纷爆出自家产品，一夜之间，全球最大的科技公司仿佛都回到了自己年轻时的样子！ 然而，ChatGPT这么火，这么好玩的东西，国
  71.8w




    
 
 
      
    2021年我的前端面试准备
 本文1.6W字面试准备包含思路以及基础面试题整理，较适用于初、中级前端，另外文末整理了思维导图，可以更加直观的找到你的知识盲区，希望能给你带去些许帮助，助力你找到心仪的好工作。
  32.0w
 
 
        vortesnail
      
    做了一份前端面试复习计划，保熟～
 前言 以前我在掘金上看到面试贴就直接刷掉的，从不会多看一眼，直到去年 9 月份我开始准备面试时，才发现很多面试经验贴特别有用，看这些帖子（我不敢称之为文章，怕被杠）的过程中对我的复习思维形成影响很大，
  51.1w
 
 
        Redis
      
    《我们一起进大厂》系列- Redis基础
 心里忍不住暗骂，这叫啥问题，大家不都是用的这个嘛，但是你不能说出来。 认真回答道：帅气迷人的面试官您好，因为传统的关系型数据库如Mysql已经不能适用所有的场景了，比如秒杀的库存扣减，APP首页的访问流量高峰等等，都很容易把数据库打崩，所以引入了缓存中间件，目前市面上比较常用的…
  18.0w
 
 
        React.js
        Node.js
        Vue.js
      
    前端面试考点多？看这些文章就够了（2019年6月更新版）
 金三银四跳槽季，offer快到碗里来，前端面试考点众多，而网上各个知识点的博客文章又太多，看的眼花缭乱……所以便整理了一下常见知识点的精华文章，每个知识点的文章控制在3篇以内，尽量覆盖该知识点的下容易被面试到的所有内容，文章都是之前自己读过的，确定是精华干货。文章会一直更新，也…
  25.1w
 
 
        Vue.js
        React.js
      
    你会用ES6，那倒是用啊！
 不是标题党，这是一位leader在一次代码评审会对小组成员发出的“怒吼”，原因是在代码评审中发现很多地方还是采用ES5的写法，也不是说用ES5写法不行，会有BUG，只是造成代码量增多，可读性变差而已。
  39.5w
 
 
        ssh_晨曦时梦见兮
        JavaScript
      
    写给初中级前端的高级进阶指南
 我曾经一度很迷茫，在学了 Vue、React 的实战开发和应用以后，好像遇到了一些瓶颈，不知道该怎样继续深入下去。相信这也是很多一两年经验的前端工程师所遇到共同问题，
  37.5w
 
 
       
   私信