彷徨的马铃薯 · Image操作_bufferedimage ...· 3 月前 · |
精明的手套 · 节省成本 - SQL Server 和 ...· 5 月前 · |
爱旅游的硬币 · 模拟拖拽控件到指定区域_webchrome ...· 9 月前 · |
直爽的开水瓶 · AOSP编译系统演进:从Make到Ninja ...· 10 月前 · |
考研的紫菜汤 · 排查常见错误 - Azure ...· 1 年前 · |
有不少编程初学者会问这样一个问题:我英语不好,还能不能学编程?会不会有影响?
我的回答是:能,会。
能学,是因为虽然编程用的都是英语,但翻来覆去就那么一些关键字,写一阵子就都记住了。中文的学习资料也不少,足够学会。
但肯定会有影响,主要有几点:
看不懂报错
看不懂官方文档,只能看别人翻译的二手货。翻译版本不能准确传达意思不说,很多前沿技术的版本更新速度也比翻译的速度快多了。你看 Django 就从来没有一个中文版本能跟上的。
看不懂 StackOverflow 上的问答
无法使用参与 Github 上的项目
没法好好用 Google(当然这不仅是英语问题)
总结下来就是:可以学,但会吃力,尤其在更进一步提升时会有限制。而如果英语好,则事半功倍。
而英语本身的作用也不仅仅是对编程帮助。多花点时间学英语,哪怕仅仅多背一些单词也是有用的。
于是,为了让编程小白+英语苦手在开始时能有些方向,我们尝试用程序整理了一份Python 高频词汇表,供参考。
关于这份词汇表的说明
内容来源包括《Head First Python》、《Learn Python The Hard Way》、《Python for Data Analysis》等20多本Python书籍,Python 官方文档、pandas、requests、django 等10份文档,Github awesome-python 项目下近400个项目的 readme 说明,以及 stackoverflow 下 Python 及常用库的问答 topics 400+ 回答等资源。通过程序从中采集了词频最高的单词,再加上人工筛选,最终整理出近 2000 个单词。小编推荐一个学Python的学习裙五八八,零九零,九四二,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有很多干货和技术分享
需要指出的是,单词的中文释义我们使用了金山的翻译接口。但某些词汇在计算机和编程领域有特殊的含义,翻译接口未必能够给出,所以会存在一定的问题。对此,我们在自建的网页版工具上提供了“用户自定义解释”的接口,供大家修正和补充解释。如果遇到解释不到位的单词,欢迎各位提交补充。(扇贝上已提交的单词本暂无法修改释义)
程序的实现方法
1. 文档抓取
4 个不同渠道来源,通过 requests + BeautifulSoup 实现。
2. 词频统计
import refrom collections import Counter# 打开文件,读取数据with open(filename, 'r', encoding='utf-8') as f: raw_words = f.read()# 正则匹配所有单词words = re.findall('[a-z]+', raw_words.lower())# 统计单词c = Counter(words)# 提取出前词频前 100 的单词 c.most_common(100)
3. 翻译接口
使用了金山的API。
4. 网站展示
网站基于 django 搭建。数据的导入使用了 peewee 库,直接与 django 的 ORM 对接。
怎么样?欢迎大家留言交流讨论
领取专属 10元无门槛券
私享最新 技术干货
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2024 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287