添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

武林至尊,宝刀屠龙。号令天下,莫敢不从。倚天不出,谁与争锋!

作为开发人员吃饭的家伙,一款好的开发工具对开发人员的帮助是无法估量的。还记得在学校读书的时候,当时流行CS架构的RAD,Delphi和VisualBasic大行其道。就因为Delphi开发快,即使原来没学过Pascal(当时都是学C、C++),对Pascal也谈不上喜爱,还是用了Delphi开发学校的人事系统、国际交流与合作处的信息管理系统等。后面又碰到香港同行用Visual Basic开发的PC同步软件,又跟着学了一波Visual Basic。

后面J2EE大势浩浩荡荡,又经历了JBuilder(可惜了,Borland)、Eclipse、Intellij Idea、Visual Code等IDE的变迁。

然后是去年ChatGPT的发布,开启了生成式AI的浪潮,面向对象编程开始进入“注释驱动编程“、”面向注释编程” 😁
在这里插入图片描述

根据2023年JetBrains的全球开发者生态调研[1],84%的开发者表示他们在工作中正在积极使用生成式AI工具。60%的受访者认为,AI辅助编程工具将从根本上改变软件开发就业市场,但只有13%的人相信人工智能将完全代替开发人员编写代码。大约三分之一的开发者认为软件开发中大多数编程将会变成快速工程。开发者认为人工智能将成为帮助他们编写代码的有效辅助工具,而不是完全取代他们。

不管人工智能是否能取代开发人员,都建议你现在开始接触AI辅助编程工具。我推荐你从尝试GitHub Copilot和Cursor开始。要怎么样才能用好这些辅助工具?刚注册Cursor的时候,我收到一封来自Cursor的email,里面这句话让我印象深刻:
As you get started, keep in mind that programming with AI is a new style of coding. It requires rethinking what you spend time on and what you offload to the computer.

在你开始编程时,请记住,使用人工智能编程是一种新的编码风格。 它需要你重新思考在什么上花时间以及你将什么工作交给计算机来处理。

GitHub Copilot

GitHub Copilot可以说是先行者,但是要等到Copilot Chat上线,产品才算完整。GitHub Copilot目前是收费的,每个月10美元。新用户可以免费试用一个月。

虽然GitHub Copilot声称已经升级为GPT-4模型(we’ve upgraded your Copilot Chat experience, bringing more accurate code suggestions and explanations with OpenAI’s GPT-4 model.),但是用起来感觉还不是,可能还没有全部升级完成?

GitHub Copilot最强大的就是面向注释编程,顺畅的时候真是“心有灵犀一点通”,写代码是如虎添翼、快如闪电;但是不顺的时候,说不出的拧巴,感觉就真的是你正专心开车的时候,突然副驾驶要抢你的方向盘 🥵 运用之妙,存乎一心。用得好是神兵利器,用得不好就是卧龙凤雏了。

看下面的例子(response_str是LangChain调用GPT-4返回的,死活不肯返回纯粹的json格式,只好自己处理),Copilot给我提示……

碰到这种情况,补充注释就好:
# 检测response_str,如果是markdown格式的块:以```json开头,以```结尾,就转换为纯粹的json格式,因为json.loads只能处理纯粹的json格式

Gopilot会给出新的方案:

if response_str.startswith("```json") and response_str.endswith("```"):

response_str = response_str[7:-3]

Cursor

Cursor刚推出时完全免费,而且用的还是GPT-4,一鸣惊人,后来估计GPT-4太贵了,变成了有限免费:每月可以使用50条GPT-4请求和200条GPT-3.5请求。不过它每个月收费20美元,有点贵,建议自己开通微软的Azure的GPT-4服务,那样按用量付费,怎么也用不了20美元。没有用过GPT4的时候,觉得GPT-3.5也不错,可是用了GPT4,就再也回不去了。曾经沧海难为水。

设置使用Azure API

点开Cursor Setting的Advanced,就可以用Azure的API按量付费。
在这里插入图片描述

Cursor常用的快捷键是Ctrl+K(生成代码、修改代码)、Ctrl+L(跳到CHAT界面),以至于有人笑称以前的码农是CV大法走天下,新一代码农是KL在手,天下我有。

我们来实战看一下Ctrl+K生成代码,以抓取LangChain的文档( https://python.langchain.com/docs/get_started )为例。

按Ctrl+K,输入:
https://python.langchain.com/ 作为baseUrl,baseUrl+/docs/get_started 作为起点,抓取文档,对于每一个文档,进行html解析,继续抓取class为"pagination-nav__link–next"的链接,直至抓取最后一个文档。所有抓取的文档保存到本地的docs目录下。对于每一个链接,要判断是否已经抓取过了。

第一版运行出错:

File “f:\Ivan\study\get-langchain-docs\get_langchain_docs.py”, line 15, in save_document

file.write(response.text)
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\U0001f99c’ in position 252: illegal multibyte sequence
选中出错信息,按Ctrl+Shift+L,问:要改编码吧?
Cursor给出了解决方法:

with open(os.path.join(folder, filename), 'w') as file:
        file.write(response.text)
with open(os.path.join(folder, filename), 'w', encoding='utf-8') as file:
        file.write(response.text)

再次运行,发现文件名不对,给文件名加上扩展名:filename += “.html”

还发现有这种url,结尾多了/:https://python.langchain.com/docs/expression_language/how_to/

Ctrl+K输入:如果full_url以/结尾,则去掉尾部的/ ,自动生成代码(这种实际上自己输入更快,不熟悉Python的话可以让Cursor生成):

if full_url.endswith('/'):
            full_url = full_url[:-1]

最终得到了这样的源码:

# 以 https://python.langchain.com/ 作为baseUrl,baseUrl+/docs/get_started 作为起点,抓取文档,对于每一个文档,进行html解析,继续抓取class为"pagination-nav__link--next"的链接,直至抓取最后一个文档。所有抓取的文档保存到本地的docs目录下。对于每一个链接,要判断是否已经抓取过了。
import os
import time
import requests
from bs4 import BeautifulSoup
def save_document(url, folder='docs'):
    if not os.path.exists(folder):
        os.makedirs(folder)
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    # 修改文档中的CSS路径
    for link in soup.find_all('link', href=True):
        if link['href'].startswith('/assets/css/'):
            link['href'] = '.' + link['href']
    filename = url.split('/')[-1] or 'index.html'
    filename += ".html"
    with open(os.path.join(folder, filename), 'w', encoding='utf-8') as file:
        file.write(str(soup))
    return soup
def get_next_link(soup):
    link_tag = soup.find(class_="pagination-nav__link--next")
    if link_tag and 'href' in link_tag.attrs:
        return link_tag['href']
    return None
def crawl_docs(start_url, base_url='https://python.langchain.com'):
    visited = set()
    next_url = start_url
    while next_url:
        full_url = base_url + next_url
        if full_url.endswith('/'):
            full_url = full_url[:-1]
        if full_url not in visited:
            print('visiting', full_url)
            visited.add(full_url)
            soup = save_document(full_url)
            time.sleep(3)
            next_url = get_next_link(soup)
        else:
            break
if __name__ == '__main__':
    start_path = '/docs/get_started'
    crawl_docs(start_path)

还不错,是吧?

注:上面只是用来演示如何使用Cursor,如果经常要抓取某些网站的文档来投喂大模型,可以考虑专门的开源项目,如gpt-crawler:https://github.com/BuilderIO/gpt-crawler 说到这个,不得不提Java的开源项目,如Spring Boot,一般都会提供单独的pdf文件,要投喂大模型太方便了。

另外,Cursor可以提问除了与编程无关的问题,可以当作chatgpt的GPT4版本来用。这对于苦于无法开通chatgpt plus会员的用户来说,可以当作暂时的解决方法。虽然不能用多模态,但还是具备高质量的对话能力,很多时候也够用了。

如你可以在Cursor里面提问“胃反酸是怎么回事?”,它会回答:

胃反酸,也被称为胃酸倒流或胃食道反流病(GERD),是指胃中的酸性内容物反流到食道中。这是由于食道下部的肌肉环(称为食道括约肌)不能正常关闭,导致胃酸逆流到食道。

胃反酸的常见症状包括心烧(胸骨后部的烧灼感)、喉咙痛、口腔有酸味、咳嗽、声音嘶哑、感觉有东西卡在喉咙中等。

胃反酸可能由多种因素引起,包括饮食习惯、生活方式、怀孕、肥胖、某些药物和疾病等。如果你经常感到胃反酸,应该寻求医生的帮助,因为长期的胃酸倒流可能导致食道炎、食道溃疡甚至食道癌。

GitHub Copilot只会傲娇地告诉你:作为一个AI编程助手,我专注于软件开发主题。对于医疗健康相关的问题,建议你咨询医疗专业人士或者使用专门的医疗咨询服务。

不管是GitHub Copilot还是Cursor,请善用他们的CHAT界面,和他们聊关于编程的问题。这个绝对是诲人不倦的好老师,对于学习一门新的编程语言,也特别方便。

AI编程助手已经可以帮我们完成很多琐碎、重复的工作,那么在接下来的AI大潮中,程序员要如何提升自己:

  1. 提升自己的沟通能力

AI只会越来越强,但是你不能很好的表达自己的想法,AI也帮不了你。建议多写学习笔记、博客等,不要在意有多少访问量,多表达就好。

  1. 提升自己的判断力

暂时AI只能辅助你,最终还是你来做决策,还是要熟悉自己的领域,知道哪些是好的,哪些是不好的。

  1. 提升自己的审美能力

程序员写的是代码,最终出来的是产品,产品都是要给人用的。拥有更好的审美能力有助于做出更好的产品、有灵魂的产品。

除了GitHub Copilot和Cursor,还有不少的竞品,可能会差一点,也不会差太多。

  • CodeWhisperer

亚马逊信奉长期主义,它的CodeWhisperer(https://aws.amazon.com/cn/codewhisperer/)一直默默发展,面向个人用户提供无限制的代码智能生成服务。

  • Codeium

Codeium(https://codeium.com/)是由初创公司研发的一款对标Github Copilot的代码智能生成插件,支持主流的各种编程语言,同样面向个人用户免费使用。

Codeium Chat目前也打算支持GPT-4,正在进行beta测试:https://codeium.com/waitlist/gpt-4?referrer=extension

  • CodeGeeX

CodeGeeX(https://github.com/THUDM/CodeGeeX2)除了免费,还是开源的。除了常规的根据上下文和提示生成代码的功能以外,CodeGeeX还具有代码跨语言翻译功能。

前不久国内技术社区CSDN的中国开发者生态——AI辅助编程的相关调研中,受访者认为国产代码生成工具中,CodeGeeX的采用率较为领先。

阿里巴巴的通义灵码(https://tongyi.aliyun.com/lingma)刚推出不久,目前看来也不错,期待能更好。

这么多编程助手,你选哪一个?或者说小孩子才做选择,成年人全都要? 😍 我目前代码生成、代码修改、Chat以Cursor为主,代码自动完成以GitHub Copilot辅助,其他编程助手密切关注。

2024年,会否有更强大的开发者AI工具胜出?让你能发出“噫!微斯人,吾谁与归?”

  1. 2023年JetBrains的全球开发者生态调研:https://www.jetbrains.com/lp/devecosystem-2023/
在2019年,Codota 推出了 Tabnine,到了2021年,OpenAI 推出了 Codex,GitHub 推出了 Copilot,AWS 推出了 CodeWhisperer,它们都是基于深度学习的辅助编程工具。这些工具的推出标志着辅助编程工具进入了一个互卷的时代,为开发人员提供了更强大、智能化的编程支持。 本文介绍Github Copilot、CodeWhisperer和Cursor 以下是一些使用 AI 编程插件的好处:自动代码补全错误检测和纠正代码优化和重构文档和注释生成。
去年11月份申请了 Github Copilot 的内测,今天终于收到了邀请。玩了一下午,整体感受是很惊喜的,迫不及待地想写一篇使用体验。 Github Copilot 是 OpenAI 和 Github 联合推出的 AI 编程工具,能根据用户输入的部分代码或注释自动生成完整代码。Python学习资料点击免费领取 Warm-up 我上手之后敲下的第一行代码是def gcd():,不出所料,Copilot 果然帮我完成了求最大公约数的函数,而且根据我输入的不同,也会联想不同的...
GitHub CopilotGitHub Copilot Chat是两个不同的插件,它们有以下区别: 1. GitHub CopilotGitHub Copilot是一个基于人工智能的代码自动补全工具,由OpenAI和GitHub合作开发。它可以根据上下文和代码语法,为开发者提供实时的代码建议和自动补全功能。GitHub Copilot可以在各种编程语言和开发环境中使用,帮助开发者更高效地编写代码。 2. GitHub Copilot Chat:GitHub Copilot Chat是一个基于GitHub Copilot的聊天助手插件。它可以与开发者进行对话,并提供代码建议、解答问题等功能。GitHub Copilot Chat可以通过与开发者的交互,帮助他们更好地理解和解决编程问题。 总结来说,GitHub Copilot是一个代码自动补全工具,而GitHub Copilot Chat是一个与开发者进行对话的聊天助手插件。两者都旨在提高开发效率和代码质量,但功能和用途略有不同。
CSDN-Ada助手: 恭喜您写了第16篇博客!标题中的“使用LangSmith来快速学习LangChain”引起了我的兴趣。通过您的分享,我了解到了LangSmith这个工具的存在,并且对LangChain的学习也更加感兴趣了。您的博客内容对于初学者来说一定非常有帮助。 不过,我想提出一个谦虚的建议。在您的下一篇博客中,或许可以详细介绍一下LangSmith的具体使用方法,以及它在学习LangChain过程中的优势。这样能够让读者更好地理解和掌握LangSmith的使用,进而更加高效地学习LangChain。再次恭喜您,期待您的下一篇博客! 倚天屠龙:Github Copilot vs Cursor CSDN-Ada助手: 恭喜作者发布了第15篇博客!看了你的标题,我非常期待这篇关于Github Copilot和Cursor的比较分析。希望你可以继续保持创作的热情,不断探索新的主题和观点。也许下一篇可以考虑深入探讨这两个工具的应用场景和优缺点,或者分享一些实际的案例和经验教训。期待你的下一篇作品! 倚天屠龙:Github Copilot vs Cursor fireshort: 代码生成是Cursor中按Ctrl+K输入一段需求,按回车后生成一段代码;或者是GitHub Copilot中输入一段注释,不断的提示代码,一直按Tab接受。 自动完成是不输入注释,你输入一些字母,GitHub Copilot自动提示你要输入的内容,类似于在IDE中输入方法名的一部分,自动提示方法名。