一、来自AI的威胁
2025年2月,Anthropic发布了目前普遍被认为编程能力最强的Claude-sonet-3.7模型,在随后的三月初,Anthropic的首席执行官Dario Amodei在访谈中表示: 短期内,AI会帮助程序员提升生产力,而不是直接取代他们。但从长远看,注意我说的"长远"可能也就是18~24个月,而不是五六年,也许在初级层面的编码工作上会出现"替代"现象,也可能比这更早。
https://news.qq.com/rain/a/20250303A01G7Q00
而就在近期,硅谷的程序员们中开始流行和讨论起氛围编码(Vibe Coding),Vibe Coding是OpenAI 前研究员Andrej Karpathy在2025年2月提出的,其核心是通过自然语言与大型语言模型(LLM)交互,让AI生成代码,开发者则专注于需求描述与创意实现,而非手动编写代码细节。
下面这个看起来还不错的小游戏,就是国外开发者Nicolas Zullo(https://x.com/NicolasZu)利用Cursor + Claude-sonet-3.7等AI编程工具,完全使用AI提示词,未经过人工修改一行代码做出来的,如果你想知道怎么做的,可以参考:https://github.com/EnzeD/vibe-coding。国内也有一些人利用AI编程工具,做了一些像模像样的小系统或者小游戏。
小游戏网页:https://fly.zullo.fun/
是不是感到很不可思议,大模型已经“聪明”到这种地步了?不用一行代码,就能实现这样的一个小游戏?如果你也有此疑问,不妨使用Cursor或者Trae(后文有相关介绍)尝试使用下面的提示词,或者使用类似的描述,试试这些AI编程工具的能力。
|
|
上面是一个类似我们小时候玩的挑木棍游戏的描述,我用它测试一下Cursor是否能够按照描述生成一个网页小游戏。在Cursor的对话框中输入上述的描述信息,点击确认,可以看到Cursor确实能在3分钟之内完成项目的创建和代码的编写,没有人工修改一行代码。
作为一名从事了近20年软件研发及管理工作的IT从业者,相信很多程序员有着跟我一样的复杂情绪。一方面为当前AI技术的快速发展而感到欢欣鼓舞,期望着AI编程成为程序员的好朋友,能够减少程序员的负担。另一方面也在默默地担心它的快速发展会不会夺走程序员手中的饭碗。
AI编程工具最终会成为端掉程序员饭碗的“敌人”,还是会成为跟程序员一起工作的“同事”?AI留给程序员们的时间还有多少?这个答案目前尚未可知,但我想我们有必要先了解它们。如果你是一名研发人员,下面这些AI驱动的研发工具,如果你还没有尝试过,那么你应该了解一下现在AI驱动的软件开发的能力了。
二、AI编程工具
Claude
Claude不是一个IDE,而是美国人工智能公司Anthropic推出的一系列大型语言模型。Anthropic的创始团队由OpenAI的原班创业团队组成,他们曾主导GPT系列产品的早期开发工作。Claude模型具备高级推理、视觉分析、代码生成、多语言处理及多模态处理等先进能力。于2月25日发布的claude-sonet-3.7模型,目前被认为是在编程领域最优秀的模型。
目前claude不针对中国大陆开放,注册起来比较麻烦,需要科学上网,还需要海外手机号。而且即使注册成功,使用过程中也还很容易被官方封号,因此目前不建议直接使用,可以通过后文中所述的Openrouter的方式,或者使用其他的信得过的代理方式进行使用。
Claude的效果不错,但使用成本也相对较高,每输入一百万token需支付3美元,每输出一百万token需支付15美元。因此,在使用Claude之前,应谨慎计算成本,以避免使用费用超出预算。当然,如果Claude能帮助你创造远超投入的产出,那么这笔投资是值得的。
后文所述的字节跳动出品的Trae工具,可以免费使用claude-sonet模型,是体验claude模型的不错方式,但使用过程中有一些限制。
Cursor
Cursor应该来说是目前功能最为强大的AI智能编程工具,它是在 VS Code 的基础上深度定制的代码编辑器,目前支持 gpt-4o、claude–sonet-3.5、claude-sonet-3.7等模型。Cursor具有强大的任务分解、规划、执行能力,从实际使用体验上来说,目前确实是所有同类工具中的佼佼者。利用Cursor强大的Agent能力,程序员可以直接通过输入描述信息,就自动生成相应的工程。
注意Cursor这里有三种模式,Ask是聊天模式,不会对代码进行变更。Edit是编辑模式,适用于简单的修改任务,例如补全注释、生成测试用例等。Agent是智能体模式,适用于比较复杂的任务。Agent模式对于模型有一定要求,一些规划和推理能力不够的模型是无法在Agent模式下使用的。
Cursor提供以下几种订阅模式:
- Hobby计划:免费,包含两周的Pro试用期,每月2000个代码补全等。
- Pro计划:每月20美元,提供无限制的代码补全和高级请求。
- Business计划:每月40美元,提供额外的数据保留等服务。
Github-copilot
GitHub Copilot 是最早出现的AI编程工具之一,于2022年6月正式上线。它源于 GitHub、OpenAI 和 Microsoft 的合作。它利用先进的 AI 技术提供编程辅助,理解你编写代码的上下文环境。github-copilot可以通过VSCode插件使用,安装和使用都比较方便。
Github-copilot在2025年之前国内访问一直不是很顺畅,而且每月要10美元订阅费。但是在2024 年 12 月 18 日,GitHub 官方宣布了GitHub Copilot 将为Visual Studio Code 用户推出免费版本,旨在让更多开发者能够体验到AI辅助编程带来的效率提升,目前在大陆也基本上能够正常访问。
免费版的copilot有一定的限制,每个月代码补全次数不超过2000次,聊天次数不超过50次,基本上只够体验的。如果日常使用,还是花10美元升级到pro版本比较合适,目前其处理复杂任务的能力,相对于cursor要弱一些。
通义灵码等国产助手
国内目前比较好用的AI编程助手,常用的会有下面这些:
出品方 | 名称 | 网址 | VScode插件安装量 |
---|---|---|---|
阿里 | 通义灵码 | https://lingma.aliyun.com/lingma/ | 1,096,624 |
字节 | 豆包 MarsCode | https://www.marscode.cn/home | 629,485 |
百度 | 文心快码(Baidu Comate) | https://comate.baidu.com/zh | 222,397 |
腾讯 | 腾讯云 AI 代码助手 | https://cloud.tencent.com/product/acc | 80,651 |
这些产品的功能大致相同,所依赖的大型模型基本上也都是各自团队自行训练的。就实际使用体验而言,个人认为通义灵码在操作便捷性和实用性方面更胜一筹。通义灵码中的AI程序员,其实就类似cursor中的agent模式。
Cline & Roocode
Cline和Roocode可以简单理解为cursor的开源版本,RooCode(原名Roo Cline)是Cline的一个分支版本。Roo Code 在继承了 Cline 的一些特性的基础上,进行了进一步的功能改进和拓展,他们两者在使用上各有特点。
Cline和Roocode都是免费的VSCode插件,但所使用模型的token需要自行购买。他们都接入了各种模型,也支持OpenAI兼容格式的模型,所以基本上市面上所有的模型都可以使用。另外还可以接入ollama、vLLM等私有部署的模型。因此,使用他们在费用上灵活性更高,如果你只需要处理简单的任务,例如代码自动补全,那么可以接入便宜些的模型使用。
使用cline + claude-sonet-3.7 实现的之前的木棍游戏,基本上能达到跟cursor差不多水平的效果。
Trae
Trae是由字节跳动于2025年3月发布的一款AI编程工具,个人以为,Trae的界面相对于其他的工具更加干净整洁,符合研发人员的使用习惯,Trae目前可以免费使用 Claude-3.7-sonet、Claude-3.5-sonet、deepseek-r1、deepseek-v3等模型,但免费使用的人较多,经常需要排队。
由于Trae发布时间不久,还在不断升级迭代过程中,在一些复杂任务的处理上,感觉还是不如cursor效果好。下面是使用Trae+sonet3.7,采用同样的描述,实现的之前的挑木棍游戏,效果看上去确实差一些。
当然,还有一些其他的AI智能编程工具,例如 windsurf、tabnine 等,而且整个这些工具还在不停地进化过程中,善于利用这些工具,可以在日常的编码中更加轻松。
选用建议
如果你愿意花费20美元来显著减轻重复性工作的负担,那么Cursor无疑是一个值得考虑的优质选择。尽管网络上流传着一些关于Cursor无限续杯的技巧,但并不推荐采纳,毕竟若产品确实物有所值,适当的投资是合理且必要的。此外,对于不需要应对复杂场景的用户来说,Trae也是一个不错的选项。它目前提供免费服务,界面经过精心优化,足以应对大多数常规任务。而对于希望根据实际使用量灵活计费的用户,组合使用Cline或Roocode搭配OpenRouter的方式,同样是一个极具吸引力的解决方案。建议你可以逐一尝试这些工具,以便找到最契合自己使用习惯和具体场景的理想之选。
需要注意的是,尽管AI编程听起来很吸引人,也确实能够快速生成很多代码,看上去是能将开发效率提升200%甚至500%,但目前AI编程工具所拥有的能力,并非如某些人吹嘘的那般无所不能,也绝非如另一些人贬低的一无是处。
以Cursor这样的工具为例,它确实能在短短一分钟内生成相当于普通程序员半天工作量的代码。然而,真正有过代码开发经验的人都知道,修改他人代码往往是一件极其耗时且痛苦的事情,尤其是面对无法进行人类沟通的AI所生成的代码。要将这一分钟生成的代码打磨成符合上线标准的成熟工程,所需投入的工作量可能远超预期。
因此,在使用这些AI工具时,我们必须保持清晰的思路,避免被AI带入迷宫般的困境。特别是在处理生产级别的项目时,建议采取小步快走的策略,仔细审核AI生成的内容,充分利用AI的优势,才能真正实现研发效率的提升。
使用OpenRouter访问模型
在使用Cline、Roocode这类工具的过程中,需要指定模型供应商,而大陆是无法直接访问例如GPT-4o、Claude、Gemini这样的模型的。OpenRouter提供了一个统一的API,使我们可以通过一个接口访问数百个AI模型,同时自动处理回退并选择最具性价比的选项。有了它,就可以在你的代码或者IDE里面中,方便地访问各种各样的模型。
例如,通过下面的设置,就可以在cline中使用claude-sonet-3.7模型。
OpenRouter网址:https://openrouter.ai/models
OpenRouter网站可以在大陆直接访问,而且可以使用支付宝购买token,方法非常简单。结合cline、roocode等工具,可以很好地根据用量来计算费用。另外,OpenRouter还提供了整体访问量的统计,可以通过Ranking菜单栏来观察大家都在使用什么模型。
代码安全
对于个人或开源项目而言,代码安全问题通常无需过多担忧。然而,在企业环境下使用时,研发人员必须深入了解并严格遵守公司内部的信息安全规定。
这是因为在使用过程中,大量代码需传输至服务提供商,尽管所有使用协议均明确承诺这些数据不会被保存且不另作他用,但谁能确保整个传输链路中不会发生意外?特别是在当前中美竞争的复杂背景下,使用Cursor、Claude、GPT、Gemini等工具和模型更需谨慎,尤其是如果涉及一些敏感信息。
因此,对于安全性要求较高的项目,应在确保符合公司安全标准的前提下谨慎使用这些工具。此外,在使用前,务必仔细检查代码中是否含有硬编码的密码、密钥等敏感信息,以防范潜在的信息泄露风险。
二、对于研发过程的重塑
AI编程工具正在逐渐改变研发工作的流程,在有些方面已经产生了明显影响,而另外一些方面也正在或将会产生重大的变化。已经产生比较直接影响的场景包括但不限于辅助编码、注释生成、文档编制以及测试代码的自动生成。辅助编码能够有效提升研发人员的编码效率和代码质量。注释和文档生成工具则帮助研发人员减轻了编写枯燥注释和文档的负担。此外,AI还能够自动生成测试代码,进一步提高测试的效率和覆盖范围,进而提升产品质量。
研发过程的改变使得研发团队也可能将逐渐转变,可能会有越来越多的AI开发者“入职”研发团队。起初,这些AI开发者可能只承担较为简单的任务,但随着技术的逐步成熟,它们将能够胜任更加复杂和高阶的工作。研发人员的角色也将迎来变化,他们可能需要更加专注于理解业务需求、设计系统架构和解决复杂问题,而将日常的、重复性的、缺乏创新性的任务交给AI开发者处理,从而提高工作效率和质量。技术在不断进步,研发人员必须不断学习和适应新技术,以跟上时代的发展步伐。
辅助编码
辅助编码作为AI智能编程工具最早推出的功能,对研发效率的提升具有最为直接的影响。目前,几乎所有主流的AI模型都已具备辅助编码的能力,尽管在生成代码的质量和准确度上仍存在差异。
然而,随着模型能力的持续增强,辅助编码的准确度已达到相当高的水平。尤其在处理常规性、重复性较高的代码任务时,辅助编码的准确度在某些情况下甚至超越了人类程序员的表现。
下面以Trae为例,对于简单的任务,基本上只要描述清楚,工具就能自动修改代码,你所需要做的,就是按下“接受”按钮。
注释类工作
**程序员讨厌写注释,程序员更讨厌的是别人不写注释。**注释作为代码不可或缺的组成部分,对于帮助开发者理解代码逻辑和功能至关重要。然而,撰写高质量的注释不仅耗时,还容易出错。
传统的集成开发环境(IDE)虽然能自动生成注释字段,但对于字段的具体含义却无法提供帮助,仍需程序员手动填写。而且一旦程序变动,很多情况下程序员是懒得再去同步修改注释内容的。相比之下,大型语言模型凭借其对代码上下文的深刻理解,能够自动生成准确且表达清晰的注释,极大地减轻了开发者的工作负担,显著提升了代码的可读性和可维护性。
以下是一个示例,展示了如何利用大模型的优势,为之前未按标准注释的代码完善注释信息。程序员只需对生成的内容进行审核,并在有纰漏之处稍作修正。单就这一场景而言,AI的效率提升远不止人类程序员的10倍。
文档类工作
程序员也很讨厌写文档。然而,文档却是软件开发流程中不可或缺的一环。无论是API文档、设计文档,还是用户手册,乃至代码中的注释,都属于文档范畴。传统的文档编写不仅过程繁琐,还容易遗漏关键信息,尤其在项目进度紧张时,文档的编写和更新往往被忽视。借助AI技术的强大能力,文档的生成与维护得以极大简化。
例如,借助先进的AI工具,可以直接解析项目代码,并自动生成较为详尽的README文档。这对于那些不愿花费时间撰写说明文档的研发人员而言,无疑是一大福音。更进一步,AI技术还能助力生成流程图、类图、协作图等多种辅助文档。
另一个既简单又实用的辅助AI文档类工作的工具,便是诸如aicommit(https://github.com/Nutlope/aicommits)这样的工具。它能够自动概括当前代码修改的变更内容,并生成相应的提交信息。这对于那些不擅长或不喜欢撰写commit信息的研发人员而言,无疑是一大福音,同时也使得代码变更的记录更为清晰明了。可以肯定的是,未来还将涌现更多类似的工具,为我们的研发工作提供更多便利。
测试类工作
测试是确保软件质量的关键环节。然而,编写测试用例往往需要深入理解代码的逻辑和功能,耗时且容易遗漏关键场景。大语言模型通过理解代码的需求,能够自动生成测试用例。这些测试用例不仅覆盖全面、针对性强,还能帮助开发者更全面地验证代码的正确性,从而显著提高软件的质量和稳定性。
利用AI进行部分测试工作,显然是一个极具前景的应用方向。一方面,测试代码的模式相对简单,易于自动化;另一方面,即便生成的测试代码存在些许不准确,也不会对生产业务造成重大影响。
- 自动化单元测试
传统的自动化测试用例生成方式,往往只能生成测试用例的框架,而无法填充具有逻辑的测试代码。如今,结合大语言模型的能力,通过自然语言的描述,可以直接生成具备完整逻辑的测试代码,极大地提升了单元测试的效率和准确性。
- 自动化接口测试
利用大语言模型,可以自动根据测试人员编写的测试用例文件,生成相应的接口测试代码。这不仅减少了手动编写的工作量,还能确保接口测试的全面性和一致性,及时发现潜在的问题。
- 自动化E2E测试
在端到端(E2E)测试中,大语言模型的引入同样带来了革命性的变化。通过解析应用的业务流程和用户场景,AI能够自动生成涵盖多个步骤的E2E测试脚本。这些脚本不仅模拟了真实用户的操作路径,还能覆盖复杂的交互场景,确保应用的完整性和可靠性。此外,AI生成的E2E测试脚本易于维护和更新,能够随着应用功能的迭代而快速调整,进一步提升测试的灵活性和效率。
MCP
在 Anthropic 于 2024 年的 11 月开源了 Model Context Protocol (MCP,模型上下文协议) 这个协议后,MCP 这个词一直是 AI 应用界中讨论度非常高的词。MCP是一个开放标准协议,旨在促进应用程序和语言模型之间上下文的传输。其目标是使LLM能够轻松连接到各种数据源和工具,就像通过一个USB接口将不同的外围设备连接到计算机一样。这简化了生态系统,降低了开发成本,并赋予技术团队自由选择其模型提供商或工具的权利。
MCP协议的核心是一个客户端-服务器架构,其中主机应用程序可以连接到多个服务器:
- MCP Host:如Cursor、VsCode这样的ID或希望通过MCP访问数据的AI工具等程序。
- MCP Client:维护与服务器1:1连接的协议客户端。
- MCP Server:通过标准化的模型上下文协议(Model Context Protocol)暴露特定功能的轻量级程序。
- 本地数据源:位于您计算机上的文件、数据库和服务,MCP服务器可以安全地访问这些资源。
- 远程服务:通过互联网可用的外部系统(例如,通过API),MCP服务器可以连接到这些服务。
例如,假设你今天在使用Cursor这类AI驱动的IDE中完成了代码编写,随后对Cursor下达指令:
“将刚才修改的代码提交到GitLab,并将JIRA-023的状态更新为‘待测试’,同时在企业微信中通知张三尽快进行测试。”
在没有MCP的情况下,这一系列操作是无法实现的。尽管AI Agent具备高度智能,但由于缺乏与外部工具的对接能力,无法完成此类跨系统的任务。因此,开发者不得不手动打开Git工具进行代码提交,再登录JIRA更新任务状态,最后还需通知测试人员启动测试工作,整个过程繁琐且耗时。
然而,有了MCP的支持,这些手动流程均可由AI Agent高效完成。AI Agent通过大模型的能力做好执行规划:当需要提交Git代码时,通过MCP协议指挥GitLab的MCP服务器完成代码提交;接着,指挥JIRA的MCP服务器更新任务状态;最后,指挥企业微信的MCP服务器发送通知消息。这样一来,开发者的工作效率得以显著提升,繁琐的操作步骤得以简化。
要实现上述示例中的功能,需配置三个MCP服务器的相关信息。具体的配置方法以及MCP服务的开发与运行指南,均可轻松在网络资源中找到。
下面链接提供了由官方、第三方组织及社区共同开发的MCP服务器列表,且该列表内容正以较快的速度持续更新。
MCP服务器列表:
https://github.com/modelcontextprotocol/servers
三、如何避免被AI替代
随着AI编程工具的迅猛发展,它们对研发流程的深刻变革和对研发人员的潜在冲击引起了广泛的担忧。为了保持程序员自身的竞争力和工作岗位,唯一能够做的就是不断提升自己的不可替代性。
AI无法替代的研发技能
由于AI在特定编程技巧和深层次认知能力上的不足,目前的AI技术还无法完全取代程序员的复杂工作。在以下这些方面,AI还无法完全达到人类程序员的水平:
A. 问题解决和系统设计能力
在理解和分析复杂的业务需求方面,程序员需要具备将抽象的业务概念转化为具体技术解决方案的能力。这不仅包括为系统设计出可伸缩、高可用性、高性能的架构,还需要在关键的设计环节做出明智的决策。这种能力要求程序员具备深厚的理论基础和丰富的实践经验,能够从全局角度审视问题,确保系统的长期稳定运行。
B. 以人为中心的技巧
软件开发是一个涉及多方面协作的过程,远不止于单纯的代码编写。程序员需要掌握项目管理、业务沟通和团队合作等以人为中心的软技能。具体来说,这包括但不限于:有效沟通需求、协调团队成员工作、合理规划项目进度以及展现领导力。这些技能有助于提升团队的整体效能,确保项目按时保质完成。
C. 领域专业知识
对特定业务领域的深入理解是程序员的核心竞争力之一。这意味着不仅要掌握相关行业的专业知识,还要具备在特定情况下解决问题的能力。通过对行业特定知识的整合,程序员能够更好地把握业务发展方向,为技术决策提供有力支撑。
D. 代码质量和维护
AI生成的代码即便能够完成特定功能,但还是需要程序员去维护和调整,避免其变成“屎山”代码。此外,能够调试复杂系统、理解并优化遗留代码也是不可或缺的技能。这些能力有助于延长软件的生命周期,降低后期维护成本,提升系统的整体性能。
E. 创新和创造力
在面对特定技术难题时,程序员需要展现出创新思维,找到独到的解决方案。同时,要善于识别技术改进的机会,创造性地应对各种技术挑战。这种创新和创造力是推动技术进步的关键因素,也是AI难以模仿的人类特质。
F. 批判性思维和决策
在复杂多变的技术环境中,程序员需要具备批判性思维能力,能够对各种信息和方案进行独立分析和评估。在此基础上,做出明智的决策,确保项目的顺利进行。这种能力依赖于个人的经验积累和对环境的深刻理解,是AI目前难以实现的领域。
以上这些技能之所以仍然具有极高的价值,是因为它们融合了人类的判断力、丰富经验和对复杂环境的敏锐洞察力——这些恰恰是当前人工智能技术所无法有效复制和替代的。因此,程序员应不断强化这些方面的能力,以保持自身的竞争优势。
怎样避免被AI取代
人工智能在工作中并非万能的,但你需要自我赋能,站在一个不可替代的位置上。学习上述人工智能无法取代的技能是其中的重要部分。此外,你可以将人工智能视为一种工具,而不是威胁。专注于培养强大的需求收集和问题解决能力。学习在工作流程中有效地使用人工智能技术,并专注于需要人类判断和创造力的高级编程任务。具体的做法包括:
A. 持续学习
在技术日新月异的今天,保持学习的热情和动力是保持竞争力的基础。你需要不断跟进最新的技术动态,增强自身的专业能力。通过持续学习,你不仅能提升自身的技能水平,还能推动创新,在当今动态变化的技术格局中保持领先地位。
B. 成为某个复杂领域的专家
选择一个自己感兴趣且具有挑战性的专业领域,深耕细作,努力成为该领域的专家。这意味着你需要精进新兴技术,精通系统架构设计,掌握高级算法和复杂问题的解决方法。通过在特定领域的深度积累,你将能够在解决复杂问题时脱颖而出,赢得该行业的竞争优势,成为不可或缺的人才。
C. 发展软技能
除了技术能力,软技能同样不可或缺。提升你的沟通能力,确保能够清晰、有效地与团队成员和客户交流;增强项目管理能力,学会合理规划资源、控制进度和应对风险;培养团队领导技能,激发团队成员的潜力,带领团队高效协作。这些软技能将帮助你在任何专业环境中取得成功,提升整体工作效能。
D. 拥抱AI,善于使用AI
最后,积极拥抱AI技术,善于将其作为提升工作效率的工具。深入理解AI的局限性和能力,培养在人工智能辅助工作流程中的专业知识。掌握如何有效地与AI交互,优化生产力。通过熟练运用AI工具,你不仅能在各个领域解锁创新解决方案,还能在AI时代保持自身的独特价值。
四、未来会怎样
未来究竟会怎样很难预测,但可以肯定的是AI会继续改变软件研发的面貌。我们唯有不断地保持学习,跟上技术发展的脚步,增强自己的业务和技术能力,才能在激烈的变革中保持竞争力。以个人浅薄的观察和理解,我认为大模型还会继续朝着更快、更智能、更便宜的方向发展。
大语言模型会变得更智能、更快: 大模型技术不断升级迭代,相比于去年,肉眼可见地变得更加智能了,未来应该还会向着更加智能的方向发展。大家都在翘首以待Claude4、deepseek-r2、OpenAI等更加智能的模型出现。另外,一些技术是否能够让推理侧变得更快、成本更低,也是很多技术团队努力的方向。
Groq: Groq公司成立于2016年,由曾帮助发明谷歌张量处理单元(TPU)的乔纳森·罗斯(Jonathan Ross)和道格拉斯·怀特曼(Douglas Wightman)创立。 Groq 的使命是通过其创新的芯片技术加速生成式 AI 模型的运行。2024年上线的基于LPU(Language Process Unit)的groq (https://groq.com/ )能够将推理速度提升10倍,下面的视频展示了groq运行的deepseek-r1-distill-llama-70的输出速度。
Mercury Coder: 2025年2月,Inception Labs 推出的首个扩散型大语言模型(dLLM),是 Mercury 系列中专门用在代码生成的模型。Mercury Coder基于“从粗到细”的生成方式,突破传统自回归模型的顺序生成限制,速度可达每秒1000个token以上,比现有优化型模型快5-10倍。下面是使用Mercury Coder生成前面“捡棍子”游戏的效果,速度确实令人惊叹。
Mercury Coder: https://chat.inceptionlabs.ai/
然而,这些技术路线能否走通并实现商业闭环,还有待时间的考验。Groq的LPU一方面成本太高,无法部署大参数量的模型,另一方面灵活性比较差。而dLLM是不是花架子目前也尚无定论。
大语言模型会变得更平民化: Deepseek的横空出世,让模型的使用和部署成本变得更低,也使得之前一些不可能的事情,有机会变成现实。无论是个人玩家还是企业用户,使用大模型的热情又变得高涨起来。
在个人部署方面,ktransformer、SGLang、llama.cpp、ollama、vLLm等多种部署方案,可以让个人爱好者在显存不足的情况下,利用有限的GPU和CPU及内存运行起参数量较大的模型。虽然每秒几个或十几个token的速度,无法用作生产,但它使得原本遥不可及的事情变成了可能。也许某天会有神奇的技术突破,能够让拥有足够智能的大模型运行在个人电脑。又或者,我们在个人端,真的有必要运行大参数得模型吗?我们需要的是一款能满足需求的小参数模型,然后在能力不足的时候,结合大参数模型协同处理任务。
在企业端,私有化部署场景需求一定是存在的,毕竟有些代码和机密文件,统统交给别人总归是不放心的。目前私有部署的成本也已经不再是遥不可及,基于国产显卡的多种部署方案,虽然性能上还达不到英伟达的水平,但相对于英伟达高昂的价格,其性价比还是有优势的。然而是否能够达到部署成本与收益之间的平衡点,是否真有必要采用私有化部署的方案,是企业需要去思考的。
目前已经有超过20家厂商与DeepSeek展开合作,包括华为昇腾、沐曦、燧原、摩尔线程、海光信息、壁仞科技、昆仑芯(百度)等等,也陆续推出了一些成本可控的部署方案。
-
联想与沐曦DeepSeek一体机上市首月发货量突破千台,配近万张国产GPU。https://finance.sina.com.cn/stock/bxjj/2025-03-07/doc-inenuuym7043754.shtml
-
2025年2月20日,经过vLLM社区与昇腾的持续合作和共同努力,vLLM开源社区已官方支持昇腾,并创建vLLM Ascend这一社区维护的官方项目。这意味着用户可直接在昇腾上无缝运行vLLM,开发者可通过vLLM调用昇腾进行模型适配。 https://vllm-ascend.readthedocs.io/en/latest/quick_start.html
我觉得颇为有趣的是,目前在淘宝上推出了一款基于华为昇腾技术方案的香橙派AI Studio。如果这款设备能够流畅运行能带来显著业务价值的模型,那么它或许将预示着未来AI程序员的全新工作形态。想象一下,购置一台放在身边,让它如同得力助手般协助修改代码,这样的场景确实令人充满期待和遐想。
关于大模型的应用,经过过去一两年的发展,很多企业已经掌握了RAG知识检索、聊天客服等基础大模型应用。利用智能体开发更高级应用的动作,也在如火如荼地进行着。然而无论是横空出世的 manus(https://manus.im/),或者是flowith(https://doc.flowith.io/cn)及其他一些产品,虽然看上去不错,但都还远没有达到人们预期中的效果,还有很大的进步空间,值得期待。
技术的演进永不停歇,短期内程序员的职业地位尚不至于被AI所取代,然而,若不能紧跟AI发展的步伐,我们终将被时代的洪流所吞噬。毕竟,身处这一行业,顺应并遵循行业发展的规律是不可或缺的生存法则。
参考资料
Will AI Replace Programmers and Software Engineers? | Coursera
Will AI Replace Programmers? Debunking the Myth