首个软件工程师亮相,程序员真要失业了

一觉醒来,程序员怕是真要失业了。

首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。

在SWE-bench基准测试中,它无需人类帮助,可解决13.86%的问题。

相比之下,GPT-4只能处理1.74%的问题,且都需要人类提示告知处理哪些文件。

可以说,它远远超过了此前所有AI大模型。

从零构建网站、自主查找并修复Bug、甚至是训练和微调自己的AI模型通通都不在话下~也可为一些成熟的代码库做贡献。

比如用ControlNet,生成带有隐藏文字的图像,Devin就是一点就通~

据介绍,它已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。

而这背后的公司Cognition,虽然是初创公司,但小而精悍。

在招人信息中明晃晃写着:我们有10个IOI(国际信息学奥林匹克竞赛)金牌得主。

让同行们直呼:哦莫,疯了吧~

目前Devin尚未公测,不过已经有少部分人拿到了资格,开始实测了一波……

首个AI软件工程师亮相

Devin被介绍为世界首个完全自主的AI软件工程师。

它在长程推理和规划上面下了很大功夫,可以规划和执行需要数千个决策才能完成的复杂软件工程任务。

既然是一个端到端AI,软件开发人员常用的工具,比如shell、代码编辑器和浏览器等等,Devin也都配备(沙盒计算环境中),主打一个全方位服务。

最终的Devin,让人类只需要发号施令,其他什么也不用做。

具体来看,其主要能力有以下六个:

1. 端到端构建和部署程序

比如,当我们需要设计一个网页游戏时,Devin不仅能生成网页,还能直接完成服务端的部署,然后直接发布上线,省去了中间的人工操作。

只需要告诉Devin,我们想做一个个人网站,里面运行一个Devin定制版的生命游戏。

然后Devin表示自己会先搭建网站的基本架构,并询问有没有更具体的需求。

在明确要求之后,Devin给出了这样一份任务清单:

创建React应用,安装UI模块等

用React和UI模组搭建前端环境

部署服务器并确保其在私有IP下运行

在React中部署并验证游戏的功能和资源是否正确配置

接着,Devin就会按照自己设计的这个清单开始编写代码,然后部署服务……

△Devin部署后端服务器的过程

最终完成全部工作之后,一个即点即玩的游戏链接就呈现在了我们面前。

2. 自主查找并修复bug

不仅能一气呵成完成开发部署,Devin的debug能力也是一流。

开发者给Devin一个GitHub链接,让它先熟悉项目情况,然后一会儿要准备数据进行测试。

接着,Devin就会按部就班地编写测试用的程序并准备好有关数据,然后运行。

结果,在开发者已经发布的完整项目之中,Devin还真的找到了连开发者自己都没有发现的漏洞。

发现漏洞之后,Devin会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。

最终经过调试,程序的bug被成功修复,完美通过了测试。

3. 训练和微调自己的AI模型

除了这些一般的程序或项目,作为一个全能型AI助手,Devin还有能力帮助人类训练和微调其他AI。

对于一些常见的模型(比如示例中的Llama),用户只需要在promot中提及模型的名称,Devin就直接知道要训练哪个模型。

而在这个示例中,微调的具体方法(QLoRA)是以GitHub链接的形式输入给Devin的。

接到指令后,Devin还是像处理平常的程序一样边规划边执行,所需环境和依赖,还有模型本体,都会自动下载安装。

这些准备都完成之后,微调工作就会有条不紊地进行,而且其中的状态可以实时监控。

4. 修复开源库

Devin的能力不仅在于开发者自己本身的项目,开源社区里的,它也能hold住。

比如我们只需要把GitHub项目的issue链接丢给Devin,它就能立即完成所需的所有配置,并自动收集上下文信息,然后开始解决问题。

当然,开源项目的功能请求(feature request)也没问题,和修问题的流程一样,自己搞好配置,收集上下文,然后就开始编码。

5. 成熟的生产库也能作贡献

还没完,业已成熟的生产库,Devin也能给咱秀一把。

官方介绍,sympy Python代数系统中有一个对数计算的错误,就被Devin顺利解决:

配置环境、重现bug,自行编码并修复、测试,再次一气呵成。

△就是这个库

6. 不熟的技术,现学现卖

最后,遇到自己不会的技能,Devin可以直接现学,并迅速付诸应用。

Hi Devin!我在这个博客文章中(附网址)发现,可以生成带有隐藏文本的图像。文中提到了一个脚本,你能配置好它,然后为我真的生成一些图片吗?

Ps. 就是利用ControlNet来做这件事。

有了详细的行动方案后,它立刻就在数分钟内进行代码编写和调试。

同样的,在这里遇到bug也不用惊慌,Devin同样有能力直接进行修复。

完成工具的搭建后,Devin也没有劳烦人类自行配置使用,而是一气呵成,最终生成了咱们要的带隐藏文字的图像:

可以说表现相当令人惊艳。

而在具体测试中,Devin取得的成绩同样亮眼。

在评估Devin的表现时,团队没有使用常见的HumanEval,而是用了更具挑战性的SWE-bench。

这个数据集是由GitHub中的实际问题组成的,Devin不借助任何辅助,就取得了13.86%的最高解决率。

而同样在无辅助的条件下,GPT-4的问题解决率为零,此前的最佳水平是1.96%,加入辅助也才4.8%。

公司人均一块IOI金牌

如此炸天的新成果,背后却是一家名不见经传的初创公司。

但这种“名不见经传”背后,实际是一个10人员工的编程天才团队,IOI金牌就有10块……人均一块。

Devin背后公司名为Cognition AI,总部设在纽约和旧金山,定位是一家专注于推理的应用AI实验室。

此前这家公司一直秘密工作,于两个月前正式注册成立。

目前该团队规模仅有10人,但共揽获了10枚IOI金牌,创始成员均曾在Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等从事AI前沿工作。

据悉,Cognition AI由Scott Wu、Steven Hao、WaldenYan创立。

联合创始人兼CEO Scott Wu,根据我们目前搜到的资料,Scott Wu曾就读于哈佛大学,曾是Lunchclub的联合创始人兼CTO。

曾连续三年揽获IOI金牌:

联合创始人兼CTO Steven Hao,毕业于MIT计算机专业,之前曾在Scale AI、Jane Street、DE Shaw、Quora工作。

也曾是IOI金牌得主:

联合创始人兼CPO Walden,曾于哈佛大学攻读计算机科学和经济学相关专业,还曾从事MIT PRIMES密码学和机器学习方向的计算机科学研究,还是沃顿商学院高中投资大赛北美地区决赛入围者。

2020年第32届IOI金牌得主:

据X推文的转发顺藤摸瓜,还有一位创始成员被扒了出来。

Neal Wu,同样有哈佛大学教育经历,曾在tryramp、GoogleBrain工作过。

整个团队的长期目标,意在通过解决推理问题,在广泛的学科领域解锁新的可能性,而“代码仅仅是开始”。

不过对于Devin,目前他们尚未透露是如何实现这一壮举的,包括到底是使用自己的专有模型还是第三方模型。

此外,Cognition AI目前已获得硅谷投资大佬彼得·蒂尔的Founders Fund基金领投的2100万美元A轮融资。

众所周知,彼得蒂尔以挖掘这种极具突破性的创新项目著称,而且哈佛背景的创业者更是和他渊源紧密。

上一个他早期投资中类似背景,最知名的是扎克伯格和Facebook。

“自动化软件工程与自动驾驶类似”

Devin一亮相,让不少工程师大惊失色:软件工程师……要失业了???

不过也有人依然乐观:终于有AI让我们从繁重的编程任务中解脱出来。

前特斯拉AI总监卡帕西倒是给了一颗定心丸。

自动化软件工程,目前看起来与自动化驾驶类似。

具体体现在发展进程上:首先人类手动编写代码,然后 GitHub Copilot 自动完成几行,再之后ChatGPT 编写代码块,现在就是Devin的出现。

接下来,他认为自动化软件工程会演变成为协调开发人员需要串联的许多工具一起编写代码:终端、浏览器、代码编辑器等。以及人类负责监督,逐渐转向更高级别工作。

自动化软件也类似,先低代码,然后零代码,最后完全不需要人写代码。

Perplexity AI CEO给出了个高度的肯定:这应该是任何Agent的第一个演示。

它似乎跨越了人类水平的门槛并且可靠地工作。它还告诉我们通过结合 LLM 和树搜索算法可以实现什么

德扑AI之父、前FAIR(Meta)研究科学家、现已加入OpenAI的Noam Brown转发开麦:

THE END
0.AI时代还想笑出声来,请记住这三分钟全球的培训机构正在将最好的人工智能和神经科学带入企业学习和技能发展。硅谷的Socos Labs等众多新创公司使用AI算法和科学学习原理提供自适应学习体验。5G时代企业可以使用虚拟现实和增强现实来模拟培训中的实际情况,员工根据他们看到的信息做出决策,然后实时收到反馈,以发展新的核心技能。 jvzq<84yyy4489iqe0ipo8hqpvkov87412>3286317;68;;87a716=::93990|mvon
1.对话RockFlow创始人Vakee:杀死一切App,从股神少女到AI赌徒|蓝驰Vakee:我做RockFlow的愿景从第一天开始就是「让投资更简单」。过去2年,我们用了很多方法去实现这个理念,比如把app做得极致简单。但我发现这还不够。 到了2025年,我相信新一代年轻用户、尤其大家都是AI时代的原住民,完全可以通过自然语言去下单和交易。你只要开口,Bobby就能迅速实现对你想法的意图拆解、策略生成jvzq<84hkpgoen3ukpg/exr0ep5uglm1tqrm1;547/66/;=1fqi.kwjz{hki2<>:9::/uqyon
2.李诞又双叒要“失业”?下一个“脱口秀大王”可能会是AI|甲子台下哄堂大笑,机器人接了一句,“这你能不恨吗?” 尽管这个段子还不够精妙绝伦,但以机器人的身份逗人类发笑,已经是真实发生的事情了。 它们是怎么学会讲笑话的?有幽默感的机器人有什么实用性吗?脱口秀大赛的下一个“大王”,会不会是个机器人?《时代周刊》2022年1月刊详细讨论了这些问题,「甲子光年」编译团队jvzq<84m0uooc7hqo0io1jwvkerfa>8:3:?16B=a366d;;6e427:294744ivvq
3.当强人工智能时代来临,哪些人不会失业?不知你这几天看了几篇? 今天是充电的第4天 导读:科技进步经常伴随着技术性失业这一风险,但也因此促进经济增长。最近,关于AI是否会导致失业的讨论非常之多。同之前的技术一样,AI也很有可能带来失业。 AI导致的技术性失业是否会成为长期的、大面积的问题?此前的技术性失业只不过是暂时的、局部性的问题。但我们不jvzquC41dnuh0lxfp0tfv8y2Ro9I>H3z1gsvrhng1jfvjnnu1>3;=693;
4.人工智能从业者看“技术性失业”所以,真正受到影响的不是“职业”,而是“日常任务的构成”。AI 不会完全取代人类,而是让人类的工作变得更加依赖技术。 4. AI 时代,我们该如何应对 面对AI 带来的冲击,普通人可以如何调整自己,以确保自己不会被“技术性失业”影响? 4.1 学会与 AI 协作 与其担心被 AI 取代,不如学会利用 AI 提高自己的生产力 jvzquC41dnuh0lxfp0tfv8vsa6743==:41gsvrhng1jfvjnnu1757B7:99;
5.谁最容易被AI替代?清华大学教授刘嘉:初级白领最危险我曾在 2023 年年初提过,未来 95% 的教师会因大模型而失业,这个观点当时备受质疑。如今来看,教师、律师、程序员、会计、设计等知识密集型行业,都在经历不同程度的冲击。 我们现在的处境,正像极了当年的纺织工。第一次工业革命解放了 " 身体 ",AI 时代则正在解放 " 技能 "。过去学绘画、编程要花五到十年,如jvzq<84yyy4n{ƒfmgt4dqv4ctvodnn48:993h>::g;l1;<<936=1f@h
6.四亿岗位将被AI替代?这份“生存计划”请查收四亿岗位将被AI替代?这份“生存计划”请查收 缓解迷茫与焦虑,帮助你掌控不确定时代的生存策略,成为不惧怕未来的人。 20 世纪 60 年代的经典动画片《杰森一家》(The Jetsons)讲述了一家人的故事,展示了我们通常认为的人类会被机器取代的方式,而这家人就生活在机器人遍布世界的未来。在动画片中,乔治·杰森(George jvzquC4158qs0lto1r532A6888>8::72;8>
7.AI时代,不会学习的人,正在被悄悄淘汰这意味着,未来不是“谁知道得多”,而是**“谁能学得快、转得灵、连得广”。** 💼 三、AI时代的职场:从“技能导向”到“学习力导向” AI不会让所有人失业,但它会让不会学习的人失业。 普华永道(PwC):2037年英国30%的岗位将被自动化取代。 jvzquC41dnuh0lxfp0tfv8z235879?=91cxuklqg1fkucrqu13;3:;>667
8.被人工智能逼退的打工人们,何去何从?今日生活刘刚说,在转型升级中,又产生了很多新的行业,这是非常有意思的现象。经过摩擦性失业后,可能每个人都需要一个重新学习的过程。 即便AI取代人还为时过早,但打工人该如何未雨绸缪? 陈华钧说,机会总是留给有准备的人,每个行业都应该逐步学习适应通用人工智能时代的到来,不用去担心和惧怕它,因为学习使用AI的难度根本就不大,人工智能可以jvzquC41ltyi0qfpi|npw7hqo0io1ltpvgtu1;546/641:91eqtugwya:9623:;0jvsm
9.AI时代下你必需具备的3个软技能,你具备了哪个?(软技能)书评2023年,随着AI兴起,很多人都在担心,自己的工作会不会被AI替代?自己离失业还有多远? 其实AI能代替我们的都是“程式化”的工作,而像那些需要人为判断、决策、沟通交流,以及稍微复杂点的工作,怎么可能比我们更有优势? 而这些判断技能、决策技能、沟通交流技能,都属于软技能,也是能让我们获得更多升职、加薪的必备技能。jvzquC41dqul0mtwdct/exr1tg|jg€4374;28:<1