下载app免费领取会员

(图源:网络)

(图源:Cursor中文网站) 不过Cursor在创立之初并不是做AI Coding Editor的,而是研发CAD+AI。 联合创始人Aman Sanger提到:“如果能训练一个Transformer模型,让它不仅能预测代码的下一个token,还能预测CAD操作的下一个步骤,那就能做出一个真正实用、能极大加速机械工程设计流程的产品。这其实就是我们从创业开始一直到Instill(另一个初创项目)时期,甚至Instill之后一小段时间里都在专注做的事情。” Aman说道:“在CAD这个方向上,我们进行了一些构思,而且当时我们对其他很多领域的竞争都非常担忧(当然,现在做的东西这种担忧已经小多了)。AI辅助编程领域竞争激烈,但CAD Automation看起来没什么人关注,技术上至少在当时看来是可行的,而且市场规模仔细研究下来也相当可观。所以,这既是一个非常有趣的技术难题,从市场分析角度看也像是个好主意。” 而后来,随着不断深入实践,Cursor团队逐渐发现了所面临的问题: "第一,你能获取的CAD数据量远少于代码。如果你以为像Codex那样有500亿或1000亿token就足够了,那么也许用10倍少的数据(比如100亿token)也能训练出个有用的模型。但现实是,如今的Copilot背后很可能是数万亿token的代码和文本数据。而我们当时竭尽全力所能爬取到的所有CAD数据,最多也就100亿 token。这根本不足以训练出一个有用的模型。我们尝试扩大规模,但无论用什么正则化技术,模型参数规模一旦超过几十亿,就会严重过拟合。这是个大问题。" "其二,缺乏迁移能力。即使你用今天的模型(比如 GPT-4)来测试——我有个喜欢用的提示词(prompt),可以用来区分背后是3.5还是4,但有时连GPT-4 都会搞错。当你逐渐增加描述的复杂度时,3.5很快就不行了,复杂度再高一点,4也跟不上了。这清楚地表明,这些模型在空间推理能力上并不强,而这恰恰是CAD所需要的核心能力。" 对于CAD+AI,Aman这样说:“我现在看法是,要做成这件事,最好的方法或许是彻底重新设计整个系统。另一个巨大的痛点是我们曾尝试为所有主流的CAD软件(如SolidWorks、Onshape等)开发插件。如果你觉得为一些老旧的IDE构建插件已经很困难了,那你真应该看看这些CAD软件(的接口和生态)。所以我觉得,即使你有了一个好模型,要想真正推广开来并做出一个能稳定工作的好插件,可能也非常非常困难。随着文生图(text-to-image)技术的进步,以及一些新公司开始做文生3D(text-to-3D),我感觉更合理的途径其实是彻底抛弃当前人们做CAD的方式。我推测未来会有公司(或几家公司)把这个方向做得非常好。” 虽然Cursor放弃了CAD+AI,不过目前还是有很多公司,院校与创业团队在不断尝试。诚然现在的CAD+AI还比较初级,简单的零件设计,简单的信息提示等等。如何真正作为强大的智能工具,还有待进一步发展,毕竟CAD是个严肃的生产工具。
以上内容来自微信公众号:BIMcoer梁老师,更多信息可以关注公众号
本文版权归腿腿教学网及原创作者所有,未经授权,谢绝转载。
推荐专题