完善主体资料,免费赠送VIP会员!
* 主体类型
* 企业名称
* 信用代码
* 所在行业
* 企业规模
* 所在职位
* 姓名
* 所在行业
* 学历
* 工作性质
请先选择行业
您还可以选择以下福利:
行业福利,领完即止!

下载app免费领取会员

NULL

ad.jpg

设计的未来:AI + CAD路径的群雄逐鹿与范式重构

发布于:2025-11-25 12:12:22

网友投稿

更多

引言:CAD与AI的交汇点——一场计算机辅助设计的范式革命

    在工业设计与工程制造领域,计算机辅助设计(CAD)软件长期以来都是创新的基石。它将工程师的二维构思转化为精确的三维模型,驱动着从汽车、航空航天到建筑、消费电子等一切实体产品的诞生。然而,CAD软件的复杂性、操作的繁琐性以及对人类经验的高度依赖,使其成为数字化转型中亟待突破的瓶颈。随着人工智能(AI)技术的飞速发展,特别是大型语言模型(LLM)和深度学习在多模态领域的突破,CAD与AI的结合已成为几何世界最激动人心的前沿阵地。

    这场“AI+CAD”的革命,其核心在于如何让AI真正“理解”几何、拓扑和设计意图,从而实现从辅助设计(CAD)到自主设计(Generative Design)的跨越。当前,业界正处于一个技术路线图百花齐放的探索期,不同的参与者基于自身的技术积累和对几何本质的理解,选择了截然不同的路径。

一、技术路线图的四大流派:AI + CAD的多元探索

    对AI + CAD路径的探索,可以概括为四大主要流派,它们分别从用户界面、核心数据、几何表示和领域模型等不同维度切入,试图解决CAD的“AI可理解性”难题。

1. 交互层面的自动化:UI Agent/Copilot流派(以MIT VideoCAD和Adam为代表)

    这一流派的核心思想是:既然AI难以直接理解复杂的CAD底层数据,不如让AI像人类一样,通过观察和学习用户界面(UI)操作来掌握CAD软件的使用。 这种方法将CAD建模过程视为一个人机交互的序列任务,而非纯粹的几何计算。

1.1 MIT VideoCAD:从视频中学习CAD操作

    麻省理工学院(MIT)推出的 VideoCAD 项目,正是这一思路的典型代表。它通过创建包含超过41000个3D模型构建示例的VideoCAD数据集,让AI模型学习人类在CAD软件中的具体点击、鼠标拖拽及键盘操作序列

   image.png     

    核心机制: VideoCAD训练了一个AI UI智能体,能够将高级设计命令(如“Pline”、“Extend”)转化为一系列的UI交互序列,从而直接控制CAD软件实现从2D草图到3D模型的生成。这种方法巧妙地绕开了直接处理CAD内核数据(如BRep)的难度,实现了对CAD软件的黑箱操作

优势与挑战的深入分析:

优势:

    •快速落地与低门槛: 无需深入修改CAD底层架构,通过模拟用户行为即可实现功能,开发周期短,易于集成到现有软件。

    •通用性强: 理论上可应用于任何具有图形界面的CAD软件,跨平台和跨软件的兼容性高。

    •用户体验直观: AI Copilot能以人类熟悉的交互方式提供帮助,用户接受度高。

挑战:

    •鲁棒性与泛化能力:鲁棒性是最大的问题。CAD软件的UI一旦发生变化,AI模型可能需要重新训练。此外,AI学习的是操作序列,而非几何原理,在面对全新的、未曾见过的设计任务时,泛化能力受限。

    •精度与可靠性: 这种间接操作方式在处理高度复杂的、需要精确几何约束的场景时,其可靠性和精度可能不如直接操作内核的方案。例如,一个微小的鼠标定位偏差可能导致几何约束失败。

1.2 Adam:从Text-to-CAD到工作流Copilot

    初创公司 Adam 的发展路径则体现了Copilot流派从简单功能到深度集成的演进。Adam从“Text-to-CAD”起步,但很快意识到“纯文本提示是一种过于粗糙的工具,无法使可靠的几何图形成为易于理解的对话”。因此,Adam将产品升级为 CAD AI Copilot,并选择以插件形式深度集成到主流CAD软件(如PTC Onshape)中。

   image.png

    核心机制: Adam的Copilot模式旨在驻留在工作流程中,通过理解用户的自然语言描述,结合CAD软件的API和FeatureScript语言,直接编辑参数化特征树。它不仅是操作的自动化,更是对设计意图、拓扑、公差和设计约束的理解和执行。这种模式是LLM与CAD API(即MCP)结合的典型应用,将LLM的语义理解能力与CAD的精确执行能力相结合。

    流派总结: UI Agent/Copilot流派将AI定位为工程师的“副驾驶”,通过自动化UI操作和理解设计意图来提高效率。它代表了当前CAD+AI商业化最快、最容易被用户接受的路径。然而,其天花板受限于CAD软件API的开放程度和LLM对复杂几何语义的理解深度。

2. 核心数据层面的突破:硬刚BRep流派(以HOOPS AI为代表)

    边界表示(BRep)是现代CAD软件的核心几何表示方法,其精确性和复杂性是AI难以直接处理的“硬骨头”。HOOPS AI 代表了直接挑战这一核心难题的流派

2.1 HOOPS AI:专注于几何、拓扑和多模态CAD数据

    Tech Soft 3D推出的 HOOPS AI,是一个专门为解锁CAD数据的AI和机器学习而构建的框架。Tech Soft 3D作为CAD数据访问库的领先提供商,拥有处理海量CAD数据的独特优势。

image.png

    核心机制: HOOPS AI不基于通用大型语言模型(LLM),而是专注于为3D几何、拓扑和多模态CAD数据量身定制的ML和深度学习技术 。它的目标是为数据科学家提供一个框架,使其能够从原始CAD数据(如STEP或自有CAD格式)的几何/拓扑本源出发,进行编码、训练和推理 。这被认为是真正的CAD大模型应该采取的路径,即从几何/拓扑的底层逻辑上实现AI的突破。

优势与挑战的深入分析:

优势:

    •数据本源与精确性: 直接从CAD数据的几何和拓扑层面入手,确保AI对模型的理解是精确且深入的。这是实现工业级自动化和高精度制造的必要条件。

    •解决核心难题: 旨在解决BRep模型生成自动化及装配过程自动化等CAD领域的核心技术难题,具有极高的技术价值。

挑战:

    •数据获取与格式封闭:数据获取与格式封闭是最大障碍。BRep数据结构复杂,且各CAD厂商格式封闭,难以统一训练。HOOPS AI虽然拥有数据访问优势,但如何将海量、异构的BRep数据转化为统一、可训练的AI模型输入,是巨大的挑战。

    •技术门槛极高: 训练一个能够理解和生成精确BRep模型的AI,其技术难度和数据量需求远超通用LLM。它需要对微分几何、拓扑学和深度学习有深刻的交叉理解。

3. 几何表示的颠覆:隐式建模流派(以GCL“Geometry as Code”为代表)

    这一流派认为,BRep本身就是AI难以理解的根源,因此需要彻底改变几何的表示方式,使其天然地对AI友好。前SpaceClaim创始人Blake Courter提出的 “Geometry as Code”(几何即代码) 理念,正是这一流派的旗帜

3.1 GCL与“几何即代码”:将几何转化为函数

    Blake Courter认为,传统CAD(BRep)的复杂性在于其边界表示技术形成了难以学习的庞大参数空间。他倡导的隐式建模(Implicit Modeling)则提供了一种全新的视角:

    隐式模型本质上是将空间任意点映射为带符号值的函数,通过数值表征形体包容性与距离。GCL为此类函数开发生成建模库与编译器...这种架构使任何用户(包括AI)都能彻底"理解"CAD模型,从而实现更具语义的知识化编辑

image.png

    核心机制: 在隐式建模中,几何模型不再是边界的集合,而是一个函数或一段代码。这种表示方式使得几何数据天然地具备了语义化和可编程性,极大地降低了AI理解和编辑模型的难度。几何数据由此成为“开源代码”,AI可以直接在语义层面上进行操作。

优势与挑战的深入分析:

优势:

    •AI原生友好: 几何模型是函数,易于AI进行推理、优化和编辑,特别适合生成式设计、拓扑优化和复杂晶格结构等应用。

    •语义化编辑: 实现“更具语义的知识化编辑”,AI可以基于函数逻辑进行修改,而非基于边界拓扑。

挑战:

    •精确性与兼容性:精确性与兼容性是隐式建模最大的瓶颈。隐式建模在处理传统工程中的精确尺寸、公差和复杂的装配关系时,仍面临着与主流BRep生态兼容和转换的挑战。在需要高精度工程图纸的制造领域,其应用仍需时间验证。

    •数据转换与生态构建: 如何将现有的海量BRep数据高效、无损地转化为隐式模型,以及如何构建一个围绕隐式建模的完整工程生态(如FEA、CAM等),是长期挑战。

4. 领域专用的基础模型:非LLM基础模型流派(以Autodesk Neural CAD为代表)

    通用LLM在文本领域的成功,让许多人期待“CAD大模型”的出现。然而,CAD领域面临着数据资产收集困难、3D数据格式封闭等挑战,导致基于Transformer的CAD大模型难以达到通用LLM的训练体量Autodesk Neural CAD 的推出,标志着行业巨头开始探索领域专用、非LLM的基础模型路径

4.1 Autodesk Neural CAD:重构CAD几何引擎

    Autodesk推出的 Neural CAD,是一种新型3D生成式AI基础模型,应用于其Fusion和Forma产品线。Autodesk明确表示,Neural CAD模型将“完全重构创建CAD几何形状的传统软件引擎”,并旨在“自动化80%到90%的设计师常规事项” 

image.png

    核心机制: Neural CAD不基于通用LLM,而是根据专业设计数据(几何、组件、建筑模式等)进行训练,使其能够在详细的几何级别和系统/工业过程级别进行推理 。Autodesk利用其庞大的客户数据和合成数据,训练出针对不同领域的细分模型,如“Geometry Neural CAD”(用于Fusion)和“Buildings Neural CAD”(用于Forma)

优势与挑战的深入分析:

优势:

实用主义与数据优势:实用主义的典范。利用行业巨头的数据优势,构建垂直领域的AI模型,避免了底层几何表示的颠覆,专注于在现有工作流中实现高价值的自动化和生成式设计功能。

细分领域深度: 通过细分模型(Geometry/Buildings),可以针对特定行业的设计模式进行深度学习,实现高度专业化的自动化。

挑战:

数据隐私与定制化: 模型的成功高度依赖于Autodesk的专有数据。虽然Autodesk表示未来客户可以根据其专有数据和流程调整模型,但数据隐私和模型定制的成本和复杂度仍是需要关注的问题。

模型黑箱问题: 作为一种基础模型,其内部推理过程对于用户而言仍是黑箱,这在需要严格验证和可解释性的工程领域可能引发信任问题。


二、四大流派的技术对比与核心差异

    下表对上述四大CAD+AI技术流派进行了详细的对比分析,以清晰地展现它们在核心技术、几何理解和应用目标上的差异。

技术流派

代表产品/公司

核心技术路径

几何理解方式

优势

挑战

UI Agent/Copilot

MIT VideoCAD, Adam

学习人类UI操作序列/LLM+API

间接理解(通过操作序列)

快速落地,通用性强,提升用户体验

鲁棒性差,难以处理高精度几何约束

硬刚

BRep

HOOPS AI (Tech Soft 3D)

专用的ML/DL框架,处理几何/拓扑数据

直接理解(从数据本源)

彻底解决CAD核心难题,精确性高

数据获取难,格式封闭,技术门槛极高

隐式

建模

GCL (Geometry as Code)

隐式几何表示(函数/代码)

颠覆性理解(几何即代码)

AI原生友好,易于生成式设计和语义化编辑

兼容性差,高精度工程应用仍需验证

领域专用基础模型

Autodesk Neural CAD

3D生成式AI基础模型(非LLM)

深度理解(从专业设计模式中学习)

实用性强,高度自动化,数据优势明显

高度依赖专有数据,数据隐私与定制化成本


三、AI + CAD路径的深层思考:几何的本质与AI的边界

    AI + CAD的探索,不仅仅是技术层面的竞争,更是对“几何的本质”以及“AI在设计中的边界”的哲学思考。

3.1 几何的“可编程性”与“可理解性”

传统BRep模型虽然精确,但其数据结构是为计算机图形学和几何内核运算设计的,对于AI而言,它是一个难以逆向工程的“黑箱”。AI很难从一堆面、边、顶点的定义中,直接推导出设计者的“意图”和“特征”。

    •LLM+API/MCP路径:这是最保守的路径,它将CAD视为一个工具,AI通过文本指令调用其API(MCP),本质上是将设计意图转化为代码脚本。它依赖于CAD软件本身的参数化能力,AI只是一个高效的“脚本编写者” 

    •VideoCAD路径:它将CAD视为一个UI,AI通过学习操作序列,本质上是将设计意图转化为UI操作序列。它解决了LLM无法直接操作软件的问题 

    •Geometry as Code路径:这是最激进的路径,它认为几何本身就应该是“代码”或“函数”,天然具备可编程性和可理解性。这种表示方式使得AI可以直接在几何的语义层面上进行操作,而非停留在UI或API层面。

3.2 AI的边界:Copilot vs. Autonomous Agent

当前所有的探索,都指向了两种终极形态:

    1.AI Copilot(副驾驶):以Adam和VideoCAD为代表,AI作为工程师的辅助工具,自动化繁琐任务,提供设计建议,但最终决策权仍在于人类。这是目前最快实现商业价值的路径 

    2.Autonomous Agent(自主智能体):以HOOPS AI和Neural CAD为代表,目标是实现80%到90%的设计师常规事项自动化,甚至完全自主地生成符合工程要求、可制造性(DFM)和设计意图的几何模型。这需要AI对几何、拓扑、物理约束和设计模式有深层次的理解

    Autodesk的Neural CAD试图通过领域专用基础模型,在Copilot和Agent之间找到一个平衡点,即通过自动化高比例的常规工作,将工程师的精力解放出来,专注于更具创造性的工作 

3.3 数据与模型的挑战:CAD大模型的困境

    通用LLM的成功建立在海量的、相对标准化的文本数据之上。CAD大模型面临的挑战是:

    数据稀疏性与封闭性: 高质量的3D设计数据是企业的核心资产,难以大规模获取。同时,各型3D数据格式封闭,难以统一训练

    •几何的精确性要求: 文本生成允许模糊和错误,但CAD模型必须是精确的,任何微小的几何错误都可能导致制造失败。这使得基于LLM的生成路径(如Text-to-CAD)在生成可靠几何图形时显得“过于粗糙”

    HOOPS AI和Neural CAD正是为了应对这些挑战而诞生的。它们放弃了通用LLM的路径,转而专注于领域专用的ML/DL技术,利用专业数据进行训练,以确保几何的精确性和工程的可靠性 


四、未来展望:多路径融合与几何的“AI原生”时代

    AI + CAD的未来,很可能不是某一条路径的独大,而是多条路径的融合与互补。

4.1 路径融合:从UI到内核的协同作战

未来的CAD+AI生态将是一个多层级的智能系统:

    •顶层:

    用户意图捕获与交互(Copilot层)LLM和UI Agent(如Adam Copilot和VideoCAD的UI智能体)将作为用户意图的翻译官和操作的执行器。它们负责将人类的自然语言、草图或手势转化为精确的几何指令,极大地降低用户与CAD软件的交互门槛。

    •中层:

    领域知识与设计模式(基础模型层)Autodesk Neural CAD等领域专用基础模型将利用其对海量设计数据的学习,提供高效的生成式设计、布局优化和模式识别能力。它们将是实现“80%自动化”的关键。

    •底层:

    几何内核与精确计算(Agent层)HOOPS AI和GCL的隐式建模内核将作为几何智能体的底层支撑。它们负责处理最复杂的几何拓扑运算、确保模型的精确性,并实现对BRep或隐式几何的深度理解和编辑。

4.2 行业影响:AEC与制造领域的差异化渗透

    AI + CAD的渗透并非齐头并进,不同行业将展现出差异化的路径:

    •建筑、工程与施工(AEC)领域: 以Autodesk Forma和Buildings Neural CAD为代表,AI将首先在概念设计、布局优化和系统集成等宏观层面发挥巨大作用 。由于建筑设计对绝对几何精度的要求相对低于机械制造,且设计模式化程度高,领域专用基础模型将快速普及,实现从概念到初步设计的快速迭代。

    机械制造(Manufacturing)领域: 对几何精确性、公差和可制造性有极高要求。因此,硬刚BRep的HOOPS AI和专注于参数化特征编辑的Adam Copilot将成为主流。隐式建模(GCL)则可能在增材制造(3D打印)拓扑优化等对几何自由度要求高的细分领域率先实现突破。

4.3 几何的“AI原生”时代

    最终,CAD软件将不再是AI的“工具”,而是AI的“环境”。未来的CAD系统将具备以下特征:

    1.语义化特征树: AI能够理解特征树中的每一个操作背后的设计意图,实现真正的“知识化编辑” 

    2.多模态输入: 用户可以通过文本、语音、草图甚至手势来与CAD Copilot交互,AI将自动完成从意图理解到几何生成的全过程

    3.内建的工程智能: AI将内置DFM(面向制造的设计)、公差分析、物理仿真等工程知识,确保生成的设计是可制造、可装配、高性能的

    这场AI + CAD的革命,正在重塑设计师的工作方式,将他们从繁琐的几何操作中解放出来,专注于更高层次的创造性问题解决。无论是硬刚BRep的HOOPS AI,颠覆几何表示的GCL,还是务实落地的Autodesk Neural CAD和Adam Copilot,它们共同推动着计算机辅助设计迈向一个全新的“AI原生”时代。

本文版权归腿腿教学网及原创作者所有,未经授权,谢绝转载。

未标题-1.jpg

上一篇:第二届东风汽车创意设计大赛圆满落幕,AI智绘未来出行新篇章

下一篇:智能建造,重塑建筑产业生态(二)