同样用 Claude 或 GPT,有人让 AI 写了几行代码就卡住了,有人却让 AI 连续工作 6 个小时,交付了一个完整的游戏。 一个极端的案例来自 OpenAI。3 名工程师,五个月,一行代码都没手写,指挥 Codex Agent 写了 100 万行代码,做出了一个真实的产品。有内测用户在用,有 bug 要修,有功能要加。整个开发流程跑通了。 差距在哪?2026 年初,OpenAI 和 Ant ...
最近一个月,我的信息流里同时冒出来一堆不相关的信号,都指向同一个东西。OpenAI 发了篇长文讲怎么用 Agent 写了 100 万行代码。清华大学出了论文做消融实验。Martin Fowler 的网站跟了深度分析。LangChain ...
一个让 AI 从"能跑"到"能扛"的工程体系这不是危言耸听。2026 年初,当 Harness Engineering(驾驭工程)这个概念在硅谷和国内 AI 圈迅速走红时,它背后揭示的是一个残酷的现实:大多数 AI ...
Terraform 创始人写了篇博客。两个月后,整个 AI 圈都在讨论他提出的一个词。 这个词叫「Harness Engineering」。 2 月 5 日,Mitchell Hashimoto 在个人网站发布了一篇文章。标题很普通,「My AI ...
Harness Engineering 的核心理念源于对“电脑鼠”迷宫比赛的深刻理解。 就像电脑鼠需要在复杂环境中寻找最优路径一样, AI Agent 也在复杂的任务环境中探索。 ClaudeCode 的代码,实际上就是 Anthropic 为这只“电脑鼠”构建的完整迷宫。 泄漏的代码主要揭示了几个关键点: ...
在人工智能领域,一场关于系统编排能力的较量正悄然改变技术竞争格局。当行业还在比拼基础模型参数规模时,百度自主研发的算法优化智能体"伐谋"已通过工程化实践证明:真正的技术突破在于如何将模型智力转化为解决实际问题的生产力。这一观点在近期OpenAI主导的MLE-Bench权威评测中得到有力印证——百度伐谋2.0版本以显著优势登顶全球榜单,刷新了机器学习工程领域的最高标准。
第93期iTalk嘉宾是来自清华大学土木建管系的佘丽丽(Ashley Zoel)同学。 The guest for the 93th iTalk seesion is Ashley Zoel, who is from the Department ...
盖世汽车讯 据外媒报道,佛罗里达农工大学-佛罗里达州立大学工程学院(FAMU-FSU College of ...
巴菲特投资的西方石油公司周二宣布,同意以11亿美元的价格收购碳捕获技术供应商Carbon Engineering Ltd.,以帮助其开发一系列碳捕获设施,并希望从应对气候变化中获利。西方石油公司的目标是建造大约100座采用直接空气捕捉(DAC)技术的工厂,这种技术可以将大气中的二氧化碳提取出来,储存在地下,或者用于制造混凝土和航空燃料等产品。(新浪财经) ...
两周前我有幸参加了 NVIDIA 在北京的 CUDA Meetup,其中有一点让我印象深刻:NVIDIA 开发者在 Tilelang 中接入 CuTe DSL 后端时,98% 的代码都是通过 AI Agent 生成的,仅用 3 天就产出了 30 多个 feature 和 bugfix,且整个开发流程几乎都是围绕 Agent Coding ...
AI Agent 最炸新玩法:Harness Engineering,性能直接暴涨!
2026 年还玩 Prompt Engineering?架构师都在卷这两个新东西! #AI工程化 ...