在科技日新月异的今天,GPT的问世无疑为各行各业带来了一场深刻的变革,而软件工程领域更是首当其冲,正式迈入了软件工程3.0的新纪元。2024年,作为软件工程3.0的元年,伴随着软件工程3.0宣言的震撼发布,一个全新的软件范式——ML-DevOps(更精确地表述为LLM-DevOps:大模型驱动开发与运维)悄然崛起,引领着软件工程的新一轮革新。
回顾软件工程的发展历程,我们可以清晰地看到其演进的三个阶段:
-
软件工程1.0时代(1968年):这是软件工程的诞生之年,以瀑布模型为标志,强调结构化、规范化和工程化。在这个时代,软件开发被视为一项严谨而系统的工程,为后续的发展奠定了坚实的基础。
-
软件工程2.0时代(2001年):随着敏捷宣言的发布,敏捷和DevOps的风潮席卷全球,实现了持续构建、持续集成和持续交付。这个时代注重快速响应变化、团队协作和自动化流程,极大地提升了软件开发的效率和质量。
-
软件工程3.0时代(2024年):如今,我们迎来了软件工程3.0的新时代。随着机器学习,特别是大模型驱动的LLM-DevOps成为新的核心驱动力,软件工程正经历着前所未有的变革。LLM-DevOps不仅优化了软件开发流程,还提升了软件质量和可维护性,为软件工程的未来发展指明了方向。
一、Agent在软件工程中的广泛应用
在AI技术的推动下,Agent正逐渐成为软件工程中不可或缺的得力助手。从SE(软件工程)视角深入分析LLM-based agents的应用,我们可以进一步探讨其在各个软件开发和维护活动中的具体作用和影响。
1.1 需求工程:精准捕捉用户需求
1.1.1 理论基础
需求工程(RE)是软件开发生命周期中的一个关键阶段。它初始化了软件开发过程,并涉及几个关键活动:
-
诱发(需求收集):这个步骤包括从各种利益相关者那里收集新的需求。技术可能包括访谈、调查和研讨会来捕捉用户的需求和期望。
-
建模:在这个阶段,使用抽象且可解释的模型来表示需求。常见的建模语言包括统一建模语言(UML)和实体-关系-属性(ERA)模型。
-
协商(需求规格):需求被详细描述并以正式格式记录。这份文档作为开发人员和利益相关者清晰且无歧义的参考。
-
验证:需求和模型被验证以确保它们准确反映了利益相关者的意图。这一步确保所有需求都是完整、一致和正确的。
-
演变:随着利益相关者需求的变化,需求也在不断演变。这个持续的过程涉及到更新需求,以符合新的业务目标或技术进步。
LM-based Agents能够深入理解用户需求,并将其转化为具体、可实施的开发任务。它们通过自然语言处理技术,分析用户意图,识别出关键信息和需求点。同时,它们还能根据历史数据和经验,提供智能化的需求分析和建议,帮助开发团队更加准确地把握用户需求。
1.1.2 实例场景
在一个在线教育平台的开发项目中,产品经理描述了一个关于“实现个性化推荐功能”的需求。LLM-based Agent能够分析这一需求,并自动生成详细的功能需求文档,包括用户画像构建、推荐算法选择、界面设计等关键要素。同时,它还能识别出潜在的用户需求,如多场景推荐、实时更新等,为开发团队提供更全面的指导。
1.1.3 当前应用(目前还在可研阶段没到软件工程)
MARE,是一个覆盖多个需求工程阶段的多智能体框架,包括收集、建模、验证和规范。在收集阶段,一组利益相关者智能体表达他们的需求,然后由收集者智能体将其组织成草案。随后,建模者智能体识别草案中的实体和关系,并构建需求模型;在验证阶段,检查者智能体根据其标准评估当前需求草案的质量,并将其移交给文档编写者智能体,该智能体将编写需求规范或报告错误。所有这些智能体都配备了预定义的操作,并可以在共享工作区内通信,从而实现中间信息的无缝交换。
1.2 软件设计:AI辅助的创新探索
在设计方面,尽管AI的应用相对较少,但它仍然可以辅助设计,甚至利用机器学习的洞察力探索复杂设计问题的新解决方案。
1.2.1 设计生成与探索
AI技术能够增强产品开发实践,从概念到设计验证全程指导设计人员。例如,Altair DesignAI等工具能够成倍提高工程团队的生产力,探索更广泛的客户满意的高性能、有意义且能实施的新产品设计替代方案。同时,Design Explorer等AI驱动的设计工具能够加强协作、加速设计迭代并推动产品创新。
1.2.2 优化设计
从设计微调到设计合成,AI能够利用各种信息探索和创造新理念,确定折衷方案并为决策提供支持。例如,Synopsys DSO.ai的强化学习引擎能够在优化过程中进行智能学习并缩小设计空间,有效优化数万亿的设计方案,实现更好的结果、加快结果转化速度并降低计算成本。
1.3 代码生成:AI技术的自动化编程新篇章
1.3.1理论基础
随着人工智能发展,代码生成被广泛探索。大型语言模型(LLMs)经大量文本数据预训练,在依给定代码上下文或自然语言描述生成代码时有良好效果,但存在如幻觉等问题,促使研究人员构建基于 LLM 的智能体,通过规划和迭代优化增强其能力, 下图展示了相关扩展情况
从Codex到Github Copilot,代码生成技术不断迭代升级。Codex模型包括非监督学习的Codex、监督训练的Codex-S以及通过代码生成代码文本描述的Codex-D。而Github Copilot则基于Codex模型训练,成为面向开发者的代码补全产品,迅速提升了代码生成技术的能力。
为了扩展LLMs的代码生成能力,研究人员采用了多种规划方法,如思维链(CoT)策略、动态规划策略、不同规划步骤的表示形式以及多路径规划策略等。同时,智能体还可以根据环境反馈多次迭代优化已生成的代码,包括模型反馈、工具反馈、人类反馈以及混合反馈等。
1.3.2实例场景
对于专业开发人员而言,代码生成工具能够提高其开发效率,从简单重复的劳动中解放出来,专注于架构、设计等复杂任务。而对于代码钻研者、寻求代码相关解答的开发者而言,这些工具则能够支持其快速创建小的、即时使用的任务型应用程序,如函数计算程序等。
1.3.3当前应用
当前,代码生成工具在软件开发领域的应用已经变得十分广泛。无论是国外的GitHub Copilot、Tabnine,还是国内的通义灵码、CodeGeeX、MarsCode、文心快码等工具,都展现出了强大的实力。这些工具通过分析大量的代码库和编程规范,能够自动生成高质量的代码片段,甚至完整的函数和类,从而极大地提高了开发者的生产效率。
在代码生成方面,AI技术已经得到了广泛的应用。其中,Codex作为这一领域的鼻祖,为后续的代码生成工具奠定了坚实的基础。而GitHub Copilot更是将代码生成技术推向了一个新的高度,使得更多的开发者能够享受到这一技术带来的便利。尽管GitHub Copilot在技术领域备受推崇,但我们也应该看到,国内的通义灵码等工具同样表现出色,并且提供了免费的服务。
因此,在选择代码生成工具时,我们不必局限于某一个特定的品牌或产品。相反,我们应该根据自己的实际需求和偏好进行选择,将更多的精力投入到如何更好地应用这些工具上。无论是GitHub Copilot还是国内的通义灵码等工具,它们都是为了提高开发者的生产效率而存在的。我们应该充分利用这些工具的优势,将它们应用到实际的软件开发过程中,从而创造出更加优质、高效的代码。
1.4 静态代码检查:AI智能守护代码质量与安全
1.4.1 理论基础
在静态代码检查领域,基于大型语言模型(LLM)的智能体(agents)展现了强大的分析能力,能够深入洞察代码中的潜在问题,包括语法错误、安全漏洞以及性能瓶颈等。通过集成静态程序分析工具,这些智能体不仅能提供详尽的错误报告,还能为开发者提供针对性的修复建议,从而加速问题的修正过程。
此外,LLM-based agents还具备学习和适应团队编码规范的能力。它们能够自动检测代码是否符合团队的编码标准,确保代码的一致性和可维护性。
1静态漏洞检测
尽管LLMs通过微调或特定提示能够识别代码中的潜在质量问题,但由于代码问题的复杂性和长代码上下文的挑战,独立LLMs在静态代码检查中的准确性和召回率仍受到限制。为了提升性能,可以采用多智能体系统来增强LLMs在漏洞或脆弱性检测方面的能力。这些智能体可以协同工作,共同分析代码,从而提高检测的准确性和效率。如下图
2代码评审
传统的代码评审通常被视为二分类或序列到序列生成问题,通过微调或提示深度学习模型来解决。然而,基于LLM的智能体则通过模拟真实的同行评审过程,实现了更加智能化的代码评审。例如,CodeAgent构建了一个包含多个智能体的团队,每个智能体都专注于特定的代码评审任务,如代码质量评估、漏洞报告、代码异味检测和代码优化等。这些智能体在相关的GitHub数据上进行训练,并在多个基于人工智能的项目上进行评估,证明了多智能体系统在代码评审任务中的巨大潜力。
1.4.2 实例场景
在一个大型金融应用系统的开发过程中,LLM-based Agent通过其静态代码检查功能成功识别出了一个潜在的内存泄漏问题。该智能体深入分析了代码中的内存分配和释放情况,发现了一处未正确释放内存的代码段,并立即为开发者提供了修复建议。这一及时的发现不仅避免了潜在的性能问题,还降低了安全风险,确保了系统的稳定性和可靠性。
1.4.3当前应用
目前,静态代码分析工具如SonarQube、Checkstyle等已经能够与LLM-based Agents相结合,实现更加智能化的代码审查。这些工具能够自动检测出代码中的错误和潜在问题,并提供详细的修复建议和代码重构建议。
1.5 软件测试:大型语言模型引领的高效验证之路
1.5.1 理论基础
大型语言模型(LLMs)在软件测试中的应用,特别是在单元测试和系统测试方面,已经取得了显著的成果。这些模型具备强大的自然语言处理和理解能力,能够学习并捕捉语言中的深层次语义和上下文信息,从而生成高质量的测试用例和测试脚本。
-
单元测试:单元测试是对软件中的最小可测试单元进行检查的过程,通常涉及对方法或类的测试。LLMs能够自动生成具有良好可读性和可用性的单元测试用例,这些测试用例能够覆盖多种可能的输入和输出情况,从而确保代码的正确性和稳定性。然而,独立LLMs生成的单元测试可能存在编译或执行错误以及覆盖度有限的问题。为了解决这些问题,可以基于LLM构建智能体,通过迭代优化来提升单元测试的正确性、覆盖度和故障检测能力。
-
系统测试:系统测试是一个全面的过程,用于评估集成的软件系统或组件在不同设置下的性能。LLMs在系统测试中的应用也颇具挑战,但基于LLM的智能体通过融合被测软件系统的领域知识,能够生成更加有效且实用的系统级测试用例。这些测试用例能够模拟真实用户场景,从而确保软件在实际使用中的稳定性和可靠性。
1.5.2 实例场景
-
单元测试场景:在单元测试中,LLMs可以自动生成测试用例来验证代码的正确性和边界情况。例如,在开发一个复杂的算法库时,测试人员可以利用LLMs生成大量的测试用例来覆盖各种可能的输入和输出情况。
-
系统测试场景:在系统测试中,LLMs可以生成模拟真实用户行为的测试用例来验证网站的性能和用户体验。例如,在开发一个电子商务网站时,测试人员可以利用LLMs生成模拟用户行为的测试用例,如注册、登录、浏览商品、下单等,以验证网站在不同场景下的稳定性和可靠性。
-
集成测试场景:集成测试是将各个模块组合起来进行测试的过程。LLMs可以帮助测试人员识别模块之间的接口问题,并生成相应的测试用例来验证接口的兼容性和稳定性。这有助于确保各个模块能够协同工作并达到预期的功能。
-
性能测试场景:性能测试是评估软件在特定条件下的性能表现。LLMs可以模拟大量用户同时访问软件的情况,并生成相应的测试数据来评估软件的性能瓶颈和优化空间。这有助于开发团队了解软件的性能表现并进行相应的优化。
1.5.3 当前应用
-
单元测试方面:结合通义灵码、JUnit及Mockito等工具,我们可以高效地实现单元测试。通义灵码提供了丰富的单元测试实践案例,为测试人员提供了有力的支持。
-
系统测试方面:Testim.io是一个创新的基于AI的自动化测试平台,为Web和移动应用的端到端测试带来了全新的解决方案。其强大的功能包括AI驱动的测试用例生成、智能元素定位器以及自我修复测试等,极大地提升了测试人员的工作效率。
-
集成测试方面:TestNG和Cucumber是两个备受推崇的自动化测试框架。TestNG适用于Java应用程序的单元、集成和端到端测试,而Cucumber则以其基于自然语言的方法而广受赞誉,成为行为驱动开发(BDD)爱好者的首选。
-
性能测试方面:HP LoadRunner和JMeter是两款值得关注的性能测试工具。HP LoadRunner能够模拟上万用户同时实施测试,帮助用户确认和查找存在的瓶颈;而JMeter则基于Java平台,不仅适用于接口测试,还广泛用于系统性能评估。
1.6 软件调试:AI辅助的精准定位与问题解决
1.6.1理论基础
在软件调试领域,尤其是在大型语言模型(LLM)逐渐崭露头角的时代背景下,故障定位、程序修复以及统一调试这三个关键环节均得到了显著的革新与推动。
-
故障定位
-
多智能体协同:在LLM时代,研究者们构建了多个由LLM驱动的智能体(如AgentFL和RCAgent等),每个智能体都具备专业知识和工具,以实现项目级代码的高效故障定位。这些智能体通过协同作用,能够简化复杂的故障定位过程,提高定位的准确性和效率。
-
工具调用:系统如AUTOFL通过工具调用增强了LLM的功能,使其能够更深入地探索代码库并精确定位故障。这些系统能够自主决定何时调用工具以及调用哪些工具,从而实现对代码库的全面分析。
-
-
程序修复
-
迭代优化:基于LLM的智能体在程序修复方面采用了迭代优化的方法。例如,ChatRepair、CigaR和RepairAgent等系统通过工具调用、模型反馈以及硬编码的反馈机制等方式,不断迭代生成和优化补丁,直至生成合理且多样的补丁。
-
多智能体系统:系统如AutoSD和ACFIX通过构建多智能体系统来实现更高效的程序修复。这些系统模拟科学调试过程,赋予LLM不同角色,并利用工具反馈和模型反馈来精细化控制补丁的生成和验证。
-
-
统一调试
-
多智能体协同:FixAgent等系统通过构建多智能体系统,实现了端到端的故障定位、错误修复和错误分析。这些系统通过智能体专业化和协同作用,纳入了关键变量跟踪和程序上下文理解等关键功能,从而提高了统一调试的准确性和效率。
-
控制流图分析:LDB等系统利用控制流图将有缺陷的程序划分为基本块,并通过LLM检测带有运行时执行值的不正确块。这种方法不仅提高了故障定位的精度,还为程序修复提供了更具体的优化建议。
-
1.6.2实例场景
-
企业运维自动化:大语言模型能够分析历史监控数据,学习系统的正常运行模式,并在异常发生时迅速识别出异常模式,实现智能监控和故障预警。同时,它还能通过分析故障现象、系统日志和历史案例等信息,自动推理出可能的故障原因和解决方案。
-
程序自动修复:大语言模型能够理解和生成代码,因此可以用于程序自动修复任务。通过迭代优化的方法,大语言模型可以不断生成和优化补丁,以修复代码中的缺陷。
-
统一调试平台:基于LLM的统一调试平台能够整合故障定位和程序修复功能,实现端到端的调试过程。通过多智能体协同和控制流图分析等方法,这些平台能够提供更准确、高效的调试服务。
1.6.3当前应用
-
Replit:正致力于开发能够自动修复代码的大型语言模型。通过收集用户会话中的操作轨迹和语言服务器协议的诊断信息,重建项目状态,并利用LLM生成和筛选代码差异,实现代码的自动修复。通过监督学习对模型进行微调,并利用公共基准测试集和新创建的数据集对模型进行评估,以提升模型在代码修复任务上的表现。
-
Copilot AutoFix:GitHub Advanced Security(GHAS)推出的AI修复助手。在检测到代码漏洞后,能够自动生成修复建议,提高修复效率,并简化安全流程。
-
New Relic AI:将大型语言模型与New Relic的数据平台相结合,为用户提供强大的系统理解和管理能力。用户可以通过聊天功能与AI助手互动,提出问题并获取关于系统性能和故障排除的见解。AI助手还能够自动创建NRQL查询,帮助用户分析系统数据,并从日志和堆栈跟踪中提取错误的摘要和详细信息,以快速定位并解决问题。此外,AI助手还能够识别警报覆盖的空白区域,帮助用户设置合成监控任务,汇总并检查支持工单的状态,以及从仪表板中获取摘要和见解。
二、端到端软件开发的全面解析
Agent 通过执行多种开发子任务,包括需求工程、设计、代码生成和质量保证(包括静态检查和测试等),完成从需求到最终程序的全流程开发。目前面向端到端软件开发的 Agent 主要模拟真实的软件开发团队,设计不同的软件开发角色,互相协作共同完成软件开发任务。
2.1 软件开发流程:经典与创新的融合
现有的基于LLM的智能体系统,在遵循经典的软件流程模型,如瀑布模型和敏捷开发的基础上,进行了创新性的设计。
-
瀑布模型:这一传统模型以线性且顺序的方式,将软件开发分为需求、设计、实现、测试、部署和维护等阶段。然而,一些智能体通过迭代的方式,对瀑布模型进行了扩展,从而提高了生成内容的质量。
-
敏捷开发:强调迭代和增量的敏捷开发模型,如测试驱动开发(TDD)和Scrum,在AI辅助的软件开发中同样大放异彩。实验表明,Scrum模型在函数级代码生成上表现尤为出色。
2.2 角色专业化:模拟与分解的双重奏
为了完成端到端软件开发任务,基于LLM的智能体系统分配了不同的角色来处理专门的子任务。这些角色既模拟了真实的软件开发团队,又根据工作流程进行了巧妙的分解。
-
模拟现实团队:智能体系统可以分配如经理、需求分析师、设计师、开发者和质量保证专家等角色。这些角色各司其职,共同协作,将软件开发任务逐一攻克。例如,经理负责全局的协调和管理,需求分析师则深入洞察用户需求,设计师则匠心独运地设计系统架构和界面,开发者则化繁为简地编写代码,而质量保证专家则严格把关,确保软件的正确性和稳定性。
-
依据工作流程分解角色:智能体系统还可以根据工作流程的细微差别,进一步分解角色。如代码库、文件和方法层的实现角色,这些角色更加专注于具体的开发任务,从而提高了开发效率和代码质量。
2.3 协作机制:有序与无序的交响乐
在端到端软件开发中,各个智能体之间的协调至关重要。智能体系统通过安排合适的协作模式和通信协议,确保各个智能体能够高效、准确地完成任务。
-
协作模式:
-
有序模式:智能体独立决策,并通过反馈机制不断提高质量。每个智能体都在自己的领域内发光发热,通过反馈机制与其他智能体进行交流和协作,共同推动项目的进展。
-
无序模式:智能体平等地提出意见,并通过汇总得出最终决策。这种模式更加灵活和民主,能够确保决策的全面性和准确性。然而,它也可能带来决策过程的复杂性和耗时性。
-
-
通信协议:
-
自然语言:智能体之间可以直接对话,用自然语言灵活表达意图。这种通信方式更加自然和直观,有助于促进智能体之间的深入交流和协作。但自然语言也可能带来歧义和误解的问题。
-
结构化信息:智能体之间还可以交换文档、图表等结构化信息,特别适用于多轮复杂任务。这种通信方式更加准确和清晰,能够确保信息的正确传递和理解。但准备和解释这些信息可能需要更多的时间和资源。
-
2.4 特定智能体系统:Meta GPT
Meta GPT是一种基于大型语言模型的智能体系统,它在端到端软件开发中表现出色。Meta GPT能够模拟真实的软件开发团队,并分配不同的角色来处理专门的子任务。它还可以与其他智能体进行高效的协作和通信,以确保软件开发任务的顺利完成。这是我目前在跟踪的开源项目。
目前,已经有多个基于大型语言模型的智能体系统被应用于端到端软件开发中。这些系统各具特色,为软件开发带来了全新的可能。如下表:
三、端到端软件维护的策略与实践
Agent在软件维护领域发挥着重要作用,支持故障定位、修复及特性维护等多元化活动,实现从问题报告至补丁生成的全面维护流程。当前,基于大型语言模型(LLM)的智能体系统已应用于端到端软件维护,其流程涵盖预处理、问题重现、问题定位、任务分解、补丁生成、补丁验证及补丁排序等关键环节。尽管各智能体在处理各阶段时策略各异,但总体框架相似。
-
预处理:智能体首先进行预处理,构建代码库的知识图谱或树状结构,为后续问题定位奠定坚实基础。
-
问题重现:为有效解决问题,智能体设计问题重现阶段,利用LLM根据问题描述生成可执行的测试脚本,以重现用户遇到的意外行为。
-
问题定位:此阶段至关重要,智能体需精确识别与问题相关的代码元素。采用策略包括基于检索、导航、频谱的定位及模拟等。
-
任务分解:在补丁生成前,部分智能体会将任务细化为更小的子任务,以精准定位并解决问题。
-
补丁生成:智能体针对已定位的代码元素生成补丁,输入包括问题/任务描述及待修改的代码元素。
-
补丁验证:验证补丁正确性颇具挑战,智能体采用代码审查、静态及动态检查等多种策略。
-
补丁排序:为筛选出最可能正确的补丁,部分智能体增设补丁排序阶段。
尽管取得显著进展,基于LLM的智能体在软件维护方面仍面临挑战,如问题重现成功率及问题定位精确性有待提升。未来发展方向可能包括:
-
提高问题重现成功率:通过增强LLM生成能力及引入更多上下文信息,提升重现测试的可执行性和针对性。
-
增强问题定位精确性:结合先进代码搜索算法及更多代码上下文信息,提高定位准确性。
-
优化补丁生成与验证:引入约束和优化算法,提升补丁质量,并采用更全面的验证策略确保补丁正确性。
四、软件工程未来的研究趋势与方向
在软件工程的浩瀚宇宙中,Agent正逐渐成为我们探索、开发与维护代码的得力助手。然而,如何准确评估这些Agent的能力,以及如何实现更高效的人机协同,成为了摆在我们面前的重要课题。
4.1评测体系的革新
当前的Agent评测体系,虽然聚焦于其端到端解决特定任务的能力,但如同盲人摸象,仅触及了冰山一角。我们亟需一个更全面、深入的评测基准,来揭示Agent的决策过程、失败原因,以及其在鲁棒性、效率等可信指标上的表现。同时,评测数据集也应摆脱逻辑简化、与现实脱节的桎梏,向更高质量、更贴近现实的方向迈进。只有这样,我们才能准确评估Agent的真正实力,为其后续的优化提供有力支撑。
4.2人机协同的拓展
在人机协同的舞台上,Agent的角色仍然有限,主要局限于需求工程、设计、测试评估等环节。而未来,我们期待看到Agent在更多场景中绽放光彩,与人共同编织出更加流畅、自然的协作乐章。这需要我们不仅要在技术上实现突破,更要深入探索高效友好的交互接口,让Agent成为我们工作中的得力伙伴。
4.3感知模态的多样化
Agent的感知能力,是其理解世界、执行任务的基础。目前,Agent主要依赖文本或视觉感知,这在一定程度上限制了其灵活性和可访问性。未来,我们期待看到Agent能够整合多样化的感知模态,如语音命令、用户手势等,让其在更加复杂、多变的环境中游刃有余。这样的Agent,将不仅是一个编码助手,更是一个能够与我们全方位互动的智能伙伴。
4.4软工任务的全面覆盖
尽管Agent在软工任务中已经展现出强大的潜力,但在设计、验证和功能维护等关键阶段,其应用仍然有限。这些阶段,如同软件开发的“暗区”,等待着我们去探索、去征服。为这些阶段开发Agent系统,将是一项充满挑战的任务,但也将为我们带来前所未有的机遇。
4.5基座大模型的构建
面向软件工程领域的基座大模型,是Agent在软件开发与维护中的“基石”。它不仅要能够处理代码数据,更要能够捕捉设计、架构、开发者讨论、程序动态执行、历史演化等多方面的信息。这样的模型,将为Agent提供更加全面、深入的知识支持,使其在软件开发与维护中发挥出更大的作用。
4.6软件工程知识的融入
在Agent的设计中,我们不能忽视软件工程领域的经典方法论和思想。这些方法论和思想,如同Agent的“灵魂”,指导着其在软件开发与维护中的每一步行动。通过融入这些知识,我们可以让Agent的解决方案更加有效、鲁棒和高效,从而推动软件工程的进一步发展。
五、结语
在这个AI技术日新月异的时代,我们应当全力以赴,将AI融入软件工程的每一个角落。通过不断优化Agent的应用、建立全面的评估体系、优化人机协同模式以及整合多样化感知模态,我们可以推动软件工程向更高层次发展。让我们携手共进,迎接LLM-DevOps带来的新纪元!