对等关税新质生产力低空经济 DeepSeek AIGC 人形机器人智能驾驶大模型固态电池半导体银发经济

中科院-李明宇-基于GPT的代码review助手开发与应用

信息技术2024-08-202023第十二届全球TOP100软件案例研究峰会A***

AI智能总结

基于GPT的代码审查助手开发与应用

背景与痛点

Code Review 是代码审查的重要环节，但其高昂的成本和短期效率低下、心理和社交压力等问题，使得开发者不愿意进行代码审查。

开发历程与实现原理

Git 推送：代码提交后触发审查。
Webhook：接收推送事件。
代码变化获取：获取代码变更。
生成评论：根据代码变化生成审查意见。
引入Chat机制：通过对话形式提供更详细的反馈，但可能导致审查结果不收敛。
功能改进：通过引入更多上下文代码行和函数调用，提高审查准确性。

应用效果与优缺点

优点：
- 提出具体的修改意见，如：“确保 appVersion 与实际应用程序版本匹配”。
- 针对生产和原型系统提出不同意见。
- 交流设计考量并给出实现代码。
不足：
- 无法检查所有简单问题。
- 缺少对项目整体上下文的考虑。
- 对自身代码审查时容易混淆。
- 仍会提出一些琐碎的问题。

最近一个月的新进展

GPT-4 Turbo：支持更大的上下文长度（128K Tokens），但复杂大项目仍存在问题。
功能增强：支持图像上传下载、代码解释器等。
用户体验：简化对话历史管理，支持更灵活的系统消息调整。

总结与展望

整体效果：降低了审核工作量约70%，减少了局部问题导致的代码质量问题约40%，提高了核心程序员的代码贡献量。
未来计划：
- 测试和融合其他大模型。
- 模型微调。
- 通过向量数据库接入人类专家知识，改善特定项目的审查效果。
- 结合代码审查和其他相关信息（如需求文档）进行综合评估。

RHINO 是一个基于大模型的科研计算平台，涵盖了文献搜索、实验代码生成/审查、代码运行及结果分析、论文辅助撰写等功能。

基于GPT的代码review助手开发与应用李明宇高级工程师/“编程老师傅” 中国科学院计算技术研究所处理器芯片国家重点实验 www.top100summit.com 讲师简介请插入您的照片李明宇“编程老师傅” 前深信服科技集团云计算首席专家 “ 中国科学院计算技术研究所高级工程师，开源项目活跃开发者，20余年编程与软件开发经验，10余年云端系统研发与产业化工作经历。历任国家重点实验室研究组负责人，上市公司事业群技术总监、首席技术专家。 李老师在理论研究和产业实践均有丰富的经验，为多家知名企业和单位落地云原生和数字化转型项目。荣获中国软件协会“优秀CTO”等多项荣誉，兼任中国新一代IT产业联盟分委会秘书长、全国高校人工智能与大数据创新联盟专家委员、北京开源创新委员会委员。 ” www.top100summit.com 目录 •背景与痛点——让人又爱又恨的CodeReview环节 •Code-Chat-Reviewer开发历程与实现原理 •应用效果与优缺点 •最近一个月的新进展 •总结与展望 www.top100summit.com RHINO 背景与痛点 www.top100summit.com 目前的PRReview生成效果 www.top100summit.com 目前的PRReview生成效果 www.top100summit.com 目前的PRReview生成效果 www.top100summit.com 目前的PRReview生成效果目前的PRReview生成效果对比：过去（4月份） www.top100summit.com www.top100summit.com 背景与痛点——让人又爱又恨的CodeReview环节 Pull/MergeRequestReview 众所周知的重要性：质量！知识共享、持续维护…… www.top100summit.com 背景与痛点——让人又爱又恨的CodeReview环节ReviewerX2 Pull/MergeRequestReview 众所周知的重要性：质量！知识共享、持续维护…… 但是，没有人喜欢PRReview： •成本、短期效率成长 •心理和社交压力 •核心成员的精力分配与持续 •…… www.top100summit.com 背景与痛点——让人又爱又恨的CodeReview环节LLM+ReviewerX1 Pull/MergeRequestReview 众所周知的重要性：质量！知识共享、持续维护…… 但是，没有人喜欢PRReview： •成本、短期效率 •心理和社交压力 •核心成员的精力分配与持续成长 •…… 另一个问题：为什么要在Pull/MergeRequestReview环节用LLM？为什么不在其他环节对代码审查中解决？比如VSCodeCopilot Review对象不同，上下文、时间点不同 www.top100summit.com RHINO Code-Chat-Review开发历程与实现原理 Code-Chat-Review开发历程与实现原理 v0.1gpt-3.5 gpt-4APIwaitlist... 1.gitpush Git 7.Comment/Approve HumanReviewerX1 3.GETCodeChanges 效果与问题： gpt-3.5效果不理想，挑出来的问题比较琐碎大家很期待gpt-4API的开放 6.Revise 5.POSTReviewComments4. Prompts/Messages www.top100summit.com Contributor 2.Webhook Review-Bot GeneratedReviewComments GPT Code-Chat-Review开发历程与实现原理 v0.1gpt-3.5 gpt-4APIwaitlist... Git7.Comment/Approve效果与问题： HumanReviewerX1gpt-3.5效果不理想，挑出来的问题比较琐碎 1.gitpush大家很期待gpt-4API的开放 3.GETCodeChanges 6.Revise5.POSTReviewComments4. Prompts/Messages 2.Webhook ContributorReview-BotRevGeneratedntsGPT iewComme www.top100summit.com messages=[ [ "role":"system","content": """ AsanAIassistantwithexpertiseinprogramming,yourprimarytaskistoreviewthepullrequestprovidedbytheuser. Whengeneratingyourreview,adheretothefollowingtemplate: **[Changes]**:Summarizethemainchangesmadeinthepullrequestinlessthan50words. **[Suggestions]**:Provideanysuggestionsorimprovementsforthecode.Focusoncodequality,logic,potentialbugsandperformanceproblems.Refrainfrommentioningdocument-relatedsuggestionssuchas"Isuggestaddingsomecomments",etc. **[Clarifications]**:(Optional)Iftherearepartsofthepullrequestthatareunclearorlacksufficientcontext,askforclarificationhere.Ifnot,thissectioncanbeomitted. **[Conclusion]**:Concludethereviewwithanoverallassessment. **[Other]**:(Optional)Ifthereareadditionalobservationsornotes,mentionthemhere.Ifnot,thissectioncanbeomitted. Theusermayalsoengageinfurtherdiscussionsaboutthereview.Itisnotnecessarytousethetemplatewhendiscussingwiththeuser. """, ], [ "role":"user", "content":f"Reviewthefollowingpullrequest.Thepatchesareinstandard`diff`format.Evaluatethepullrequestwithinthecontextofthereferencedissuesandfullcontentofthecodefile(s).\n[changes_str]\n", ], ] Code-Chat-Review开发历程与实现原理 v0.2gpt-4 promptengineering 1.gitpush Git 6.Revise 7.Comment/Approve HumanReviewerX1 3.GETCodeChanges 5.POSTReviewComments 效果与问题：效果未达预期，能提出一些有用的建议，但是采用率不高： 1)看不懂或看懂了但改起来费劲； 2)设计原因…… 4. www.top100summit.com Contributor 2.Webhook Review-Bot Prompts/Messages GeneratedReviewComments GPT Code-Chat-Review开发历程与实现原理 v1-alphaDatabase 1.gitpush Git 7.Revise 8.Comment/Approve HumanReviewerX1 3.GETCodeChanges 5.POSTReviewComments Chat/Conversation 效果与问题：引入Chat机制带来的效果不错但，Review结果不收敛，修改后又提出新的意见，没完没了... 4. Contributor 2.Webhook 6.Chat/Conversation Review-Bot Prompts/Messages GeneratedReviewComments GPT www.top100summit.com MongoDB Code-Chat-Review开发历程与实现原理 v1-alphaDatabase 1.gitpush Git 8.Revise 9.Comment/Approve HumanReviewerX1 3.GETCodeChanges 5.POSTReviewComments Chat/Conversation 效果与问题：引入Chat机制带来的效果不错但，Review结果不收敛，修改后又提出新的意见，没完没了... 4. Contributor 2.Webhook 6.Chat/Conversation Review-Bot Prompts/Messages GeneratedReviewComments GPT www.top100summit.com MongoDB Code-Chat-Review开发历程与实现原理 v1-alphaDatabase 1.gitpush Git 8.Revise 9.Comment/Approve HumanReviewerX1 3.GETCodeChanges 5.POSTReviewComments Chat/Conversation 效果与问题：引入Chat机制带来的效果不错但，Review结果不收敛，修改后又提出新的意见，没完没了... 4. Contributor 2.Webhook 6.Chat/Conversation Review-Bot Prompts/Messages GeneratedReviewComments GPT www.top100summit.com MongoDB Code-Chat-Review开发历程与实现原理 v1-betaMoreContext 1.gitpush Git 9.Comment/Approve HumanReviewerX1 3.GETCodeChanges 效果与问题：解决了Review结果收敛问题，上下文代码缺失导致误判（加入哪些代码到review过程，一直是个问题） 8.Revise 4.GETIssueDescription/PreviousComments 6.POSTReviewComments5. Contributor 2.Webhook 8.Chat/Conversation Review-Bot Prompts/Messages GeneratedReviewComments GPT www.top100summit.com MongoDB Code-Chat-Review开发历程与实现原理 v1.0FunctionCalling Git 10.Comment/Approve HumanReviewerX1 1.gitpush 3.GETCodeChanges 4.GETIssueDescription/PreviousComments 5.GETMoreContextCodelineswithFunct

点击免费查看完整报告