面向在 2026 年 GSoC 中使用 AI 工具的 GSoC 贡献者的指南
请务必仔细阅读 GSoC 组织的文档,并密切关注其关于是否允许在其社区中使用任何 AI 工具的指南。我们已要求组织明确说明对 GSoC 参与者的期望。
每个组织对于何时/是否适合使用 AI 工具都有自己的看法。
部分组织不允许以任何方式使用 AI 工具,包括在撰写提案时。而另一些公司则不允许将 LLM 生成的任何代码纳入其代码库。
以下是使用 AI 工具时需要考虑的一些事项。请注意,此指南并未涵盖每个组织的全部信息,您必须仔细阅读每个组织的 GSoC 指南,了解他们接受/不接受哪些内容。
导师关于何时使用 AI 工具的建议
1. 始终验证并充分了解代码
这是最关键且经常被提及的建议。人类贡献者对作品保留 100% 的责任,因此必须完全理解并验证作品。
- 请务必验证 AI 生成的内容,如果您不理解或不确定,请在弄清楚之前不要使用。
2. 将 AI 用于研究和学习,而非核心逻辑
它最适合用作快速学习或信息检索工具,而不是用于生成项目最重要部分的代码。
- 主要将 AI 工具用于研究,较少用于代码生成
- 使用 AI 工具进行理解并探索新领域。
3. 分担繁琐或“苦力”工作(样板、测试、调试)
我们鼓励使用 AI 来处理重复性、耗时或与修复现有问题相关的任务,以便贡献者将时间集中在智力挑战上。
- 用于编写样板和重构
- 仅用于繁琐的工作,例如添加所有文件名或更改某些导入
- 帮助他们自动执行项目中的一些繁琐部分,或帮助他们编写一些测试代码,或帮助他们进行调试
- 用户需要先定义测试范围,然后才能使用 AI 工具
4. 许可问题
请务必直接向您的组织确认,他们是否允许在其代码库中使用 AI 生成的代码。关于此主题的讨论有很多,每个组织都有自己的观点,潜在的 GSoC 贡献者需要遵循其组织的具体指导。
导师和 GSoC 组织对 AI 工具的疑虑
1. 学习和技能发展障碍
这是最常见的问题。导师担心,使用 AI 生成解决方案会阻碍学生培养编程、解决问题和正确思考方面的基本技能。
2. 盲目信任和缺乏了解/验证
贡献者往往会盲目接受 AI 生成的输出(代码和文本),而不验证其正确性、逻辑性或适用性。如果开发者盲目使用 AI 工具生成代码,往往不了解生成的内容。
3. 代码/输出质量低
AI 生成的代码通常质量较差,不符合准则,包含 bug,难以维护,或者会给导师带来额外的工作。
- 代码质量通常较低(导致维护人员的工作量增加)
- 生成无意义的冗长散文
4. 许可和版权问题
AI 生成的代码所涉及的法律问题是组织和导师非常关注的问题。
- 某些组织的提交指南禁止提交通过大语言模型生成的代码,因为此类代码可能会违反 OSS 许可
- 版权问题
5. 无法有效使用 AI
一些疑虑并非针对 AI 本身,而是针对贡献者在利用 AI 方面的技能不足,尤其是在复杂或新颖的项目背景下。
- 有效利用 AI 进行编码需要一定的技能和经验
- 贡献者有时可能不了解项目的主题,因此不知道该向 AI 提出什么问题才能获得正确的信息
6. 环境影响
大型 AI 模型消耗的大量能源
7. AI 在特定或复杂任务中的局限性
导师们指出,当问题复杂、独特或涉及新技术时,AI 工具往往会失效,而这种情况在 GSoC 等学习环境中很常见。
- 工具擅长解决之前经常解决的问题。我们的使命是教导学生解决以前从未解决过的复杂问题。
- AI 在有限的上下文中编写简单代码以外的任何内容时表现都很糟糕
- 项目可以使用 AI 不了解的技术