面向在 2026 年 GSoC 中使用 AI 工具的 GSoC 贡献者的指南

请务必仔细阅读 GSoC 组织的文档,并密切关注其关于是否允许在其社区中使用任何 AI 工具的指南。我们已要求组织明确说明对 GSoC 参与者的期望。

每个组织对于何时/是否适合使用 AI 工具都有自己的看法。

部分组织不允许以任何方式使用 AI 工具,包括在撰写提案时。而另一些公司则不允许将 LLM 生成的任何代码纳入其代码库。

以下是使用 AI 工具时需要考虑的一些事项。请注意,此指南并未涵盖每个组织的全部信息,您必须仔细阅读每个组织的 GSoC 指南,了解他们接受/不接受哪些内容。

导师关于何时使用 AI 工具的建议

1. 始终验证并充分了解代码

这是最关键且经常被提及的建议。人类贡献者对作品保留 100% 的责任,因此必须完全理解并验证作品。

  • 请务必验证 AI 生成的内容,如果您不理解或不确定,请在弄清楚之前不要使用。

2. 将 AI 用于研究和学习,而非核心逻辑

它最适合用作快速学习或信息检索工具,而不是用于生成项目最重要部分的代码。

  • 主要将 AI 工具用于研究,较少用于代码生成
  • 使用 AI 工具进行理解并探索新领域。

3. 分担繁琐或“苦力”工作(样板、测试、调试)

我们鼓励使用 AI 来处理重复性、耗时或与修复现有问题相关的任务,以便贡献者将时间集中在智力挑战上。

  • 用于编写样板和重构
  • 仅用于繁琐的工作,例如添加所有文件名或更改某些导入
  • 帮助他们自动执行项目中的一些繁琐部分,或帮助他们编写一些测试代码,或帮助他们进行调试
  • 用户需要先定义测试范围,然后才能使用 AI 工具

4. 许可问题

请务必直接向您的组织确认,他们是否允许在其代码库中使用 AI 生成的代码。关于此主题的讨论有很多,每个组织都有自己的观点,潜在的 GSoC 贡献者需要遵循其组织的具体指导。

导师和 GSoC 组织对 AI 工具的疑虑

1. 学习和技能发展障碍

这是最常见的问题。导师担心,使用 AI 生成解决方案会阻碍学生培养编程、解决问题和正确思考方面的基本技能。

2. 盲目信任和缺乏了解/验证

贡献者往往会盲目接受 AI 生成的输出(代码和文本),而不验证其正确性、逻辑性或适用性。如果开发者盲目使用 AI 工具生成代码,往往不了解生成的内容。

3. 代码/输出质量低

AI 生成的代码通常质量较差,不符合准则,包含 bug,难以维护,或者会给导师带来额外的工作。

  • 代码质量通常较低(导致维护人员的工作量增加)
  • 生成无意义的冗长散文

AI 生成的代码所涉及的法律问题是组织和导师非常关注的问题。

  • 某些组织的提交指南禁止提交通过大语言模型生成的代码,因为此类代码可能会违反 OSS 许可
  • 版权问题

5. 无法有效使用 AI

一些疑虑并非针对 AI 本身,而是针对贡献者在利用 AI 方面的技能不足,尤其是在复杂或新颖的项目背景下。

  • 有效利用 AI 进行编码需要一定的技能和经验
  • 贡献者有时可能不了解项目的主题,因此不知道该向 AI 提出什么问题才能获得正确的信息

6. 环境影响

大型 AI 模型消耗的大量能源

7. AI 在特定或复杂任务中的局限性

导师们指出,当问题复杂、独特或涉及新技术时,AI 工具往往会失效,而这种情况在 GSoC 等学习环境中很常见。

  • 工具擅长解决之前经常解决的问题。我们的使命是教导学生解决以前从未解决过的复杂问题。
  • AI 在有限的上下文中编写简单代码以外的任何内容时表现都很糟糕
  • 项目可以使用 AI 不了解的技术