如何避免、識別及快速篩選 AI 生成的提案

隨著 AI 在開放原始碼生態系統中日益普及,我們發現劣質的提案數量也隨之增加。以下是其他導師和機構管理員提供的建議,說明如何快速找出、避免及篩選垃圾提案。

1. 強制執行提交前社群互動

社群互動是提案是否優質的最有力信號之一。強烈建議您在選取程序中導入這項功能。

  • 強制即時通訊:要求應徵者加入機構的通訊管道 (例如 Slack、Zulip、IRC),並篩除不在該管道中的候選人提案。

    如何追蹤互動

  • 重點是個人,而非提案。不妨建立共用試算表,追蹤個別潛在貢獻者及其在社群中的歷程、優缺點、警訊和正面信號、相關導師等。

2. 強制性技術和貢獻規定

以下提供一些建議,協助您篩除未投入基本心力與程式碼集互動的應徵者。

  • 必要 PR/程式碼挑戰連結:
    • 請他們提供 1 到 3 個對專案最有意義的 PR / 貢獻連結
    • 需要進行小幅修正、程式碼挑戰、GitHub 討論/提取要求
  • 要求提供提案草案:請候選人在正式提交提案前,先分享 GSoC 提案草案。(注意:其他候選人可能會嘗試複製原作者的作品,因此請務必留意建立日期、首次編輯日期等資訊)

    如何追蹤貴機構的需求

  • 要求所有申請人完成前置作業:要求申請人先完成特定動作,再提交正式申請,可做為自然篩選機制,確保只有認真且有能力的人能繼續申請。

  • 我們應該要求哪些先決條件?通常是多種因素的組合:他們必須先與機構溝通,才能提交提案;他們必須完成 2 到 3 個 PR;他們需要進行測試;以及/或者他們必須使用特定範本來撰寫提案。貴機構應決定先決條件,並清楚說明。要求越多,就越容易剔除不符合所有要求的垃圾提案。

  • 新的「先決條件」按鈕:機構管理員可使用,導師可查看每個提案的先決條件 (也是提案匯出作業中的欄位,以及提案資訊主頁上的篩選器)。

  • 查看貢獻者的 GitHub 設定檔/活動:GSoC 網頁應用程式提供欄位,供申請人填寫 GitHub 使用者名稱和/或直接連結至他們與機構的貢獻,方便篩選出沒有先前互動的提案。

3. 如何篩選 AI 生成的提案

這是無可避免的!系統會生成部分 AI 提交內容。請參考下列提示,快速篩除這些郵件。

  • 範本提案強制執行:要求貴機構的所有提案都使用標準範本。例如要求他們回答 4 或 5 個特定問題。如果缺少必要條件,系統會強制自動取消資格。如果機構收到超過 50 份提案,這項功能就特別實用。
  • 尋找一般用語:快速搜尋並篩除含有明顯無意義內容的提案,例如:
    • [placeholders]
    • 「信號字」,例如「革命性」
    • 錯別字是好事,因為這代表是人類所為!
  • 要求申請者提供1 分鐘的自我介紹短片,並說明想參與這個專案的原因 (必須露出臉部,避免垃圾內容/重複提交)。
  • 大多數 AI 生成的垃圾內容,只是重新措辭並擴充貴機構在「構想」清單中列出的構想說明。這樣就更容易注意到模式 (例如第三段包含「1-3 分鐘」,因為構想頁面的第三個句子提到「1-3 分鐘」)
  • 如果提案過於精美,很可能是 AI 生成。不要只看內容是否有有趣的圖表和圖片 (AI 可以輕鬆生成這些內容)。

4. 最佳化內部程序

不妨參考下列提示,讓機構的審查程序更輕鬆。

  • 機構專屬申請問題:決定 3 到 5 個問題,要求每位申請人在提案中回答。請務必在指示中清楚說明這點,並將未提交這項資訊設為自動拒絕篩選器。
  • 預先選取/初步管理員評估:請機構管理員進行初步篩選,將提案分類 (例如有效、無效/垃圾內容、超出範圍),再將其分配給導師進行深入審查。
  • 標記標題/專案不符:在說明中,要求申請人使用特定標題或關鍵字,方便 OA/導師輕鬆與專案構想配對,因為許多導師只對他們想指導的專案構想提案感興趣。
    • 提案必須包含標準化標題,標題可能採用標準格式。