Великі мовні моделі: перевірте свої знання

  1. Скільки 2-грам (біграм) міститься у фразі:

    they visited New York last week

  2. Які атрибути великих мовних моделей допомагають їм робити кращі прогнози, ніж ті, які видають інші типи мовних моделей? (Виберіть усі варіанти, які підходять.)

    Виберіть потрібну кількість відповідей.

  3. Істина чи хиба: повний трансформер складається з кодера й декодера.

  4. Велика мовна модель навчається на великому масиві даних, у якому є такий приклад:

    My cousin's new fashion line is so cool!

    Який механізм допомагає великій мовній моделі дізнатися, що в цьому реченні cool (англ. прохолодний, чудовий), швидше за все, означає "чудовий", а не стосується температури?

  5. Яке з тверджень щодо тонкого налаштування й дистиляції, наведених нижче, істинне?