Accenture PrimermediumGenerative AIPart 8

Transformer attention is typically multi-head to:

Reduce model parameters

Capture different relations using different projection subspaces

Remove positional info

Enforce Gaussian priors

Correct answer: Capture different relations using different projection subspaces

Explanation

The correct answer is: Capture different relations using different projection subspaces.

PrimerDumps has 1400+ primer questions, 2026 mocks and coding hands-on — all free.