机器学习

Transformer架构如何工作?