一个有趣的网站/示例;Transformer explainer
很多人可能都知道这一波大模型兴起的基础是transformer架构,
很多人也知道,我们和ChatGPT对话,模型其实是在通过输入“预测”输出;
那么这个过程到底是怎么实现的?
这个网站就提供了一种完全可视化的呈现……

访问地址:https://poloclub.github.io/transformer-explainer/
 
 
Back to Top