+

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
experiments		experiments
results		results
src		src
.gitignore		.gitignore
README.md		README.md
config.py		config.py
requirements.txt		requirements.txt

Repository files navigation

Transformer Visualization and Analysis

项目概述

本项目旨在通过机器翻译任务，深入展示Transformer架构中各个核心组件的作用和贡献。通过可视化和实验分析，来间接理解Transformer原理。

实验目标

展示Transformer各组件作用：
- 多头自注意力机制
- 位置编码
- 前馈神经网络
- 残差连接和层归一化
消融实验：
- 移除不同组件的影响
- 分析各组件对性能的贡献
注意力可视化：
- 展示注意力权重分布
- 分析不同头的注意力模式
性能对比：
- 与RNN、LSTM等传统模型对比
- 不同配置下的性能分析

环境要求

Python 3.8+
PyTorch 1.9+
NumPy
Matplotlib
Seaborn
tqdm

快速开始

安装依赖：

pip install -r requirements.txt

组件分析：

python experiments/component_analysis.py

消融实验：

python experiments/ablation_study.py

注意力可视化：

python experiments/attention_visualization.py

About

No description, website, or topics provided.

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%

点击这是indexloc提供的php浏览器服务，不要输入任何密码和下载