序列预测模型 序列预测模型
传统Transformer2017年,Google在论文 Attention is All you need 中提出了 Transformer 模型,其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构
服务器的使用 服务器的使用
远程连接服务器可以通过借助软件MobaXterm远程连接服务器 软件的下载&安装可以通过MobaXterm官网首页的Download进入下载界面也可通过该下载地址直接前往:https://mobaxterm.mobatek.net/
2023-03-24
Linux基础 Linux基础
vim命令vim编辑器有三种模式:命令模式、编辑模式、末行模式 模式切换模式间切换方法:(1)命令模式下,输入:后,进入末行模式(2)末行模式下,按esc慢退、按两次esc快退、或者删除所有命令,可以回到命令模式(3)命令模式下,按下i、a
2023-03-24
Python Basics Python Basics
Python多层引用问题 python被run的.py文件即为当前程序的主程序。其所在的目录即为python解释器的当前路径。 通过 from a import b方法调用时, a的位置必须和主程序的.py文件在同一目录。 通过frome
2023-03-24
Write Blog Write Blog
文章Front-Matter介绍在本地通过.md文件编写博客时,需要在博客的顶端编写Front-Matter部分。该部分用于设置该篇博客的基本信息。 Front-matter 选项详解Front-matter 选项中的所有内容均为非必填的。
Hexo cmd Operation Hexo cmd Operation
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hex
2023-03-22
2 / 2