判断题:BERT使用的是Transformer编码器,由于Selfattention机制,所以模型上下层直接全部互相连接

  尔雅 智慧树 mooc


+
账户
更新
搜索
帮助
主页