[paraformer] support chunk mask #2282

Mddct · 2024-01-08T08:58:14Z

重构encoder 支持wenet/transformer/encoder's dynamic chunk training

QA

0 为什么要支持paraformer mask training？

尝试使用pretrain的非流paraformer，fintune训练u2++ like的流式模型，看是否可以得到好的效果

1 为什么要有：IdentitySubsampling？

因为wenet顺序是： cmvn->subsampling->pos emb
paraformer 顺序是： lfr(subsampling) ->cmvn -> pos_emb
所以这里实现了个IdentitySubsampling，什么也不做,只是调用了pos emb class，保持接口不变

2 paraformer fsm block中有padding，可能对流式训练有影响（训练和推理chunk不一致）
TODO

example:
ctc_weight: 0.3
use_dynamic_chunk: true

Mddct added 2 commits January 8, 2024 16:57

[paraformer] support chunk mask

c858e11

[paraformer] fix ut

fea73ce

Mddct marked this pull request as ready for review January 8, 2024 09:30

Mddct added 2 commits January 8, 2024 17:48

[paraformer] fix print

3e2820b

[paraformer] fix input dim

14352a4

Mddct requested review from xingchensong and robin1001 January 8, 2024 09:56

[paraformer] make length_normalized_loss false

fb17604

xingchensong approved these changes Jan 8, 2024

View reviewed changes

xingchensong merged commit 51dfa71 into main Jan 8, 2024
6 checks passed

xingchensong deleted the Mddct-paraformer-chunk-mask branch January 8, 2024 13:32

Mddct mentioned this pull request Jan 10, 2024

[examples] add paraformer fintune recipe #2289

Merged