많은 방법들이 제안되었고, 해당 논문에서는 각 방법들에 대한 평가를 진행
- Sentence: 이순신은 조선 중기의 무신이다. / subject_entity: 이순신(PER) / object_entity: 무신(POH) 라고 가정.
- Entity mask
- [SUBJ-PER]은 조선 중기의 [OBJ-POH]이다.
- 새로운 special token을 도입.
- entity를 마스킹해서 학습하는 방식 → 강건한 모델
- Entity marker
- [E1] 이순신 [/E1]은 조선 중기의 [E2] 무신 [/E2]이다.
- 새로운 special token 도입
- Entity marker(punct)
- @ 이순신 @은 조선 중기의 # 무신 #이다.
- Entity marker와의 차이는 Special token을 도입하지 않고 기존 Vocab에 있는 단어들로 학습이 가능하다는 점.
- Typed entity marker
- <S:PER> 이순신 </S:PER>은 조선 중기의 <O:POH>무신</O:POH>이다.
- NER type을 entity marker 안에 합치는 방식
- <S:TYPE>, </S:TYPE>, <O:TYPE>, </O:TYPE> special token 도입(type * 4 만큼 인듯)
- Typed entity marker(punct)
- @PER이순신@은 조선 중기의 #^POH^무신#이다.
- sub, obj를 각각 @와 #으로 묶음.
- 해당 논문에서 새로 제안하는 방식.
For all new special tokens, their token embedding is randomly initialized and optimized during f ine-tuning.