HW7 的目標是要用 BERT-based 的 model 來 train 一個 extractive question answering model,使用的 dataset 是 DRCD: 台達閱讀理解資料集 Delta Reading Comprehension Dataset。
我最後使用 macBERT-large 在 public score 上面取得 82.05% 的 accuracy。
其中比較麻煩的是關於 data processing 的部分,report 的第一題也是針對這個部分來闡述細節:
After your model predicts the probability of answer span start/end position, what rules did you apply to determine the final start/end position? (the rules you applied must be different from the sample code)