이 논문은 ACL논문은 아닌데 어디에 넣을지 몰라 이곳에 저장…

<aside> 💡 TMI (요즘의 고민)

0. Abstract

Problem

LLM기반의Long form text generation의 factuality를 평가하는 것은 어렵다

(1) supported, unsupported information이 섞인 경우가 종종 있음 (quality inadequate를 평가하기 위해 binary judgement가 필요함)

(2) human evaluation is time-consuming and costly

Solution

FActScore (Factual precision in Atomicity Score)

1. Introduction

  1. 논문이 다루는 task
  1. 기존 연구 한계점