비티 about 1 month ago
공문서가 hwp, pdf, OCR된 스캔본이라 LLM이 글을 읽지 못한다는 이야기는 24년 2월부터 나왔다.
그때는 확장자보다도 아니라 데이터가 보여주기식으로 파편화되어있다던지
회려한 도표가 들어간 의전용 편집을 요구하기때문에 인식률이 낮다는 주장이 있었다.
동시에 레거시 데이터의 인식이 어려움에 대해서도 지적하였다.
AI시대에 대비해야한다,고들 말하는데
늘 의문은 'AI는 무척 빠르게 성장한다', '역사 상 가장 유용한 도구가 될 것이다'라고 주장하는 것치고는
AI의 발전보다는 사람이 바뀌어야하는 경우가 많다는 것이다.
add a skeleton here at some point