← Ascendy EN

meta

선의의 거짓말 — AI가 쓴 글의 할루시네이션을 어디까지 허용할 것인가

· Ascendy Engineering


TL;DR

소스 노트. 이 글의 1차 소스는 운영자 인터뷰이고, 이 글 자체가 ‘AI가 운영자를 인터뷰해 글을 끌어내는’ 하네스를 만드는 작업의 일환으로 쓰였다. 본문에 인용된 “새벽 3시, OOM이 세 번째 터졌다”는 문장 전체가 AI 초안이 지어낸 것으로(시각도, “세 번째”라는 횟수도 어떤 source에도 없다) — 이 글이 거부한 예시다. 투명하게 라벨한다고 허용되는 사실이 되는 게 아니다.

두 생각이 동시에 들었다

AI가 내 블로그 글을 쓴다. 어느 날 초안에 원문에 없던 문장이 하나 들어왔다 — “새벽 3시, OOM이 세 번째 터졌다.”

읽는 순간 두 생각이 동시에 들었다. 하나, “이거다 — 글이 읽히려면 이런 게 있어야 한다.” 둘, “근데 누가 나한테 이게 진짜냐고 물으면, 나는 모른다.”

선의의 거짓말?

그래도 나는 그 새벽 3시를 승인했다. 시간 같은 색채는 속여도 누가 다치지 않는다. 게다가 — 지난 다섯 달간 새벽 3시까지 일한 날이 너무 많았다. ‘충분히 그럴 법한’ 일이었다. 거짓말이라기보단 내가 기억하지 못하는 사실에 가까웠다.

그런데 이상한 질문이 따라왔다. 내가 기억 못 하는 걸, 나는 “틀렸다”고 말할 수 있나?

인간의 기억도 일종의 할루시네이션이다

사람은 모든 사건을 기억하지 않는다. 기억에 남을 만한 일, 중요한 이벤트를 기억하고 — 그 디테일의 정도조차 사람마다 다르다. 그리고 중요한 일이라고 다 기억나는 것도 아니다.

내 결혼식이 그랬다. 너무 긴장하고 정신이 없어서, 그날 누가 왔고 누구와 인사했는지 거의 기억나지 않는다. 그날 오지 않았던 사람이 “나 그날 왔었잖아”라고 해도, 나는 아마 “그런가” 할 것이다.

인간의 기억은 그 자체로 일종의 할루시네이션이다. 부정확하고, 시간이 지날수록 왜곡된다. AI의 할루시네이션을 어디까지 허용할 것인가를 따지다 보면, 정작 비교 기준이 되어야 할 내 기억부터 그리 믿을 게 못 된다는 데 도달한다.

바이브코딩이 이걸 한 단계 더 밀어붙인다

AI 코딩은 기억의 닻을 하나 더 끊는다. 바이브코딩을 하면 코드는 내가 만들었는데 타이핑한 건 내가 아니다. 내 손가락을 거치지 않은 코드를 기억하는 건 거의 불가능하다. “내가 짠 코드”라는 감각은 있는데, 그 코드의 어느 줄도 손에 남아 있지 않다.

그래서 기록이 중요하다. 블로그, docs, git. 문제는 프로젝트를 급하게 진행할 때다 — 그때는 이런 기록을 안 남기고, 그래서 나중에 기억이 왜곡되고 할루시가 비집고 들어온다.

기록에는 층위가 있다. git 커밋과 docs가 가장 직접적이고, 그게 없어도 클라우드 인프라 로그나 콘솔 히스토리가 기억을 떠받친다. 앞서 그 “OOM 삽질” 이야기의 한 단계는 git에 깔끔히 남지 않았지만, 인프라 로그에 흔적이 있어 “거의 확실한 기억”으로 격상됐다.

선은 어디에 — 반증 가능성, 그리고 그것만으론 부족하다

처음 그었던 기준은 “피해가 없으면 괜찮다”였다. 그래서 새벽 3시 같은 색채는 무해하니 허용이라 봤다. 하지만 이건 틀렸다.

첫 번째 기준은 **“반증할 수 있는가”**다. git 커밋 시각, 청구서의 실제 액수, 장애의 원인 — 기록이 “틀렸다”고 단언해주는 것은 지어내면 안 된다. 여기까진 새벽 3시가 통과한다. 어떤 기록도 그걸 반증하지 못하니까.

그런데 반증 불가능하다는 게 허용을 뜻하지는 않는다. 새벽 3시는 어떤 기록도 반증 못 하지만, 동시에 내 기억 어디에도 없다 — AI가 그럴듯해서 지어낸 것이다. 내가 사후에 “그럴 법하다”고 끄덕인 건, 내 기억에서 나온 게 아니라 그냥 그럴듯함을 승인한 것이다. 그건 색채가 아니라 fabrication이다.

그래서 선은 두 겹이다:

  1. 기록이 반증하는 건 지어내지 않는다. (커밋 시각·청구서·장애 원인)
  2. 기록이 없어도, 내 기억에 실재하면 “기억 기반”이라 라벨하고 쓴다. 하지만 AI가 지어낸 거면 라벨해도 쓰지 않는다.

새벽 3시는 2번에서 걸린다 — 반증은 안 되지만, 내 기억이 아니라 AI 창작이니까.

무미건조해지지 않나 — 색채는 지우는 게 아니라 교체한다

당연한 걱정이 따라온다. 색채를 그렇게 걸러내면 글이 무미건조해지지 않나? 실제 내 이야기인데도 밋밋해서 “AI가 썼네”라는 인상을 줄까봐, 심지어 거짓처럼 보일까봐.

답은 색채를 지우는 게 아니라 인터뷰로 진짜를 꺼내 교체하는 것이다. AI가 지어낸 “새벽 3시”는 버리지만, 그 자리에 내 진짜 기억을 넣는다 — 결혼식 날 누가 왔는지 기억 못 하던 것, 다섯 달간 새벽까지 일한 날들, 타이핑하지 않은 내 코드. 전부 지어낸 게 아니라 인터뷰가 캐낸 것이고, 그래서 생생하면서 정직하다.

그리고 “거짓처럼 보일까”라는 걱정은 출처를 보여주면 풀린다. AI 시대에 신뢰는 “생생함=인간이 썼다”가 아니라 **“검증 가능한 출처”**에서 온다. 이 글의 소스 노트가 곧 “진짜 겪은 사람이 출처와 함께 썼다”는 증거다 — 생생한데 출처 없는 글보다, 생생하면서 출처가 박힌 글이 이긴다.

그래서, 쓰기 전에 묻는다

할루시네이션을 줄이는 길도 거기서 나온다. 내가 이슈를 정확히 기억 못 해도, “그게 어딘가 기록됐다”는 것만 기억하면 된다. 그러면 AI에게 부탁할 수 있다 — “이건 git이나 docs에 있을 테니, 그걸 근거로 팩트체크해줘.” 기록이 있으면 팩트체크하고, 기록이 없어도 내 기억에 실재하면 “기억 기반”이라 라벨한다 — AI가 지어낸 거면 라벨이 아니라 버린다.

이 글에도 반전이 있다. 당신이 읽은 이 글은, AI가 나에게 인터뷰하듯 캐물어 쓴 것이다 — 우리가 만들고 있는 그 하네스의 첫 시도로. “그 새벽 3시, 진짜였어요?” — 그 질문 하나가 색채와 사실을 갈랐다. 지어낸 디테일을 막는 가장 단순한 방법은, 매끄러운 사후 검열기가 아니라 쓰기 전에 묻는 것이었다.

결정 / 트레이드오프

후속


저작·인용: 이 글은 Ascendy Engineering이 작성했으며 출처 표기 시 재인용 가능합니다. 잘못된 정보를 발견하면 GitHub 이슈로 알려주세요.


Tags: ai-writing, hallucination, fact-checking, vibe-coding, memory, editorial