선의의 거짓말 — AI가 쓴 글의 할루시네이션을 어디까지 허용할 것인가

2026-06-01 · Ascendy Engineering

TL;DR

AI가 쓴 글에 원문에 없던 디테일(“새벽 3시, OOM이 세 번째 터졌다”)이 들어왔다. 읽는 맛은 살지만, 저자인 나는 그게 진짜인지 모른다.
인간 기억도 일종의 할루시네이션이다 — 부정확하고 왜곡된다. 바이브코딩은 이를 악화시킨다: 코드는 내가 만들었는데 타이핑한 건 내가 아니라, 내가 안 친 코드를 기억할 길이 없다.
그래서 선은 두 겹이다: 기록(git·로그)이 반증하는 건 지어내지 않고, 기록 없는 것도 내 기억에 실재하면 “기억 기반”이라 라벨하되 AI가 지어낸 건 라벨해도 버린다. 색채는 지우는 게 아니라 인터뷰로 진짜를 꺼내 교체하고, “거짓 같다”는 의심은 출처로 푼다.

소스 노트. 이 글의 1차 소스는 운영자 인터뷰이고, 이 글 자체가 ‘AI가 운영자를 인터뷰해 글을 끌어내는’ 하네스를 만드는 작업의 일환으로 쓰였다. 본문에 인용된 “새벽 3시, OOM이 세 번째 터졌다”는 문장 전체가 AI 초안이 지어낸 것으로(시각도, “세 번째”라는 횟수도 어떤 source에도 없다) — 이 글이 거부한 예시다. 투명하게 라벨한다고 허용되는 사실이 되는 게 아니다.

두 생각이 동시에 들었다

AI가 내 블로그 글을 쓴다. 어느 날 초안에 원문에 없던 문장이 하나 들어왔다 — “새벽 3시, OOM이 세 번째 터졌다.”

읽는 순간 두 생각이 동시에 들었다. 하나, “이거다 — 글이 읽히려면 이런 게 있어야 한다.” 둘, “근데 누가 나한테 이게 진짜냐고 물으면, 나는 모른다.”

선의의 거짓말?

그래도 나는 그 새벽 3시를 승인했다. 시간 같은 색채는 속여도 누가 다치지 않는다. 게다가 — 지난 다섯 달간 새벽 3시까지 일한 날이 너무 많았다. ‘충분히 그럴 법한’ 일이었다. 거짓말이라기보단 내가 기억하지 못하는 사실에 가까웠다.

그런데 이상한 질문이 따라왔다. 내가 기억 못 하는 걸, 나는 “틀렸다”고 말할 수 있나?

인간의 기억도 일종의 할루시네이션이다

사람은 모든 사건을 기억하지 않는다. 기억에 남을 만한 일, 중요한 이벤트를 기억하고 — 그 디테일의 정도조차 사람마다 다르다. 그리고 중요한 일이라고 다 기억나는 것도 아니다.

내 결혼식이 그랬다. 너무 긴장하고 정신이 없어서, 그날 누가 왔고 누구와 인사했는지 거의 기억나지 않는다. 그날 오지 않았던 사람이 “나 그날 왔었잖아”라고 해도, 나는 아마 “그런가” 할 것이다.

인간의 기억은 그 자체로 일종의 할루시네이션이다. 부정확하고, 시간이 지날수록 왜곡된다. AI의 할루시네이션을 어디까지 허용할 것인가를 따지다 보면, 정작 비교 기준이 되어야 할 내 기억부터 그리 믿을 게 못 된다는 데 도달한다.

바이브코딩이 이걸 한 단계 더 밀어붙인다

AI 코딩은 기억의 닻을 하나 더 끊는다. 바이브코딩을 하면 코드는 내가 만들었는데 타이핑한 건 내가 아니다. 내 손가락을 거치지 않은 코드를 기억하는 건 거의 불가능하다. “내가 짠 코드”라는 감각은 있는데, 그 코드의 어느 줄도 손에 남아 있지 않다.

그래서 기록이 중요하다. 블로그, docs, git. 문제는 프로젝트를 급하게 진행할 때다 — 그때는 이런 기록을 안 남기고, 그래서 나중에 기억이 왜곡되고 할루시가 비집고 들어온다.

기록에는 층위가 있다. git 커밋과 docs가 가장 직접적이고, 그게 없어도 클라우드 인프라 로그나 콘솔 히스토리가 기억을 떠받친다. 앞서 그 “OOM 삽질” 이야기의 한 단계는 git에 깔끔히 남지 않았지만, 인프라 로그에 흔적이 있어 “거의 확실한 기억”으로 격상됐다.

선은 어디에 — 반증 가능성, 그리고 그것만으론 부족하다

처음 그었던 기준은 “피해가 없으면 괜찮다”였다. 그래서 새벽 3시 같은 색채는 무해하니 허용이라 봤다. 하지만 이건 틀렸다.

첫 번째 기준은 **“반증할 수 있는가”**다. git 커밋 시각, 청구서의 실제 액수, 장애의 원인 — 기록이 “틀렸다”고 단언해주는 것은 지어내면 안 된다. 여기까진 새벽 3시가 통과한다. 어떤 기록도 그걸 반증하지 못하니까.

그런데 반증 불가능하다는 게 허용을 뜻하지는 않는다. 새벽 3시는 어떤 기록도 반증 못 하지만, 동시에 내 기억 어디에도 없다 — AI가 그럴듯해서 지어낸 것이다. 내가 사후에 “그럴 법하다”고 끄덕인 건, 내 기억에서 나온 게 아니라 그냥 그럴듯함을 승인한 것이다. 그건 색채가 아니라 fabrication이다.

그래서 선은 두 겹이다:

기록이 반증하는 건 지어내지 않는다. (커밋 시각·청구서·장애 원인)
기록이 없어도, 내 기억에 실재하면 “기억 기반”이라 라벨하고 쓴다. 하지만 AI가 지어낸 거면 라벨해도 쓰지 않는다.

새벽 3시는 2번에서 걸린다 — 반증은 안 되지만, 내 기억이 아니라 AI 창작이니까.

무미건조해지지 않나 — 색채는 지우는 게 아니라 교체한다

당연한 걱정이 따라온다. 색채를 그렇게 걸러내면 글이 무미건조해지지 않나? 실제 내 이야기인데도 밋밋해서 “AI가 썼네”라는 인상을 줄까봐, 심지어 거짓처럼 보일까봐.

답은 색채를 지우는 게 아니라 인터뷰로 진짜를 꺼내 교체하는 것이다. AI가 지어낸 “새벽 3시”는 버리지만, 그 자리에 내 진짜 기억을 넣는다 — 결혼식 날 누가 왔는지 기억 못 하던 것, 다섯 달간 새벽까지 일한 날들, 타이핑하지 않은 내 코드. 전부 지어낸 게 아니라 인터뷰가 캐낸 것이고, 그래서 생생하면서 정직하다.

그리고 “거짓처럼 보일까”라는 걱정은 출처를 보여주면 풀린다. AI 시대에 신뢰는 “생생함=인간이 썼다”가 아니라 **“검증 가능한 출처”**에서 온다. 이 글의 소스 노트가 곧 “진짜 겪은 사람이 출처와 함께 썼다”는 증거다 — 생생한데 출처 없는 글보다, 생생하면서 출처가 박힌 글이 이긴다.

그래서, 쓰기 전에 묻는다

할루시네이션을 줄이는 길도 거기서 나온다. 내가 이슈를 정확히 기억 못 해도, “그게 어딘가 기록됐다”는 것만 기억하면 된다. 그러면 AI에게 부탁할 수 있다 — “이건 git이나 docs에 있을 테니, 그걸 근거로 팩트체크해줘.” 기록이 있으면 팩트체크하고, 기록이 없어도 내 기억에 실재하면 “기억 기반”이라 라벨한다 — AI가 지어낸 거면 라벨이 아니라 버린다.

이 글에도 반전이 있다. 당신이 읽은 이 글은, AI가 나에게 인터뷰하듯 캐물어 쓴 것이다 — 우리가 만들고 있는 그 하네스의 첫 시도로. “그 새벽 3시, 진짜였어요?” — 그 질문 하나가 색채와 사실을 갈랐다. 지어낸 디테일을 막는 가장 단순한 방법은, 매끄러운 사후 검열기가 아니라 쓰기 전에 묻는 것이었다.

결정 / 트레이드오프

지어내지 말고, 인터뷰로 진짜를 꺼낸다. 색채는 지우는 게 아니라 교체한다 — AI가 지어낸 디테일은 버리고, 인터뷰로 운영자 기억에서 실재하는 색채를 꺼낸다. 생생함과 정직을 둘 다 얻는 길은 그것뿐이다.
반증 가능한 것은 지어내지 않는다. git·청구서·로그가 단언해주는 사실은 색채의 영역이 아니다.
기억 기반은 라벨하고, AI 창작은 버린다. 내 기억이 source면 “기억 기반”이라 밝히고 쓰되, 그조차 아닌 것(AI가 지어낸 것)은 라벨로 무마하지 않는다.
출처가 신뢰의 통화다. “거짓 같다”는 의심은 생생함이 아니라 투명한 출처(소스 노트)로 정면 돌파한다.

후속

인터뷰 방식을 재사용 가능한 글쓰기 하네스로 — “쓰기 전에 묻기”를 도구화.
기록의 층위(git → docs → 인프라 로그 → 기억)별 신뢰도를 글의 소스 노트 규칙으로 정형화.

저작·인용: 이 글은 Ascendy Engineering이 작성했으며 출처 표기 시 재인용 가능합니다. 잘못된 정보를 발견하면 GitHub 이슈로 알려주세요.

Tags: ai-writing, hallucination, fact-checking, vibe-coding, memory, editorial