product
사진은 저장이 아니라 '못 찾는 것'이 문제였다 — 우리가 Ascendy를 만든 이유
· Ascendy Engineering
TL;DR
- Ascendy의 시작은 사진이 아니었다. 아이 돌잔치 사진을 AI로 보정하려다 아이 얼굴이 통째로 다른 얼굴로 바뀐 일에서 출발했다.
- 첫 아이템은 ‘말로 하는 보정’이었지만 “이건 빅테크가 더 잘하겠다”는 생각에 접었다. 진짜 빈틈은 다른 데 있었다 — 찾고·정리하고·공유하는 한 흐름을 자연어로 묶어주는 사진 클라우드가 없었다.
- 사진을 다뤄볼수록 진짜 문제가 보였다. 사람들은 사진을 클라우드에 쌓아두고 다시는 안 본다. 저장은 됐는데 못 찾는다. 도토리를 묻어두고 어디 묻었는지 잊은 다람쥐처럼.
- 그래서 우리가 만든 건 더 큰 저장고가 아니라, 자연어로 찾고·분류하고·자동으로 공유하는 에이전트다. 쌓인 사진을 쓰레기 더미가 아니라 나를 이해하는 raw data로 바꾸는 것.
소스 노트. 이 글의 1차 소스는 운영자 인터뷰이고, 나를 인터뷰하는 에이전트로 끌어냈다. 핵심 장면·일화·숫자(돌잔치 보정 실패, 다람쥐 비유, 동생 일화 등)는 운영자가 인터뷰에서 실제로 말한 것이며, 일부 시장 해석과 일반화는 편집 과정의 부연이다. 정제본은
docs/intake/from-user/2026-06-02-why-we-built-ascendy.md에 있다. 시장에 대한 판단은 우리의 가설이지 확정된 사실이 아니다.
시작은 사진이 아니었다
1년쯤 전, 아이 돌잔치를 했다. 지난해 봄이었고, 사진은 2~3주 뒤에 나왔다. 그때 나는 “AI로 뭔가 만들어야겠다”는 막연한 고민만 하고 있었다.
인화할 컷을 고르는데, 문제가 있었다. 아이가 너무 울어서 표정이 죄다 울상이었다. 그래서 GPT한테 부탁했다 — “이 사진, 표정 좀 밝게 바꿔줘.” 당시 GPT의 이미지 편집은 엉망이었고, 결과는 예상대로였다. 아이 얼굴이 다른 아이 얼굴로 바뀌어 돌아왔다. 디퓨전 모델이 흔히 그렇듯, 표정을 고치랬더니 사람을 갈아끼운 것이다.
나는 어이가 없었지만 놀라진 않았다. 전에 Stable Diffusion으로 몇 번 장난쳐봤던 터라 이게 한계라는 걸 알고 있었으니까. 그런데 옆에서 아내가 한 말이 더 오래 남았다. “이거 하나 못 하냐? AI 엉망이네.”
그 한마디가 신호였다. 만드는 사람은 “원래 안 되는 거야”라고 넘기는 한계를, 쓰는 사람은 그냥 답답해한다. 나는 그 온도차를 시장 신호로 봤다.
첫 아이템, 그리고 첫 피벗
그래서 처음 떠올린 건 ‘말로 하는 보정’ 이었다. 사람들은 여전히 스노우 같은 앱으로 조잡하게 보정을 한다. 그걸 “이 정도로만 자연스럽게 고쳐줘” 수준의 말로 되게 하자 — 지금의 나노바나나나 GPT image 같은 결의 서비스였다.
오래 가진 않았다. 곧 이런 생각이 들었다. 이건 우리가 지금 시작해도 빅테크가 더 잘하겠는데. 이미지 생성·편집 모델은 결국 가장 큰 데이터와 가장 큰 GPU를 가진 쪽이 이긴다고 봤다. 거기서 접었다.
피벗하면서 눈에 들어온 건 우리가 풀고 싶은 빈틈이었다. 조각들은 이미 나오고 있었다 — 구글 포토는 2024년 ‘Ask Photos’로 자연어 검색은 물론 하이라이트 큐레이션과 공유용 캡션 생성까지 선보였다. 하지만 우리가 조사한 범위에서는, 찾고·정리하고·공유하는 과정을 한 번의 자연어 명령으로 끝까지 묶어주는 흐름은 찾지 못했다. GPT·Claude를 쓰며 당연해진 “말로 시키면 알아서 해주는” 경험이, 정작 우리 사진이 가장 많이 쌓이는 곳에는 없었다.
그리고 이건 오히려 빅테크가 못 할 거라고 봤다. 그들은 이미 수조 장의 사진을 쌓아두고 있다. 그 재고를 전부 AI로 처리하려면 막대한 비용이 들고, 시장은 이미 그들이 먹었다. 큰돈을 부어도 ROI가 안 나오는 싸움이다. 반대로 재고가 없는 신규 진입자는 처음부터 AI로 처리된 사진만 쌓으면 된다. 이건 우리의 가설이지만, 비대칭이 우리 쪽에 있다고 판단했다. 약 두 달을 코드 없이 구상만 하다가, 2025년 8월 자연어 검색 클라우드로 첫 커밋을 했다.
본질은 검색이 아니라 정리, 그리고 공유
아내와 아이디어를 계속 굴리다가 생각이 한 번 더 꺾였다. 클라우드의 본질은 검색 자체가 아니라 사진을 잘 정리하는 것이고, 그 정리와 검색을 자연어로 하게 만드는 것이 핵심이었다. 거기에 하나가 더 붙었다 — 공유.
이 셋이 하나의 문장으로 모였다.
“아기가 웃고 있는 사진만 찾아서 앨범으로 만들고, 이걸 부모님께 공유해줘.”
이 한 문장을 완벽하게 수행하는 에이전트. 그걸 만들다 보니 지금의 Ascendy가 됐다.
진짜 문제 — 쓰레기 더미를 보관하는 비용
사진 전처리용 모델들을 실제로 붙여보며 깨달은 게 있다. 사진 한 장이 품은 데이터는 생각보다 훨씬 많다. 그런데 사람들은 이걸 클라우드에 처박아두고 다시는 안 본다. 나부터 그랬다.
도토리를 부지런히 묻어두고, 정작 어디 묻었는지 잊어버려 그대로 썩히는 다람쥐. 딱 그 꼴이다.
확신을 준 건 동생과의 대화였다. 동생은 매달 1~2만 원씩 내며 사진이 산더미처럼 쌓여 있는데, 막상 찾고 싶은 사진이 어디 있는지 자기도 모른다고 했다. 그 말을 듣고 그림이 선명해졌다. 거대한 창고를 빌려놓고, 정리 못 한 쓰레기 더미를 보관하는 비용을 내고 있는 셈이다. 저장은 풀린 문제다. 못 찾는 게 문제다.
그래서 우리가 만든 것
Ascendy는 더 큰 저장고가 아니다. 우리가 만든 건 이런 흐름이다.
- 자연어로 검색·분류 → 바로 앨범으로 정리된다.
- 새로 찍은 사진이 기존 앨범의 조건에 맞으면 알아서 그 앨범으로 분류된다.
- 어떤 앨범은 자동으로 공유되어 있어서, 마치 데이터 파이프라인처럼 “사진을 찍으면 → 해당 앨범으로 분류 → 상대에게 공유”까지 한 번에 흐른다.
그리고 마지막 한 단계가 우리가 진짜 노리는 곳이다. 이렇게 쌓이고 이해된 사진 데이터를 바탕으로, 에이전트는 내가 뭘 좋아하고 어딜 자주 가고 누구와 시간을 보내는지 알게 된다. 그 위에서 나에게 맞는 대화와 서비스를 제공한다.
그러면 클라우드에 쌓인 사진은 더 이상 쓰레기 더미가 아니다. 에이전트가 나를 더 잘 이해하기 위한 raw data가 된다. 도토리 더미가 처음으로 쓸모를 갖는 순간이다.
지금
위 시나리오는 지금 실제로 작동한다. 아직 정식 공개는 하지 않았고, 가까운 사람들과 닫힌 형태로 써보며 다듬는 중이다 — 정식 공개를 준비하고 있다.
울상 사진 한 장에서 시작한 길이 여기까지 왔다. 사진을 저장만 하고 잊어버리는 게 익숙하다면, 한 번쯤 다르게 써볼 때가 됐는지도 모른다. 궁금하면 ascendy.ai에서 직접 확인할 수 있다.
저작·인용: 이 글은 Ascendy Engineering이 작성했으며 출처 표기 시 재인용 가능합니다. 잘못된 정보를 발견하면 GitHub 이슈로 알려주세요.
Tags: ascendy, product, photo-cloud, natural-language-search, ai-agents