나만의 AI Goodreads 구축기: 알라딘·리디·오프라인 서재를 하나로 묶다

나만의 AI Goodreads 구축기: 알라딘·리디·오프라인 서재를 하나로 묶다

책을 좋아하는 사람이라면 한 번쯤 이런 문제를 겪습니다.
온라인 서점 구매내역, 전자책 서재, 오프라인에서 직접 산 책, 읽기 상태 메모가 모두 흩어져 있어서 “내가 뭘 읽었고, 뭘 읽는 중이고, 뭘 다음에 읽을지”가 흐릿해지는 문제 말입니다.

이번에 저는 개인 AI 에이전트(시도)와 함께, 이 흩어진 데이터를 하나의 지식 시스템으로 통합했습니다. 목표는 간단했습니다.

“내 서재를 데이터베이스로 만들고, 결국 나만의 Goodreads처럼 운영하자.”


1) 시작: 데이터 소스 통합

초기 데이터는 3가지였습니다.

먼저 알라딘 내역을 CSV로 추출하고, 리디 서재도 별도 목록으로 정리한 뒤, 이를 합쳐 library_master.csv 형태의 통합 마스터를 만들었습니다. 여기에 오프라인 구매를 계속 누적하면서 실제 보유 서재에 가깝게 맞췄습니다.


2) 정제: 노이즈 제거와 제목 표준화

통합만으로는 충분하지 않았습니다. 실제 운영 가능한 라이브러리로 만들기 위해 다음 정제가 필요했습니다.

이 과정을 거치면서 “읽고 싶은/읽는” 도서 데이터만 남겨 관리 효율이 크게 올라갔습니다.


3) Obsidian 중심 지식 허브 전환

이 시스템의 핵심은 단순 CSV가 아니라 Obsidian 기반 지식 그래프입니다.

구조는 OpenClaw/Agents/Book/ 아래로 통일하고,

형태로 운영하게 만들었습니다.

책 노트는 자동 생성되며, 기본적으로 아래 정보를 포함합니다.

결과적으로 Obsidian 그래프에서 책-저자-출판사가 유기적으로 연결됩니다.


4) 메타데이터 강화: 알라딘 기반 보정 + 수동 큐레이션

자동 수집만으로는 저자 표기/출판사 표기가 엇갈리는 문제가 남았습니다.

예를 들어,

이를 해결하기 위해 1) 알라딘 검색 기반 자동 보정 라운드, 2) 남은 항목 수동 정밀 보정 을 진행했습니다.

최종적으로 누락 필드를 메우고, 저자/출판사 허브를 재생성해 그래프 품질을 끌어올렸습니다.


5) 도서관 분류 체계 도입

단순 목록을 넘어, 실제 사서처럼 분류 체계를 넣었습니다.

예시 코드:

각 책 노트에 class_code, class_name, format, source를 기록하고, 주제별 인덱스를 생성해 탐색성을 높였습니다.


6) Goodreads 모드: 읽기 상태를 데이터로 관리

가장 만족도가 높았던 변화는 읽기 상태 체계였습니다.

reading_state 기준:

추가 필드:

즉, 이제는 “읽는 중”이라고 말하면 상태가 업데이트되고, “다 읽었어”라고 말하면 완독 이력과 독서 히스토리가 쌓입니다.


7) 운영 방식: 대화 한 줄로 기록 자동화

운영 경험상 중요한 건 복잡한 UI가 아니라 입력 마찰 최소화였습니다.

이런 자연어 입력을 구조화 데이터로 바꿔주는 것이 핵심입니다.


마무리: 개인 서재에서 개인 지식 OS로

이번 세팅의 본질은 “책 목록 정리”가 아니라,

독서 데이터를 지식 자산으로 전환하는 개인 시스템 구축

입니다.

앞으로는 이 데이터 위에서

Goodreads를 대체하는 것이 목표가 아니라, 나의 취향과 루틴에 최적화된 ‘개인 Goodreads’를 만드는 것이 목표라면, Obsidian + AI 에이전트 조합은 생각보다 훨씬 강력합니다.


부록: 이번 구축에서 중요했던 원칙

  1. 데이터는 먼저 모으고, 그다음 정제한다.
  2. 분류 체계는 작게 시작해서 점진 확장한다.
  3. 자동화 + 수동 큐레이션을 혼합한다.
  4. 상태(읽는중/완독/DNF)가 쌓여야 독서가 자산이 된다.
  5. 시스템은 “내가 귀찮지 않게” 설계해야 오래 간다.