나만의 AI Goodreads 구축기: 알라딘·리디·오프라인 서재를 하나로 묶다

21 Feb 2026

나만의 AI Goodreads 구축기: 알라딘·리디·오프라인 서재를 하나로 묶다

책을 좋아하는 사람이라면 한 번쯤 이런 문제를 겪습니다.
온라인 서점 구매내역, 전자책 서재, 오프라인에서 직접 산 책, 읽기 상태 메모가 모두 흩어져 있어서 “내가 뭘 읽었고, 뭘 읽는 중이고, 뭘 다음에 읽을지”가 흐릿해지는 문제 말입니다.

이번에 저는 개인 AI 에이전트(시도)와 함께, 이 흩어진 데이터를 하나의 지식 시스템으로 통합했습니다. 목표는 간단했습니다.

“내 서재를 데이터베이스로 만들고, 결국 나만의 Goodreads처럼 운영하자.”

1) 시작: 데이터 소스 통합

초기 데이터는 3가지였습니다.

알라딘 구매내역
리디 내 서재
오프라인 구매 기록 (예: 알라딘 중고서점, 교보문고)

먼저 알라딘 내역을 CSV로 추출하고, 리디 서재도 별도 목록으로 정리한 뒤, 이를 합쳐 library_master.csv 형태의 통합 마스터를 만들었습니다. 여기에 오프라인 구매를 계속 누적하면서 실제 보유 서재에 가깝게 맞췄습니다.

2) 정제: 노이즈 제거와 제목 표준화

통합만으로는 충분하지 않았습니다. 실제 운영 가능한 라이브러리로 만들기 위해 다음 정제가 필요했습니다.

음반(CD/LP) 항목 제거
제목의 [중고] 접두어 제거
어학 참고서(토익/중국어/일본어) 제외 규칙 적용
중복 및 유사 중복 점검

이 과정을 거치면서 “읽고 싶은/읽는” 도서 데이터만 남겨 관리 효율이 크게 올라갔습니다.

3) Obsidian 중심 지식 허브 전환

이 시스템의 핵심은 단순 CSV가 아니라 Obsidian 기반 지식 그래프입니다.

구조는 OpenClaw/Agents/Book/ 아래로 통일하고,

Books/ 책 개별 노트
Authors/ 저자 허브
Publishers/ 출판사 허브
Dashboards/ 대시보드
Projects/ 운영 문서
Logs/ 자동화 로그

형태로 운영하게 만들었습니다.

책 노트는 자동 생성되며, 기본적으로 아래 정보를 포함합니다.

제목, 저자, 출판사, 출간일
보유 출처(알라딘/리디/오프라인)
간단 소개
연관 책 링크([[위키링크]])

결과적으로 Obsidian 그래프에서 책-저자-출판사가 유기적으로 연결됩니다.

4) 메타데이터 강화: 알라딘 기반 보정 + 수동 큐레이션

자동 수집만으로는 저자 표기/출판사 표기가 엇갈리는 문제가 남았습니다.

예를 들어,

“레이 달리오” vs “Ray Dalio”
시리즈형/매거진형 제목의 검색 난이도

이를 해결하기 위해 1) 알라딘 검색 기반 자동 보정 라운드, 2) 남은 항목 수동 정밀 보정 을 진행했습니다.

최종적으로 누락 필드를 메우고, 저자/출판사 허브를 재생성해 그래프 품질을 끌어올렸습니다.

5) 도서관 분류 체계 도입

단순 목록을 넘어, 실제 사서처럼 분류 체계를 넣었습니다.

예시 코드:

C100 경영·리더십·조직
C200 디자인·브랜딩
C510 SF·판타지·장르
C700 매거진·정기간행물
C900 기타/보류

각 책 노트에 class_code, class_name, format, source를 기록하고, 주제별 인덱스를 생성해 탐색성을 높였습니다.

6) Goodreads 모드: 읽기 상태를 데이터로 관리

가장 만족도가 높았던 변화는 읽기 상태 체계였습니다.

reading_state 기준:

want_to_buy (사고싶음)
unread (미독)
reading (읽는중)
finished (완독)
rereading (재독중)
dnf (중도하차)
on_hold (보류)

추가 필드:

read_count
started_at
first_read_at
last_read_at
rating
review
dnf_reason

즉, 이제는 “읽는 중”이라고 말하면 상태가 업데이트되고, “다 읽었어”라고 말하면 완독 이력과 독서 히스토리가 쌓입니다.

7) 운영 방식: 대화 한 줄로 기록 자동화

운영 경험상 중요한 건 복잡한 UI가 아니라 입력 마찰 최소화였습니다.

“더 송라이터스 읽는 중, 78페이지까지”
“비범한 평범 읽는 중”
“이 책 사고 싶어”

이런 자연어 입력을 구조화 데이터로 바꿔주는 것이 핵심입니다.

마무리: 개인 서재에서 개인 지식 OS로

이번 세팅의 본질은 “책 목록 정리”가 아니라,

독서 데이터를 지식 자산으로 전환하는 개인 시스템 구축

입니다.

앞으로는 이 데이터 위에서

주간 독서 리포트,
완독률 분석,
재독 추천,
구매 우선순위 추천 까지 확장할 수 있습니다.

Goodreads를 대체하는 것이 목표가 아니라, 나의 취향과 루틴에 최적화된 ‘개인 Goodreads’를 만드는 것이 목표라면, Obsidian + AI 에이전트 조합은 생각보다 훨씬 강력합니다.

부록: 이번 구축에서 중요했던 원칙

데이터는 먼저 모으고, 그다음 정제한다.
분류 체계는 작게 시작해서 점진 확장한다.
자동화 + 수동 큐레이션을 혼합한다.
상태(읽는중/완독/DNF)가 쌓여야 독서가 자산이 된다.
시스템은 “내가 귀찮지 않게” 설계해야 오래 간다.