나만의 AI Goodreads 구축기: 알라딘·리디·오프라인 서재를 하나로 묶다
책을 좋아하는 사람이라면 한 번쯤 이런 문제를 겪습니다.
온라인 서점 구매내역, 전자책 서재, 오프라인에서 직접 산 책, 읽기 상태 메모가 모두 흩어져 있어서 “내가 뭘 읽었고, 뭘 읽는 중이고, 뭘 다음에 읽을지”가 흐릿해지는 문제 말입니다.
이번에 저는 개인 AI 에이전트(시도)와 함께, 이 흩어진 데이터를 하나의 지식 시스템으로 통합했습니다. 목표는 간단했습니다.
“내 서재를 데이터베이스로 만들고, 결국 나만의 Goodreads처럼 운영하자.”
1) 시작: 데이터 소스 통합
초기 데이터는 3가지였습니다.
- 알라딘 구매내역
- 리디 내 서재
- 오프라인 구매 기록 (예: 알라딘 중고서점, 교보문고)
먼저 알라딘 내역을 CSV로 추출하고, 리디 서재도 별도 목록으로 정리한 뒤, 이를 합쳐 library_master.csv 형태의 통합 마스터를 만들었습니다. 여기에 오프라인 구매를 계속 누적하면서 실제 보유 서재에 가깝게 맞췄습니다.
2) 정제: 노이즈 제거와 제목 표준화
통합만으로는 충분하지 않았습니다. 실제 운영 가능한 라이브러리로 만들기 위해 다음 정제가 필요했습니다.
- 음반(CD/LP) 항목 제거
- 제목의
[중고]접두어 제거 - 어학 참고서(토익/중국어/일본어) 제외 규칙 적용
- 중복 및 유사 중복 점검
이 과정을 거치면서 “읽고 싶은/읽는” 도서 데이터만 남겨 관리 효율이 크게 올라갔습니다.
3) Obsidian 중심 지식 허브 전환
이 시스템의 핵심은 단순 CSV가 아니라 Obsidian 기반 지식 그래프입니다.
구조는 OpenClaw/Agents/Book/ 아래로 통일하고,
Books/책 개별 노트Authors/저자 허브Publishers/출판사 허브Dashboards/대시보드Projects/운영 문서Logs/자동화 로그
형태로 운영하게 만들었습니다.
책 노트는 자동 생성되며, 기본적으로 아래 정보를 포함합니다.
- 제목, 저자, 출판사, 출간일
- 보유 출처(알라딘/리디/오프라인)
- 간단 소개
- 연관 책 링크(
[[위키링크]])
결과적으로 Obsidian 그래프에서 책-저자-출판사가 유기적으로 연결됩니다.
4) 메타데이터 강화: 알라딘 기반 보정 + 수동 큐레이션
자동 수집만으로는 저자 표기/출판사 표기가 엇갈리는 문제가 남았습니다.
예를 들어,
- “레이 달리오” vs “Ray Dalio”
- 시리즈형/매거진형 제목의 검색 난이도
이를 해결하기 위해 1) 알라딘 검색 기반 자동 보정 라운드, 2) 남은 항목 수동 정밀 보정 을 진행했습니다.
최종적으로 누락 필드를 메우고, 저자/출판사 허브를 재생성해 그래프 품질을 끌어올렸습니다.
5) 도서관 분류 체계 도입
단순 목록을 넘어, 실제 사서처럼 분류 체계를 넣었습니다.
예시 코드:
C100경영·리더십·조직C200디자인·브랜딩C510SF·판타지·장르C700매거진·정기간행물C900기타/보류
각 책 노트에 class_code, class_name, format, source를 기록하고, 주제별 인덱스를 생성해 탐색성을 높였습니다.
6) Goodreads 모드: 읽기 상태를 데이터로 관리
가장 만족도가 높았던 변화는 읽기 상태 체계였습니다.
reading_state 기준:
want_to_buy(사고싶음)unread(미독)reading(읽는중)finished(완독)rereading(재독중)dnf(중도하차)on_hold(보류)
추가 필드:
read_countstarted_atfirst_read_atlast_read_atratingreviewdnf_reason
즉, 이제는 “읽는 중”이라고 말하면 상태가 업데이트되고, “다 읽었어”라고 말하면 완독 이력과 독서 히스토리가 쌓입니다.
7) 운영 방식: 대화 한 줄로 기록 자동화
운영 경험상 중요한 건 복잡한 UI가 아니라 입력 마찰 최소화였습니다.
- “더 송라이터스 읽는 중, 78페이지까지”
- “비범한 평범 읽는 중”
- “이 책 사고 싶어”
이런 자연어 입력을 구조화 데이터로 바꿔주는 것이 핵심입니다.
마무리: 개인 서재에서 개인 지식 OS로
이번 세팅의 본질은 “책 목록 정리”가 아니라,
독서 데이터를 지식 자산으로 전환하는 개인 시스템 구축
입니다.
앞으로는 이 데이터 위에서
- 주간 독서 리포트,
- 완독률 분석,
- 재독 추천,
- 구매 우선순위 추천 까지 확장할 수 있습니다.
Goodreads를 대체하는 것이 목표가 아니라, 나의 취향과 루틴에 최적화된 ‘개인 Goodreads’를 만드는 것이 목표라면, Obsidian + AI 에이전트 조합은 생각보다 훨씬 강력합니다.
부록: 이번 구축에서 중요했던 원칙
- 데이터는 먼저 모으고, 그다음 정제한다.
- 분류 체계는 작게 시작해서 점진 확장한다.
- 자동화 + 수동 큐레이션을 혼합한다.
- 상태(읽는중/완독/DNF)가 쌓여야 독서가 자산이 된다.
- 시스템은 “내가 귀찮지 않게” 설계해야 오래 간다.