AI가 뉴스를 수집·재작성하고, MagicLight 엔진으로 영상을 자동 생성해
썸페이지에 커머스 CTA와 함께 자동 배포하는 완전 자동화 콘텐츠 파이프라인
CHATRO AI 뉴스 자동화 + 영상 생성 파이프라인의 목적, 범위, 핵심 가치
| 모듈 | 기능 | 우선순위 | Phase |
|---|---|---|---|
| 뉴스 수집 | RSS·공공데이터 메타 수집, 중복 제거, 업종 분류 | P0 핵심 | MVP |
| AI 재작성 | LLM 기반 4가지 템플릿 원본형 기사 생성 | P0 핵심 | MVP |
| MagicLight 영상 | 기사→스크립트→영상 자동 변환 (쇼츠 우선) | P0 핵심 | MVP |
| 썸페이지 게시 | 기사+영상 자동 업데이트, 출처 표시 | P0 핵심 | MVP |
| 커머스 CTA | 기사-상품 자동 매칭 & CTA 버튼 삽입 | P1 | MVP |
| 승인 워크플로 | 관리자 검수 → 발행 승인 흐름 | P1 | MVP |
| SNS 자동발행 | 인스타·유튜브 쇼츠 자동 업로드 | P2 | Phase 2 |
| 고급 분석 | 영상 시청 시간·전환 퍼널 분석 | P2 | Phase 2 |
전체 기술 아키텍처와 서비스 컴포넌트 구성
뉴스 수집부터 LLM 재작성까지 상세 기능 명세
| 소스 유형 | 예시 | 수집 방식 | 수집 항목 | 법적 근거 |
|---|---|---|---|---|
| 정부·공공기관 보도자료 | 문화부, 중기부, 식약처 | 공공데이터포털 API | 제목·링크·날짜·요약 | 공공저작물 CC |
| BIGKinds 메타데이터 | 한국언론진흥재단 | 공개 API | 제목·링크·키워드·분류 | 연구·교육 허용 |
| 기업 공식 뉴스룸 | 고객사 자체 RSS | RSS 파싱 | 제목·링크·날짜 | 고객사 자체 제공 |
| 산업협회·단체 발표 | 뷰티협회, 프랜차이즈협회 | 공식 RSS | 제목·링크·날짜 | 공개 배포 |
| 제휴 언론사 RSS | 계약 언론사 | 제휴 RSS | 제목·링크·날짜만 | 제휴 계약 필요 |
업계 소식을 고객 브랜드 관점으로 간결하게 요약. SEO 최적화. 300~500자.
트렌드를 분석해 고객 비즈니스에 미치는 영향 설명. 전문성 강화. 600~900자.
뉴스 내용과 연관된 상품을 자연스럽게 소개. 구매 전환 최적화. 400~700자.
고객의 지역·업종에 맞춘 로컬 관점 기사. 지역 검색 SEO 강화. 400~600자.
기사→스크립트→스토리보드→영상 자동 변환 파이프라인 상세 명세
magiclight.ai · 텍스트→영상 AI 생성 엔진 · 최대 30~50분 영상
| 유형 | 해상도 | 비율 | 길이 | 스타일 | 용도 |
|---|---|---|---|---|---|
| 뉴스 영상 | 1080p | 16:9 | 30~90초 | news | 썸페이지 메인 |
| SNS 쇼츠 | 1080p | 9:16 | 15~60초 | vlog | 인스타·유튜브 |
| 상품 소개 | 1080p | 1:1 or 16:9 | 60~120초 | ad | 상품 페이지 |
| 교육/정보 | 1080p | 16:9 | 2~10분 | edu | 유튜브 채널 |
| 롱폼 콘텐츠 | 1080p | 16:9 | 30~50분 | news | 유튜브 전용 |
PostgreSQL 테이블 설계 — 뉴스 엔진 관련 핵심 테이블
NestJS 기반 CHATRO 내부 API 엔드포인트 목록
AI 뉴스 엔진 관련 어드민 화면 기능 정의
저작권·표절 방지를 위한 기술·운영 원칙
| 원칙 | 기술 구현 | 검증 방법 |
|---|---|---|
| 메타데이터만 수집 | RSS 파서에서 content 필드 제거, 제목/URL/날짜/키워드만 저장 | DB 스키마에 전문 저장 컬럼 없음 확인 |
| 출처 링크 필수 표시 | 모든 기사 하단에 원본 소스 링크 자동 삽입 (DB NOT NULL 강제) | 발행 전 source_url 유효성 자동 검사 |
| AI 생성 표시 의무 | 모든 AI 생성 기사에 "AI 생성 기사" 배지 자동 삽입 | 발행 API에 ai_generated 플래그 필수 |
| 원문 유사도 검사 | 생성된 기사 원본과 유사도 40% 초과 시 자동 재생성 요청 | 발행 전 similarity check 자동 실행 |
| 공개 소스 우선 | 공공저작물·CC 라이선스 소스에 높은 우선순위 부여 | 소스 등록 시 법적 근거 필드 필수 |
| 제휴 계약 관리 | 제휴 언론사 RSS 사용 시 계약서 사전 체결 필수 | 계약 만료일 모니터링 알림 |
AI 뉴스 엔진 & 영상 생성 시스템의 핵심 측정 지표
| 지표 | MVP 목표 | Phase 2 목표 |
|---|---|---|
| 일 뉴스 수집 건수 | 200건+ | 500건+ |
| 중복 제거율 | 30%↑ 제거 | 40%↑ 제거 |
| 재작성 성공률 | 95%+ | 98%+ |
| 기사 생성 속도 | 건당 <30초 | 건당 <15초 |
| 영상 생성 성공률 | 90%+ | 95%+ |
| 영상 생성 시간 | <5분 (쇼츠) | <3분 |
| 지표 | MVP 목표 | Phase 2 목표 |
|---|---|---|
| 기사 클릭률 (CTR) | 3%+ | 5%+ |
| 영상 시청 완료율 | 40%+ | 60%+ |
| 기사→상품 전환율 | 1%+ | 2.5%+ |
| 페이지 체류시간 | 2분30초+ | 4분+ |
| 재방문율 | 20%+ | 35%+ |
| 일 썸페이지 생산량 | 30개 | 60개 |
| 비용 항목 | 단위 | 예상 단가 | 월 목표 한도 |
|---|---|---|---|
| LLM (GPT-4o) 재작성 | 1,000 토큰 | $0.005 | 월 $50 이하 |
| MagicLight 영상 생성 | 영상 1개 (60초) | 협의 필요 | 별도 협의 |
| S3 영상 저장 | GB/월 | $0.023 | 월 $20 이하 |
| Redis 캐시 | 인스턴스 | $15/월 | 고정 |
Phase별 개발 계획 & 우선순위
| 주차 | 작업 | 담당 | 산출물 |
|---|---|---|---|
| 1~2주 | 개발 환경 구축, DB 스키마 마이그레이션, 기본 API 구조 | 백엔드 리드 | DB 스키마, API 보일러플레이트 |
| 2~3주 | 뉴스 수집 스케줄러, 중복 제거 로직, 업종 분류 | 백엔드 | 뉴스 수집 서비스 v1 |
| 3~4주 | LLM 재작성 파이프라인, 4가지 템플릿 프롬프트 | AI 엔지니어 | 재작성 워커 v1 |
| 4~5주 | MagicLight API 연동, 영상 생성 워커, 웹훅 | 백엔드 + AI | 영상 생성 파이프라인 v1 |
| 5~6주 | 어드민 관리 화면, 썸페이지 자동 업데이트, 테스트 | 프론트엔드 | 어드민 + 썸페이지 통합 완료 |
CHATRO AI 뉴스 엔진 & 영상 생성 시스템 구현을 위한 기술 선택
| 프레임워크 | Next.js 14+ (App Router) |
| 스타일링 | Tailwind CSS + shadcn/ui |
| 상태 관리 | Zustand + React Query |
| 차트 | Recharts / Chart.js |
| 에디터 | Tiptap (기사 수정용) |
| 비디오 | Video.js (플레이어) |
| API 서버 | NestJS (Node.js) |
| DB | PostgreSQL 16+ |
| ORM | Prisma / TypeORM |
| 캐시/큐 | Redis + BullMQ |
| 파일 저장 | AWS S3 / Cloudflare R2 |
| 인증 | JWT + NextAuth.js |
| LLM (재작성) | OpenAI GPT-4o (주) / Claude 3.5 (보조) |
| 영상 생성 | MagicLight AI (주) / Runway Gen-3 (보조) |
| RSS 파싱 | rss-parser (npm) |
| 유사도 검사 | SimHash 라이브러리 |
| 번역/NLP | OpenAI Embeddings |
| 배포 | Vercel (프론트) + AWS EC2/ECS (백엔드) |
| CDN | Cloudflare |
| 모니터링 | Sentry + Datadog |
| 로그 | CloudWatch / Loki |
| CI/CD | GitHub Actions |
MVP 개발 시 예상되는 주요 리스크와 미티게이션 전략
| 리스크 | 발생 가능성 | 영향도 | 대응 방안 |
|---|---|---|---|
| MagicLight API 파트너십 지연 | 높음 | 높음 | Runway Gen-3 또는 D-ID API로 대체 시작, MagicLight 병행 협의 |
| LLM 원문 유사도 과다 (저작권) | 중간 | 높음 | 유사도 40% 초과 시 자동 재생성, 법무 검토 프로세스 추가 |
| 영상 생성 비용 초과 | 중간 | 중간 | 월 비용 한도 알림, 쇼츠 우선 전략, 수익성 높은 고객 우선 배치 |
| RSS 소스 변경/차단 | 중간 | 낮음 | 소스 다양화 (5개 이상), 실패 시 자동 알림 & 대체 소스 전환 |
| MagicLight 영상 품질 불일치 | 중간 | 중간 | 관리자 검수 필수화, AI 자동 품질 점수 시스템 (Phase 2) |
| PostgreSQL 스키마 마이그레이션 오류 | 낮음 | 높음 | Prisma 마이그레이션 + 스테이징 환경 충분한 테스트 |