전문가용 시작
이 매뉴얼은 숏폼을 만들어 봤거나 영상 파이프라인을 다뤄 봤고, 터미널에서 ffmpeg나 yt-dlp를 만져 봤고, Claude Code 또는 Codex로 작업해 본 적 있는 독자를 가정합니다. Codex 이미지 생성이나 Whisper 내부를 외워 둘 필요는 없습니다. 두 트랙이 어떻게 갈리는지, 게이트가 어디 박히는지는 다음 섹션들에서 풀어냅니다.
여기서 다루는 것은 명령 레퍼런스가 아니라 “왜 이 모양인지”입니다. 뼈대가 왜 이렇게 잡혔는지 한 번 통과한 다음 architecture로 넘어가야 그 뒤 tracks와 verification이 의미 있게 읽힙니다. scene-studio는 외부 도구 의존이 가장 많은 제품이라, prerequisites가 다른 base보다 무겁다는 점을 미리 짚어 둡니다.
풀려는 문제 한 줄
섹션 제목: “풀려는 문제 한 줄”AI에게 숏폼을 맡기면 한 컷은 멀쩡하게 나옵니다. 문제는 그 다음입니다. AI가 한 번에 완성품을 뱉으면 컷 길이가 들쭉날쭉하고, 후크가 약하고, 리믹스에서 저작권 라벨을 무시하고, 이미지 생성이 느려 한 편에 한 시간씩 걸립니다. scene-studio는 그 자리마다 게이트와 정책을 박아둔 출발점입니다.
두 트랙
섹션 제목: “두 트랙”같은 채널에서 두 트랙을 공존 운영합니다. 진입점만 갈리고, 공유 자산(caption-styling, publish-meta, pipeline-performance, global-virality, approval-gate, brief-intake, publish-copywriter)을 재활용합니다.
- 생성형 (
scene-flow-orchestrator) — 자유 텍스트 요건에서 기획, 장면, 이미지(Codex), 영상(ffmpeg)으로. 게이트 4개(A 기획, B-1 장면, B-2 이미지, C 영상)와 발행. - 리믹스 (
remix-flow-orchestrator) — 원본 영상 URL에서 수집(yt-dlp), 분석(Whisper와 hook), 자동 편집으로. 게이트 3개(A 분석, B 편집)와 발행.
트리거는 입력으로 갈립니다. URL이 첨부되면 리믹스, “오리지널”이나 “캐릭터”면 생성형입니다. 모호하면(예: “숏폼 만들어줘”만) 추측하지 않고 멈춰서 묻습니다. 두 트랙의 상세는 tracks에서 봅니다.
승인 게이트가 진짜다
섹션 제목: “승인 게이트가 진짜다”AI가 한 번에 완성품을 만드는 흐름이 아닙니다. 각 phase가 승인 게이트에서 멈추고, 사람이 승인하거나 수정하거나 롤백합니다. 산출물은 채팅이 아니라 _workspace/에 파일로 남기 때문에, 세션이 끊겨도 각 *.meta.json의 status로 정확한 자리를 복원합니다.
게이트 철학을 깨지 않으면서 사람 대기를 줄이는 자리가 fast-preview 모드입니다. preview 모드에서는 기획 단계 게이트(A, B-1, B-2)를 자동 통과하고 영상 초안까지 한 번에 달린 다음, 사람은 중간 JSON이 아니라 실제 영상을 Gate C에서 한 번만 검토합니다. 게이트 산출물은 그대로 _workspace/에 남아 어느 단계로든 롤백할 수 있고, 자동 발행 금지는 그대로입니다.
라이선스 게이트는 리믹스에 강제
섹션 제목: “라이선스 게이트는 리믹스에 강제”리믹스 트랙에는 license-policy L2가 모든 단계에 박혀 있습니다. 라이선스 라벨 검증, Fair Use 30% 이하, 변환 의무 세 개 이상, 출처 자동 표기, copyright claim 자동 차단. 라이선스 미명시 원본은 진행을 거부합니다. 사용자가 명시로 책임을 수락한 자리(license_responsibility.json)만 우회 경로입니다. 생성형 트랙은 원본을 안 받으므로 이 게이트가 없습니다.
template filling, 자유 시나리오가 아니다
섹션 제목: “template filling, 자유 시나리오가 아니다”생성형 트랙은 검증된 5 구조(problem_twist_solution, listicle, story_arc, curiosity_gap, transformation) 중 하나의 슬롯을 채웁니다. 자유 시나리오는 AI-smell로 흐르기 때문에 금지입니다. scene type(hook, beat, cta)이 다운스트림 분기 키가 됩니다. 리믹스는 다릅니다. 원본 시간축이 정답이고, 새 시나리오를 짜지 않고 원본에서 hook을 발견해 재가공합니다. 5 구조는 리믹스에 적용하지 않습니다.
속도는 코드, 바이브가 아니다
섹션 제목: “속도는 코드, 바이브가 아니다”pipeline-performance가 일곱 정책을 강제합니다. preview/final 2단, 병렬 Codex, 해시 캐시, ffmpeg single-pass, per-step timings, 4~6 컷 예산, preview용 빠른 이미지 백엔드. 목표는 1편 20분, 시리즈 2편부터 12분입니다. Codex CLI 호출은 image-director 한 곳에만 모읍니다(S7). 여러 에이전트가 부르면 스타일이 깨지고 비용이 샙니다.
자동 발행은 하지 않는다
섹션 제목: “자동 발행은 하지 않는다”publish-copywriter가 publish.md 발행 메타만 만듭니다. 플랫폼 업로드는 사용자가 직접 합니다(S8). 어느 트랙에서도 자동 발행은 절대 금지입니다.
자동화 진입점은 한 곳을 가리킨다
섹션 제목: “자동화 진입점은 한 곳을 가리킨다”.claude/agents/와 .claude/skills/는 Claude Code용 저장 위치이고, AGENTS.md는 Codex용 진입점입니다. 둘 다 AI_AUTOMATION.md를 읽습니다. 트랙 라우팅, scene type 스펙, license-policy 레벨, 보안 기준선 S1~S8이 그 한 파일에 모여 있어, 어느 런타임에서 작업하든 phase와 산출물 계약이 같습니다.
지금 빠져 있는 것
섹션 제목: “지금 빠져 있는 것”이 base는 솔직히 미완성인 부분이 있습니다. 매뉴얼과 랜딩은 public이지만, 템플릿 자체는 상업 라이선스 모델인데 결제 흐름이 아직 안 붙었습니다. COMMERCIAL-LICENSE.md도 초안 상태입니다. fork 직후 _workspace/는 골격뿐이라, 이 매뉴얼이 가르치는 건 그 빈 골격이 두 트랙 phase 흐름을 거치며 어떻게 채워지는지의 절차입니다.
이 매뉴얼이 가정하지 않는 것
섹션 제목: “이 매뉴얼이 가정하지 않는 것”OS별 설치 분기, ffmpeg와 Whisper와 Codex 일반 사용법, 플랫폼 업로드 화면, 저작권법 일반론은 여기 없습니다. 그쪽이 필요하면 비개발자용 매뉴얼을 봅니다.
다음 섹션은 architecture입니다. 8 에이전트가 두 트랙 phase에서 어떻게 맞물리는지, 영상 여러 편이 어떻게 폴더로 격리되는지를 다이어그램 두 개와 함께 봅니다.