# Casting-Workflow

**Repository Path**: lfslfs/Casting-Workflow

## Basic Information

- **Project Name**: Casting-Workflow
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-06-26
- **Last Updated**: 2026-06-26

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 熔铸仿写全术，由初阶至短制，纲目灿然，靡有阙遗。

## 安装 (一次)

```bash
pip install -r requirements.txt
```

> 仅依赖 jieba 分词库，其余全为标准库。首次运行 fusion/clean 时会自动加载分词模型。

## 文件结构

```
熔铸版/
├── README.md                    ← 本文件
├── SKILL.md                     ← 方法论+规则 (给LLM读的)
├── requirements.txt             ← pip依赖清单
├── .gitignore                   ← 版本控制（禁止追踪产出文件）
│
├── run_pipeline.py              ← 核心入口: 12阶段管道
├── check_story.py               ← 质量检查: 9项爆款规则自动检测
│
├── prompt/                       ← 提示词库 (固定不可替代)
├── MAPPING.md                ← 文件映射表
├── prompt_inspiration.md     ← 创意构思+灵感风暴
├── prompt_character.md       ← 人设生成
├── prompt_outline.md         ← 大纲体系 (含 FILE_SECTION: 概要/大纲/细纲)
├── prompt_opening.md         ← 黄金开篇
├── prompt_writing.md         ← 写作规范
├── prompt_polish.md          ← 优化润色
├── prompt_expand.md          ← 续写扩写 (含 FILE_SECTION: 续写/扩写)
├── prompt_tools.md           ← 辅助工具
├── prompt_skill.md           ← 全流程 Skill
│
│
├── corpus/                      ← 语料库 (固定不可替代)
│   ├── 01_现代言情/              ← 都市/校园/职场
│   ├── 02_总裁豪门/              ← 霸总/豪门恩怨
│   ├── 03_重生复仇/              ← 重生/复仇/逆袭
│   ├── 04_穿越架空/              ← 穿越/架空历史
│   ├── 05_古代言情/              ← 宫斗/宅斗/古言 ← 现有122篇
│   ├── 06_玄幻仙侠/              ← 修仙/玄幻
│   ├── 07_悬疑惊悚/              ← 悬疑/灵异
│   ├── 08_甜宠虐恋/              ← 甜宠/虐文
│   └── 09_种田经商/              ← 种田/经商/美食
│
├── tools/                       ← 工具脚本 (固定不可替代)
│   ├── fusion.py                ← 指纹蒸馏: 5源文→类型公约数
│   ├── clean_commas.py          ← 后处理: 清理脏逗号
│   ├── inject_punctuation.py    ← 后处理: 按密度注入标点
│   └── audit.py                 ← 审计: 独创度+朱雀扫描
│
└── output/                      ← 所有生成产物 (临时，不入版本控制)
    └── (story.txt / *_llm_prompt.txt / fusion_context.txt 等)
```

### 三类文件定位

| 类型 | 目录 | 规则 |
|------|------|------|
| **源文件（固定不可替代）** | `run_pipeline.py` `check_story.py` `tools/` `prompt/` `corpus/` | 绝对不删，不能动位置 |
| **产出文件（临时生成）** | `output/` | 可随时清除，`.gitignore` 已忽略 |

## 使用流程

### Step 0: 准备语料

把同类型小说 `.txt` 放入对应分类目录。目前支持 9 个标准分类：

| 编号 | 分类 | 典型标签 |
|------|------|----------|
| 01 | 现代言情 | 都市/校园/职场 |
| 02 | 总裁豪门 | 霸总/豪门/契约 |
| 03 | 重生复仇 | 重生/复仇/逆袭/打脸 |
| 04 | 穿越架空 | 穿越/架空/异世 |
| 05 | 古代言情 | 宫斗/宅斗/古言/王爷/太子 |
| 06 | 玄幻仙侠 | 修仙/玄幻/仙侠 |
| 07 | 悬疑惊悚 | 悬疑/灵异/惊悚 |
| 08 | 甜宠虐恋 | 甜宠/虐文/追妻火葬场 |
| 09 | 种田经商 | 种田/经商/美食/科技兴国 |

每个分类下放 ≥5 篇 `.txt` 小说（管道默认选 5 篇做指纹互消，不足则取全部健康文件）。

### Step 1: 蒸馏指纹（管道运行）

```bash
python run_pipeline.py --category 05_古代言情
```

管道自动执行：

1. **扫描** — 从指定分类目录扫描所有 `.txt`
2. **筛选** — 剔除中文不足 500 字的损坏文件，随机选 5 篇健康源文
3. **蒸馏** — 提取每篇指纹（人物/情节/句式/高频词），5 份指纹取交集互消
4. **输出** — `output/fusion_context.txt`（LLM 生成用的完整上下文）

### Step 2: LLM 生成故事

将 `output/fusion_context.txt` 的全部内容**原封不动**复制给 LLM（Claude/GPT/DeepSeek 均可），LLM 据此生成一篇约 1000 字的原创短篇小说。

生成的故事保存为 `output/story.txt`。

### Step 3: 后处理

```bash
# 清理脏逗号（jieba 分词去除语法错误逗号）
python tools/clean_commas.py output/story.txt

# 注入标点密度（模拟番茄小说风格）
python tools/inject_punctuation.py output/story.txt --excl 0.15 --comma 1.2
```

| 参数 | 含义 | 默认值 |
|------|------|--------|
| `--excl` | 感叹号密度（每百字多少个！） | 0.15 |
| `--comma` | 逗号密度（每百字多少个，） | 1.2 |

### Step 4: 质量审计

```bash
# 爆款规则检查
python check_story.py output/story.txt

# 独创度审计（对比源文，确保 0 复制）
python tools/audit.py output/story.txt corpus/05_古代言情/*.txt
```

> 换分类只需改 `--category`：`01_现代言情` / `03_重生复仇` / `06_玄幻仙侠` ...

---

### 进阶: 分阶段创作（12 阶段提示词模式）

当需要对单个创作环节精细控制时，使用 `--stage` 切入指定阶段。

> **管道交叉**：蒸馏模式（无 `--stage`）和分阶段模式（有 `--stage`）共享 Step 1-2（扫描语料 + 蒸馏指纹）。区别仅在 Step 3：蒸馏模式输出 `fusion_context.txt`，分阶段模式加载提示词模板并输出 `{stage}_llm_prompt.txt`。

#### 基础用法

```bash
# 单阶段切入 → 输出 output/脑洞_llm_prompt.txt
python run_pipeline.py -s 脑洞 -c 05_古代言情

# 指定人设模板关键词
python run_pipeline.py -s 人设 -c 03_重生复仇 -t 黑莲花

# 交互式参数输入
python run_pipeline.py -s 开篇 -c 05_古代言情 --interactive
```

#### 链式传递（`--previous-output` / `-P`）

分阶段模式新增链式上下文传递，让后续阶段感知前序阶段的 LLM 输出，实现真正的流水线创作：

```bash
# Step 1: 脑洞 → 产出 output/脑洞_llm_prompt.txt (给LLM生成后保存为 output/脑洞_output.txt)
python run_pipeline.py -s 脑洞 -c 05_古代言情

# Step 2: 人设 ← 加载脑洞输出作为上下文
python run_pipeline.py -s 人设 -c 05_古代言情 -P output/脑洞_output.txt

# Step 3: 大纲 ← 加载人设输出
python run_pipeline.py -s 大纲 -c 05_古代言情 -P output/人设_output.txt

# ...以此类推，逐个阶段链式推进
```

> 管道也会自动推断：若 output/ 目录下存在 `{前阶段}_output.txt`，无需手动指定 `-P`，系统自动加载。每次运行重新扫描语料，但前序上下文保证了创作连续性。

完整 11 阶段：

| 序号 | 阶段 | 说明 | 对应提示词 |
|------|------|------|------------|
| 1 | 脑洞 | 创意构思/卖点/受众定位 | `prompt_inspiration.md` |
| 2 | 灵感风暴 | 书名/简介/黄金开局大纲/角色小传 | `prompt_inspiration.md` |
| 3 | 人设 | 角色设计/金手指/关系网 | `prompt_character.md` |
| 4 | 大纲 | 故事主线/情节点/高潮 | `prompt_outline.md` |
| 5 | 细纲 | 章节拆分/场次细化 | `prompt_outline.md` |
| 6 | 概要 | 200 字高度浓缩梗概 | `prompt_outline.md` |
| 7 | 开篇 | 黄金三章/三句法开头 | `prompt_opening.md` |
| 8 | 正文 | 对话密度/节奏/叙事感 | `prompt_writing.md` |
| 9 | 优化 | 角色归一化/拼接率质检 | `prompt_polish.md` |
| 10 | 润色 | 句式变化/用词多样性 | `prompt_polish.md` |
| 11 | 续写 | 情节延伸/伏笔展开 | `prompt_expand.md` |
| 12 | 扩写 | 细节铺陈/环境描写 | `prompt_expand.md` |

> 前 8 个阶段为核心生成链，后 4 个为增强处理。每个阶段的提示词均为聚合蒸馏版（保留全部反 AI 检测技巧）。

---

### 命令行参数速查

| 参数 | 简写 | 说明 | 示例 |
|------|------|------|------|
| `--category` | `-c` | 指定语料分类 | `-c 05_古代言情` |
| `--sample` | `-n` | 选几篇源文做指纹互消 | `-n 7` |
| `--stage` | `-s` | 切入指定创作阶段 | `-s 开篇` |
| `--template` | `-t` | 指定提示词模板关键词 | `-t 西瓜大法` |
| `--params` | `-p` | JSON 格式自定义参数 | `-p '{"核心卖点":"重生复仇"}'` |
| `--interactive` | — | 交互式输入创作参数 | `--interactive` |
| `--previous-output` | `-P` | 链式传递前序阶段输出 | `-P output/人设_output.txt` |

不带 `--stage` 即为默认全流程模式：扫描→选文→蒸馏→输出 `fusion_context.txt`。

## 为什么朱雀检测不到

5篇不同作者的指纹在交集运算中互消。剩下的"睁眼/背叛/复仇"不属于任何单一作者，属于类型本身。朱雀对输出做16字扫描 vs 全部5篇源文 → 0匹配。

## 常见问题

**Q: 需要API密钥吗？**
A: 不需要。全本地运行。jieba是免费开源库。

**Q: 怎么添加新分类？**
A: 在 `corpus/` 下新建目录（如 `10_奇幻言情/`），放入该类型 .txt 小说，管道自动识别。

**Q: 生成的故事朱雀分数多少？**
A: 取决于LLM和后处理质量。熔铸保证内容层100%原创(0复制)，标点密度靠inject_punctuation补偿。

## 致谢

感谢真诚、友善、团结、专业的 [LinuxDo 社区](https://linux.do/latest)，让我学到很多 AI 相关的知识和玩法。

> LinuxDo — 学 AI，上 L 站

## 许可

MIT