研究总结 日志 原文

《南唐书》服饰内容提取 — 操作日志

操作时间:2026-05-04 操作者:AI Subagent


操作流程

Step 1: 读取参考模板

读取3个模板文件:

Step 2: 统计文件基本信息

$ wc -l /root/.openclaw/workspace/载记/南唐书.txt
287 行
$ wc -c /root/.openclaw/workspace/载记/南唐书.txt
225,289 字节

文件规模较小(287行),为纪传体史书,服饰内容分散于本纪、列传中。

Step 3: 多轮grep提取

第1轮:衣

grep -n "衣" 南唐书.txt
→ 命中约80行(含大量重复行,因每行极长)

主要命中:行29, 30, 34, 42, 55, 57, 68, 72, 81, 89, 97, 120, 124, 127, 128, 162, 166, 168, 170, 175, 176, 177, 178, 185, 194, 196, 203, 209, 214, 227, 234, 235, 236, 247, 266, 271, 278, 280, 282

第2轮:裳/袍/衫/裙/袄/裤/袜/鞋/履/靴

grep -n "裳\|袍\|衫\|裙\|袄\|裤\|袜\|鞋\|履\|靴" 南唐书.txt
→ 命中行:34, 68, 89, 120, 128, 176, 178, 194, 203, 236, 247, 278, 280

关键命中:

第3轮:冠/帽/巾/帻

grep -n "冠\|帽\|巾\|帻" 南唐书.txt
→ 命中行:42, 82, 89, 97, 110, 120, 127, 136, 143, 160, 162, 169, 170, 175, 176, 177, 178, 186, 194, 207, 208, 227, 236, 271, 278, 280, 282

关键命中:

第4轮:笄/簪/钗/环/佩/带/绶/笏

grep -n "笄\|簪\|钗\|环\|佩\|带\|绶\|笏" 南唐书.txt
→ 命中行:29, 30, 31, 34, 42, 55, 57, 59, 68, 72, 80, 81, 82, 89, 96, 98, 99, 104, 106, 107, 110, 112, 120, 122, 123, 124, 126, 127, 136, 140, 141, 143, 144, 146, 147, 153, 155, 156, 157, 158, 160, 161, 162, 166, 167, 168, 169, 170, 175, 176, 177, 178, 185, 186, 187, 192, 194, 196, 198, 199, 203, 207, 208, 209, 214, 215, 227, 234, 235, 236, 241, 242, 247, 248, 264, 266, 271, 278, 280, 282

说明:带、佩等字命中极多,因"带"字在官职名、地名中也频繁出现。实际服饰相关:

第5轮:裘/葛/麻/丝/绢/锦/绮/绫/罗/缎/纱/绸/布/棉/绒/褐/毡

grep -n "裘\|葛\|麻\|丝\|绢\|锦\|绮\|绫\|罗\|缎\|纱\|绸\|布\|棉\|绒\|褐\|毡" 南唐书.txt
→ 命中行:29, 30, 31, 34, 42, 55, 57, 59, 68, 72, 81, 89, 96, 97, 98, 99, 104, 106, 107, 110, 112, 120, 122, 123, 124, 126, 127, 128, 136, 140, 141, 143, 144, 146, 147, 153, 155, 156, 157, 158, 160, 161, 162, 166, 167, 168, 169, 170, 175, 176, 177, 178, 185, 186, 187, 192, 194, 196, 198, 199, 203, 207, 208, 209, 214, 215, 227, 234, 235, 236, 241, 242, 247, 248, 264, 266, 271, 278, 280, 282

说明:锦、绮、罗、褐、布等字在长文中出现极多。实际服饰面料相关:

第6轮:染/绣/织/蚕/茧/帛/素/缟/絺/绤/黻/黼

grep -n "染\|绣\|织\|蚕\|茧\|帛\|素\|缟\|絺\|绤\|黻\|黼" 南唐书.txt
→ 命中行:29, 30, 31, 34, 42, 55, 57, 59, 68, 72, 80, 81, 82, 89, 96, 97, 98, 99, 104, 106, 107, 110, 112, 120, 122, 123, 124, 126, 127, 128, 136, 140, 141, 143, 144, 146, 147, 153, 155, 156, 157, 158, 160, 161, 162, 166, 167, 168, 169, 170, 175, 176, 177, 178, 185, 186, 187, 192, 194, 196, 198, 199, 203, 207, 208, 209, 214, 215, 227, 234, 235, 236, 241, 242, 247, 248, 264, 266, 271, 278, 280, 282

实际服饰相关:

第7轮:章服/服色/品色/舆服/冠服/赐服/赐紫/服紫/服绯/补服/龙袍/凤冠/霞帔/抹额/璎珞/禁步/玉佩/鱼袋

grep -n "章服\|服色\|品色\|舆服\|冠服\|赐服\|赐紫\|借紫\|服紫\|服绯\|补服\|龙袍\|凤冠\|霞帔\|抹额\|璎珞\|禁步\|玉佩\|鱼袋" 南唐书.txt
→ 命中行:266(碧霞**帔**,帔通帔子)

说明:南唐书为正史,较少使用这些专有名词。

第8轮:头戴/身穿/脚穿/着衣/穿衣/衣青/衣朱/衣黄/衣白/衣黑/衣玄

grep -n "头戴\|身穿\|脚穿\|着衣\|穿衣\|衣青\|衣朱\|衣黄\|衣白\|衣黑\|衣玄" 南唐书.txt
→ 无命中

sed提取上下文

对关键行号使用sed提取上下文,主要提取范围:


筛选过程

去除噪音

以下类型被过滤:

  1. 纯人名/地名中含"衣""带"等字的行(如"陈衣"为人名用字)
  2. 官职名中含"带"的行(如"带御器械")
  3. 与服饰无关的"布衣"用法(如"一布衣耳"为比喻义)
  4. "戈甲"虽与军戎相关,但非日常服饰,仅在必要时引用

保留段落分类

最终保留的服饰内容分为8大类:

  1. 冕服制度(衮冕、紫袍、斩缞、墨缞、素服)
  2. 衣裳描写(高髻纤裳、锦袍、弊衣、单褐、僧服)
  3. 织物面料(锦绮、绫绢、紬缣、葛、褐、罗纨)
  4. 首饰配饰(玉环、金带、簪珥、金紫、碧霞帔)
  5. 佛教服饰(僧伽帽、袈裟、镂金绛罗)
  6. 外交赠赐(织物贡赐记录)
  7. 染色机构(染院使)
  8. 政治象征(赐服、朝服殉国)

对抗式学术审查

审查项 结果
总结中每条原文是否存在于grep结果中? ✅ 已逐一核实
是否存在捏造的服饰内容? ❌ 无捏造
行号引用是否准确? ✅ 已核对
是否将非服饰内容误入? ⚠️ "戈甲"在军事语境中出现,已标注为军戎相关而非日常服饰
模板内容是否混入? ❌ 无混入,全部据实撰写

保存文件

文件 路径 大小
总结 载记output/南唐书/南唐书_总结.md ~3.7KB
日志 载记output/南唐书/南唐书_日志.md 本文件
原文提取 载记output/南唐书/南唐书_原文提取.md ~10KB

备注