《六十种曲·双珠记》服饰提取日志

任务信息

项目 内容
输入文件 /home/z/my-project/upload/剧曲/剧曲/六十种曲双珠记.txt
输出目录 /home/z/my-project/upload/剧曲output/六十种曲双珠记/
输入文件行数 2049行
输出文件 总结.md、原文提取.md、日志.md

处理流程

第1步:文件概览

第2步:关键词词库

使用用户提供的服饰关键词词库:

衣裳冠带袍裘褐巾履屦绅袂裾襟裙幅弁冕簪珥佩环绮罗纱绢帛锦绣练絮布麻丝绸缎缯绫纨绡绶绂黼黻鹖帻帷帐幄旗旌旆纛

第3步:多轮grep提取

第1轮:宽泛搜索

第2轮:复合词精准搜索

第3轮:补充关键词搜索

第4步:噪音过滤

过滤规则

类型 示例 处理
曲牌名无实义 【锦堂月】【窣地锦裆】【锦衣香】 保留注记但不作为独立服饰条目
丝作比喻 丝纶、丝竹、如丝如纶 过滤
布作动词 布新条、布和风 过滤
罗作网义 罗网、罗钳吉网、天罗地网 过滤
练作练习 无此情况
絮作柳絮 柳絮飞、风中絮 过滤
帷/帐/幄作军帐 帷幄、传令帷幄 保留(军事服饰制度)
帏作母亲代称 慈帏 保留注记

过滤后有效条目

第5步:分类整理

按8大类别整理:

  1. 衣类(14词,~30条)
  2. 冠帽类(8词,~18条)
  3. 佩饰类(8词,~12条)
  4. 裙带襟袖类(8词,~10条)
  5. 锦绣绮罗类(12词,~15条)
  6. 帷帐帘幄类(8词,~12条)
  7. 旗旌纛类(8词,~10条)
  8. 裘甲类(8词,~8条)

第6步:核心叙事分析

识别"纩衣"为全剧服饰叙事主线,贯穿第27-46出,包含制衣→赐衣→得诗→奏闻→赐婚完整情节链。同时识别"儒冠/戎衣"身份转换线与"冠带"升迁线。

第7步:生成输出文件


关键词命中统计

关键词 命中次数(有效) 主要分布
纩衣/纩服 18 第27-46出(核心)
冠带 10 第8-46出(升迁线)
帷/帏/帷幄 8 第2-32出
帘/帘幙/珠帘 10 第2-46出
衣冠 5 第17-46出
儒冠 3 第6-31出
武弁 3 第3-31出
戎衣/戎装/戎服 3 第3-31出
簪/簪珥/簪缨 6 第5-46出
锦/锦绣/昼锦 8 第2-46出
绮/绮罗/绮筵 4 第2-25出
旗/旌/纛/旄 8 第6-46出
5 第6-32出
4 第19-46出
甲/甲胄/盔甲 3 第28-32出

注意事项

  1. 纩衣为古汉语专称,指丝绵填充的冬衣,本剧中特指宫女为边军缝制的御寒军衣,制度有据(唐代确有宫女制征衣之制)。
  2. 冠带在本剧出现频率极高,兼具"官职身份标志"与"换装仪式"双重功能,每次出现都伴随身份转变。
  3. 荆钗韦布芰裙为贫妇典型服饰组合,与宫中绮罗珠翠形成鲜明对照。
  4. 左衽出现在圣旨中,为华夷之辨术语,指夷狄服饰,非实际穿着描写。
  5. 部分曲牌名含服饰词(如【锦衣香】【罗帐里坐】【香罗带】),已标注但不过度解读。

输出文件校验

文件 大小 限制 状态
总结.md 待验 ≤20KB 待验
原文提取.md 待验 ≤20KB 待验
日志.md 待验 ≤20KB 待验
总计 待验 ≤1MB 待验