研究总结 日志 原文

《蕉叶帕》服饰整理工作日志

任务信息

操作日志

第一步:环境准备

mkdir -p "/home/z/my-project/upload/4小说output/蕉叶帕"

第二步:文件预检

wc -l "/home/z/my-project/upload/part4/蕉叶帕.txt"
# 输出:278 /home/z/my-project/upload/part4/蕉叶帕.txt

wc -c "/home/z/my-project/upload/part4/蕉叶帕.txt"
# 输出:122425 /home/z/my-project/upload/part4/蕉叶帕.txt

第三步:关键词检索(grep -n)

3.1 核心服饰词检索

rg -n '衣裳|袍|衫|裙|袄|裘|冠|冕|弁|帽|巾|帻|履|舄|靴|鞋|带|佩|笏|绶' "蕉叶帕.txt"

检索结果命中行号:7, 48, 49, 66, 98, 112, 129, 139, 142, 149, 150, 175, 197, 198, 208, 216, 227, 228, 238, 250, 252, 264

有效服饰相关命中(剔除无关命中):

行号 关键词 语境 有效性
49 衣紫 "腰金衣紫是何人"——叫花唱词 ✓有效
98 裙衣、衫袖 退去裙衣、不放衫袖 ✓有效
112 衣服、冠带 大衣服、取冠带来 ✓有效
128 征衣 "洒泪透征衣" ✓有效
139 黄袄 "想黄袄穿" ✓有效
149 罗裙、绣鞋、冠带 八幅罗裙着地拖、红绣鞋、冠带起来 ✓有效
150 锦袍 宝剑、锦袍 ✓有效
172 盔甲 "盔甲在身" ✓有效
198 蟒袍 "蟒袍二袭" ✓有效
208 裙钗 "女裙钗" ✗泛指
217 脱白挂绿 "脱白挂绿" ✓有效
227 袍、带 "脱了袍,卸了带" ✓有效
250 白甲白袍 "白甲白袍伺候" ✓有效
264 冠带、纱帽 "挽冠带"、"纱帽" ✓有效

3.2 面料材质词检索

rg -n '丝|帛|绢|绸|缎|绫|罗|纱|锦|绮|缂丝|布|麻|葛|苎|棉' "蕉叶帕.txt"

有效命中:

行号 关键词 语境 有效性
37 "罗帕" ✓有效
80 绿罗帕 "娇滴滴绿罗帕儿" ✓核心
97 "罗帕" ✓有效
111 "十匹绡赏他做衣裳" ✓有效
149 罗裙 "八幅罗裙着地拖" ✓有效
150 锦袍 "锦袍交付于军士" ✓有效
198 蟒袍 ✓有效
228 "十匹绡" ✓有效

3.3 纹饰色彩词检索

rg -n '绣|纹|黼|黻|龙凤|蟒|鹤|狮|紫|绯|绿|青|朱|赭|黄|白|黑|玄|红' "蕉叶帕.txt"

命中极多(色彩词在文本中广泛出现),有效筛选后:

行号 关键词 语境 有效性
49 "腰金衣紫" ✓有效
80 绿 "绿罗帕" ✓核心
85 "绣口香肠" ✗比喻
98 金凤 "金凤钗" ✓核心
139 "黄袄" ✓有效
149 "红绣鞋" ✓有效
198 金、蟒 "金冠"、"蟒袍" ✓核心
217 白、绿 "脱白挂绿" ✓有效
250 "白甲白袍"、"白衣" ✓有效

3.4 配饰词检索

rg -n '簪|钗|钏|镯|环|珠|玉|翡翠|珊瑚|鱼袋|荷包|扇' "蕉叶帕.txt"

有效命中:

行号 关键词 语境 有效性
98 凤钗/金钗 "金凤钗" ✓核心
139 荆钗 "荆钗尚然为聘" ✓有效
139 "夜明宝珠" ✓有效
149 "金盘捧出玉麒麟" ✗无服饰关联

3.5 动作词检索

rg -n '赐服|赐紫|赐绯|着衣|更衣|披衣|解衣|脱衣|穿衣|衣冠' "蕉叶帕.txt"

无直接命中。扩展检索:

rg -n '脱|卸|换|穿|戴|冠带|妆束' "蕉叶帕.txt"

有效命中:

行号 动作 语境
51 改换衣妆 狐仙化身
78 打扮 "我这般打扮起来"
98 退去裙衣 交欢
112 穿了 "胡公穿了"冠带
149 冠带起来 胡公夫妇
149 穿起 白生穿起大衣服
149 妆束完了 小姐梳妆
149 脱去 龙兴脱去傧相衣服
160 卸妆 龙生欲为弱妹卸妆
174 另换一套妆束 狐仙蜕化
227 脱了袍,卸了带 刘豫搏虎
250 穿上白衣 全军换装
264 挽冠带 胡连换官服

第四步:筛选与分类

经全文通读+关键词检索交叉验证,确认有效服饰描写片段共22处,分类如下:

类别 数量 代表片段
官服礼制 6处 腰金衣紫、冠带、蟒袍玉带、脱白挂绿、纱帽
婚嫁服饰 7处 绿罗帕、金凤钗、大衣服、荆钗、黄袄、八幅罗裙、红绣鞋
军旅服饰 6处 征衣、锦袍、盔甲、白甲白袍、脱袍卸带
女妆变换 6处 改换衣妆、打扮、退去裙衣、卸妆、另换妆束、付粉
配饰 5处 罗帕、凤钗、荆钗、夜明珠、红绣鞋

注:部分片段跨类,总数按去重计约22处。

第五步:撰写输出文件

问题记录

  1. 面料词噪声大:"罗"字在文本中出现频率极高(人名"罗"宽、地名等),需逐一排查,仅保留"罗帕""罗裙"等服饰用法。
  2. 色彩词噪声极大:"白""红""黄"等单字在叙事中广泛出现(如"白元钧"人名、"白云"等),需严格限定在服饰语境。
  3. 动作词命中率低:"赐服""更衣"等标准动作词完全无命中,需扩展为"脱""穿""换"等口语词。
  4. 文本格式问题:第139行处有截断字符("贤(子血)光"),属OCR或编码问题,不影响服饰提取。