研究总结 日志 原文

《须溪四景诗集》服饰提取日志

操作记录

步骤 操作 结果
1 wc -l 统计总行数 405行
2 mkdir -p 创建输出目录 成功
3 第1轮grep:冠冕弁帻帽巾幞头进贤冠武冠 命中6行(L109/110/114/183/185/211/296/304/306)
4 第2轮grep:衣裳袍衫袄褂襦褐裘袈裟 命中23行
5 第3轮grep:裙裤履舄靴袜鞋 命中7行(L34/56/102/106/122/177/205)
6 第4轮grep:带佩笏绶鱼袋玉带金带银带 命中8行(含误命2条:"带"作动词/介词)
7 第5轮grep:锦绮帛绢绫罗缎绸缂丝纱 命中20行
8 第6轮grep:丝麻葛布裘棉缯缣 命中15行(含大量误命)
9 第7轮grep:染色绣纹黼黻章赭朱紫绯青 命中38行(大量颜色词非服饰语境)
10 第8轮grep:赐服赐衣赐紫赐绯赐袍赐带 0命中
11 sed提取全部命中行原文 成功
12 补充grep验证:半臂/蜀毡/蓑/篛笠/翠钿/步摇/鲛绡 补获L138/142/207/229/363等
13 对抗审查与误命排除 见下文

对抗审查记录

误命排除

行号 原grep命中 排除原因
44 锦韀蹄 锦韀为马具鞍褥,非人体服饰,保留但标注"马具饰"
46 弓弯舞 "弓弯"为舞姿非服饰,排除
48 柳绵 "绵"指柳絮非织物,排除
54 绵田 地名非织物,排除
70 翠拂双蛾 "翠"指山色非服色,排除
80 拾翠 "拾翠"为踏青活动非服饰,排除
100 葛天民 "葛天"为上古部落名非织物,排除
104 锦薫笼 比喻用法,保留但标注"比喻"
120 锦水 河名非织物,保留但标注"地名"
138 桑麻 农作物非衣物面料,排除
140 带烟斜 "带"为介词"带着"非腰带,排除
142 蓑舞 "蓑"为雨具,归入体服类
144 波翻锦 比喻水面如锦,标注"比喻"
173 桑麻长 同L138,排除
175 朱帘 "帘"为窗帘非服饰,排除
183 葛陂龙 "葛陂"为地名,排除
215 红锦 比喻水面如锦,标注"比喻"
231 碧纱牀 纱帐/纱床,非人体服饰,排除
282 林烟带落晖 "带"为介词,排除
284 笠泽丝 "笠泽"为湖名,排除
326 濯锦 比喻,标注"比喻"
330 系帛违 帛指雁足传书之丝帛信,非衣物,标注
332 数丝风 "丝"为量词非织物,排除
342 锦一张 比喻晚霞,标注"比喻"
344 天机 "机"指机心非织机,排除
371 天章 "章"为文采非服饰纹章,但"绣"为刺绣,保留

补充纳入

行号 关键词 纳入原因
84 "暗沾裾"裾为衣襟,属体服
207 半臂 唐宋短袖便服,属体服
207 蜀毡 毡为毛织品,属基础织物
209 洴澼絖典出庄子,絖为丝絮,属基础织物
229 步摇 女性首饰,归入佩饰类
229 鲛绡 神话织物,归入精细织物
229 翠翘 女性首饰,归入色彩纹饰
263 机丝 纺织之丝,属基础织物
362 蓑笠翁 蓑笠为渔翁雨具,属体服

各轮命中率

轮次 命中行数 误命数 有效数 有效率
1-冠冕 9 0 9 100%
2-衣裳 23 0 23 100%
3-足服 7 0 7 100%
4-佩饰 8 3 5 62.5%
5-细织物 20 0 20 100%
6-粗织物 15 10 5 33.3%
7-色纹 38 28 10 26.3%
8-赐服 0 0 0 N/A
合计 120 41 79 65.8%

注:合计行数含跨类重复,去重后有效服饰行52行。

文件输出

文件 大小
须溪四景诗集_总结.md 待测
须溪四景诗集_日志.md 待测
须溪四景诗集_原文提取.md 待测