研究总结 日志 原文

《湛然居士集》服饰内容提取 · 操作日志

任务ID:batch-r2-e 书名:湛然居士集 源文件:/home/z/my-project/upload/四库别集/湛然居士集.txt 输出目录:/home/z/my-project/upload/四库别集output/湛然居士集/ 执行时间:2026-04-22


Step 1:创建输出目录

mkdir -p /home/z/my-project/upload/四库别集output/湛然居士集/

✅ 成功


Step 2:查看文件总行数

wc -l 湛然居士集.txt
→ 1869行

Step 3:五轮grep扫描

R1:核心服饰词

grep -n '衣|裳|袍|衫|裙|裘|褐|袂|衿|襟|裾|袖|裯|褕|襦|袴|裈|弁|冠|冕|帻|巾|帽|笠|簪|笄|珥|璧|璜|佩|环|钏|钿|钗|锡' 湛然居士集.txt

→ 命中大量行,筛选后有效服饰行约50行

R2:冠帽佩饰词

grep -n '冠|冕|弁|帻|巾|帽|笠|幞|帔|簪|笄|步摇|珥|璫|钗|钿|钏|环|佩|玉|金|银|锡|铜|铁|珠|宝|璧|璜|琥|璟|琉|璃|玛|瑙' 湛然居士集.txt

→ 命中极多行(因"金""玉"等字频高),大量为非服饰用法,需严格过滤

R3:丝织品类词

grep -n '丝|帛|缯|缣|绫|罗|绸|缎|绢|绮|纱|绡|练|纨|绨|纺|缦|缟|锦|绣|织|缕|线|组|绅|绶|绂|绋' 湛然居士集.txt

→ 命中较多行,"丝"多为"丝竹/丝弦"(乐器),需过滤

R4:材料染织词

grep -n '麻|葛|毳|毡|罽|氆|氇|绒|绵|絮|棉|布|粗|褐|毛|革|韦|皮|漆|丹|朱|赤|绛|绯|红|紫|青|蓝|绿|翠|碧|黄|白|黑|玄|皂|染|缫|缉|绩|纺' 湛然居士集.txt

→ 命中大量行,颜色词多为景物描写,需过滤非服饰用法

R5:鞋履制度词

grep -n '履|屦|屐|鞋|靴|袜|带|钩|鞶|韠|韨|韎|韐|黻|黼|章|服|制|品|秩|阶' 湛然居士集.txt

→ "服/制/品/阶"命中极多非服饰行,需严格筛选


Step 4:上下文提取

对约30个关键行号使用 sed -n 'X-2,Y+5p' 提取上下文,确认服饰用法。关键行号:

L13, L41, L60-72, L74, L105, L121, L141, L153, L164, L172, L180, L184, L186, L227, L229, L270, L298, L314, L340, L356, L411, L463, L469, L471, L473, L485, L489, L533, L549, L585, L587, L649, L670-671, L691, L725, L727, L777, L809, L828, L895, L1059, L1081, L1091, L1120, L1133, L1135, L1214, L1216, L1218, L1273, L1344, L1350, L1381, L1399, L1401, L1420, L1431, L1435, L1509, L1550, L1582, L1668, L1786, L1848


Step 5:过滤非服饰用法

过滤掉的条目(非服饰用法)

行号 关键词 过滤原因
L46 "绶而归结社同志"——结社用词,非佩绶
L82 冠带 "冠带通穷域"——制度用语,非具体服饰
L93 "千钟不惜锦淋漓"——形容诗文华美
L133 锦浪 "旌旗翻锦浪"——旗帜比喻
L139 织锦文 "新样梭成织锦文"——比喻文采
L423 珥笔 "珥笔承恩"——簪笔为官制用语
L537 簪乱锦 "玛瑙瓶中簪乱锦"——插花,非首饰
L629 绮语 "绮语求茶饮"——佛教用语
L731 绮语 同上
L811 丝篁 "异域丝篁无律吕"——乐器
L846 无纹锦 "织就无纹锦"——比喻诗文
L957/961 "冠斗南""冠一隅"——动词"居首"
L1160 "佩圣安之正印"——佩印,非佩饰
L1216 箕裘 "箕裘业"——家业传承典故
L1442 箕裘 同上
L1668 织万佛 "织万佛为施"——织佛像,非衣料
多处 金/玉/珠 大量为比喻或器物装饰,非服饰佩饰

Step 6:输出文件

文件 大小 说明
湛然居士集_原文提取.md ~8KB 含行号引用,关键词加粗
湛然居士集_总结.md ~7KB 服饰结构化综述+学术审查
湛然居士集_日志.md 本文件 完整操作流程记录

统计摘要

指标 数值
全书总行数 1869
五轮grep扫描命中行数(去重前) ~450行
有效服饰条目数 ~55条
核心发现 4项(仕隐对照、西域服饰、唐宫重构、佛门服饰)
过滤掉的非服饰条目 ~17类

日志完。