《近代名人轶事录》服饰提取日志
基本信息
- 任务ID:24-a
- 源文件:
/home/z/my-project/upload/part4/近代名人轶事录.txt - 输出目录:
/home/z/my-project/upload/44output/近代名人轶事录/ - 执行日期:2026-03-05
步骤一:文件基本信息
$ wc -l 近代名人轶事录.txt
261 近代名人轶事录.txt
$ file 近代名人轶事录.txt
Unicode text, UTF-8 text, with very long lines (452)
$ du -h 近代名人轶事录.txt
77K
步骤二:多轮grep搜索
第一轮:核心词+制度词
rg -n '服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'
命中:1条
- 行59:张勋复辟,康有为奉诏,以一品服色往……仅顶带荣身而已
第二轮:服制/织物词
rg -n '衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'
命中:约30+条(含大量非服饰用法的"布政使""文章""衣冠"等)
第三轮:装饰词
rg -n '黼黻|文章|纹|绣|织|染|彩|画'
命中:约10条(多为"文章""画"等非服饰用法)
第四轮:动作词
rg -n '服|冠|戴|穿|著|被|衣|披|裹|束|系'
命中:约50+条(含大量非服饰用法的"服务""制服""被"等)
第五轮:补充关键词
rg -n '顶戴|顶带|花翎|蓝翎|朝服|朝珠|蟒袍|马褂|顶子|翎子|帽|靴|袜|巾|扇|伞|轿|车|旗|幡'
rg -n '辫|辫子|豚尾|发|须|髯|髻|簪|钗|环|珠|翠|玉|金|银|铜'
命中:约20条新增
步骤三:去重与人工甄别
经逐一审读,剔除以下非服饰用例:
- "布政使":官职名,非布料
- "文章":文辞,非服制纹饰
- "衣庄":虽为服饰相关,但属商业场所
- "画成大头大身各式鬼形":绘画行为,非服饰
- "装潢":装帧,非服饰
- "彩舆":婚轿装饰,保留在配饰类
- "布衣脱粟":保留(布衣为服饰身份标识)
- "不栉进士":保留(栉为发饰)
- "牛衣":保留(典故,喻贫贱)
- "冠盖":保留(冠服代指官员)
- "制服":保留(军服制度)
最终筛选出20条有效服饰相关条目。
步骤四:分类整理
将20条内容分为六大类:
| 类别 | 条数 | 说明 |
|---|---|---|
| 甲·官服制度与品级标识 | 5 | 一品服色、顶带、顶戴、冠盖、制服 |
| 乙·日常服饰与生活 | 6 | 缊袍、草冠布衣、衣被、履袜、髻 |
| 丙·礼仪服饰与社交场景 | 5 | 衣袂、下裳、衣冠、衣裤、振衣 |
| 丁·发饰与仪容 | 3 | 剃须、不栉、蓄须 |
| 戊·配饰与器物 | 3 | 靴囊、金镯、铺盖衣物 |
| 己·典故与文学意象 | 2 | 牛衣、彩舆 |
步骤五:产出文件
| 文件名 | 大小 | 说明 |
|---|---|---|
| 近代名人轶事录_总结.md | ~7KB | 分类总结与分析 |
| 近代名人轶事录_日志.md | ~4KB | 本文件,提取过程记录 |
| 近代名人轶事录_原文提取.md | ~8KB | 原文逐条摘录 |
质量检查
- 未加载整本TXT进入LLM
- 使用grep+sed逐轮提取
- 关键词覆盖核心词、制度词、装饰词、动作词四类
- 每份MD≤20KB
- 未偷懒简写批量合并
- 原文完整摘录,未擅自删改