研究总结 日志 原文

《近代名人轶事录》服饰提取日志

基本信息

步骤一:文件基本信息

$ wc -l 近代名人轶事录.txt
261 近代名人轶事录.txt

$ file 近代名人轶事录.txt
Unicode text, UTF-8 text, with very long lines (452)

$ du -h 近代名人轶事录.txt
77K

步骤二:多轮grep搜索

第一轮:核心词+制度词

rg -n '服色|舆服|冠服|章服|赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'

命中:1条

第二轮:服制/织物词

rg -n '衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'

命中:约30+条(含大量非服饰用法的"布政使""文章""衣冠"等)

第三轮:装饰词

rg -n '黼黻|文章|纹|绣|织|染|彩|画'

命中:约10条(多为"文章""画"等非服饰用法)

第四轮:动作词

rg -n '服|冠|戴|穿|著|被|衣|披|裹|束|系'

命中:约50+条(含大量非服饰用法的"服务""制服""被"等)

第五轮:补充关键词

rg -n '顶戴|顶带|花翎|蓝翎|朝服|朝珠|蟒袍|马褂|顶子|翎子|帽|靴|袜|巾|扇|伞|轿|车|旗|幡'
rg -n '辫|辫子|豚尾|发|须|髯|髻|簪|钗|环|珠|翠|玉|金|银|铜'

命中:约20条新增

步骤三:去重与人工甄别

经逐一审读,剔除以下非服饰用例:

最终筛选出20条有效服饰相关条目。

步骤四:分类整理

将20条内容分为六大类:

类别 条数 说明
甲·官服制度与品级标识 5 一品服色、顶带、顶戴、冠盖、制服
乙·日常服饰与生活 6 缊袍、草冠布衣、衣被、履袜、髻
丙·礼仪服饰与社交场景 5 衣袂、下裳、衣冠、衣裤、振衣
丁·发饰与仪容 3 剃须、不栉、蓄须
戊·配饰与器物 3 靴囊、金镯、铺盖衣物
己·典故与文学意象 2 牛衣、彩舆

步骤五:产出文件

文件名 大小 说明
近代名人轶事录_总结.md ~7KB 分类总结与分析
近代名人轶事录_日志.md ~4KB 本文件,提取过程记录
近代名人轶事录_原文提取.md ~8KB 原文逐条摘录

质量检查