研究总结 日志 原文

《晋录》服饰内容提取日志

基本信息

项目 内容
书名 晋录
作者 (明)沈思孝
源文件 /home/z/my-project/upload/part3/晋录.txt
输出目录 /home/z/my-project/upload/33output/晋录/
文件大小 8168字节
总行数 20行

执行过程

第1步:创建输出目录

mkdir -p /home/z/my-project/upload/33output/晋录/

✓ 成功

第2步:多轮关键词grep

第一轮:基础关键词库(60个)

关键词:衣 裳 裘 冠 冕 弁 佩 带 绶 笏 袍 褐 布 帛 锦 绮 绢 绸 缎 绫 罗 纱 丝 绣 织 染 裁 缝 衮 章 服 裙 袄 裤 履 舄 靴 鞋 帽 巾 幞 簪 钗 钿 环 珀 玉 金 银 珠 朝 丧 祭 铠 甲

命中结果:

关键词 命中行号 上下文摘要 是否服饰相关
第9行 "冬无长衣" ✓ 是
第16行 "衣冠出游者" ✓ 是
第16行 "衣冠出游者" ✓ 是(与衣同条)
第4行 "北冲东胜一带" ✗ 地域量词
第3行 "本布政司" ✗ "布政司"为官署名
第9行 "夏无布帽" ✓ 是
第2行 "绢四千七百七十七匹""绫、绢一千匹" ✓ 是
第2行 "绫、绢一千匹" ✓ 是(与绢同条)
第2行 "丝五千斤" ✓ 是(与绢同条)
第12行 "岩石隙缝处" ✗ 缝隙义
第17行 "全虽服上刑" ✗ 服刑义
第9行 "夏无布帽" ✓ 是(与布同条)
第9行 "百金/千金/万金之家" ✗ 货币义
第2行 "额解太仓银" ✗ 货币义
第3行 "余银解太仓" ✗ 货币义
第4行 "三关相为甲乙" ✗ 序次义
第10行 "豪商大贾甲天下" ✗ "第一"义

第二轮:扩展关键词

关键词:妆 翠 装 扇 炕 毛 皮 羊 衣冠 长衣 布帽 绫绢 上刑

关键词 命中行号 上下文摘要 是否服饰相关
第15行 "妇妆见客不羞" ✓ 是
第9行 "捉扇而摇" △ 勉强相关
第18行 "剪毛以酬""剪毛若干" ✓ 是(纺织原料)
第12行 "竹皮木屑" ✗ 非服饰用皮
第9行 "食用羊" ✗ 食用义
第18行 "羊群""每百羊" △ 间接相关(羊毛来源)
衣冠 第16行 "衣冠出游者" ✓ 是(已收录)
长衣 第9行 "冬无长衣" ✓ 是(已收录)
布帽 第9行 "夏无布帽" ✓ 是(已收录)

第3步:sed上下文提取

对确认的服饰相关行(第2、9、15、16、18行)提取完整上下文,已通过Read工具完成全文阅读,无需额外sed。

第4步:分类

分类 条目 来源行号
日常服饰 布帽、长衣(俭朴风俗) 第9行
日常服饰 妇妆 第15行
冠帽头饰 布帽 第9行
佩饰配件 第9行
纺织材料 丝、绢、绫(税赋物) 第2行
纺织材料 羊毛 第18行
服饰故事 衣冠出游 第16行
冠服制度
鞋履
服饰礼仪

第5步:产出MD文件

文件 说明
晋录_原文提取.md 逐条原文 + 关键词 + 行号 + 备注
晋录_总结.md 全书服饰内容总结 + 分类综述 + 对抗式审核
晋录_日志.md 本文件,记录提取全过程

统计

指标 数值
grep命中行数(去重) 6行(第2、4、9、12、15、16、18行)
确认服饰相关行数 5行(第2、9、15、16、18行)
排除行数 1行(第4行"一带"、第12行"隙缝"、第17行"服上刑"等,共3个假阳性)
服饰条目总数 5条
有内容的分类 5个(日常服饰、冠帽头饰、佩饰配件、纺织材料、服饰故事)
无内容的分类 3个(冠服制度、鞋履、服饰礼仪)

备注

《晋录》为明代地理风俗笔记,全文仅约8千字节,主旨为山西田赋盐政与边防民风,服饰内容极为稀少。提取结果忠实于原文,未做延伸或臆测。