《粤客谈咸丰七年国耻》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 任务编号 | 8-e |
| 源文件 | /home/z/my-project/upload/part4/粤客谈咸丰七年国耻.txt |
| 输出目录 | /home/z/my-project/upload/44output/粤客谈咸丰七年国耻/ |
| 处理时间 | 2026-03-05 |
处理流程
第一步:文件概况
wc -l 结果:21行
文件为近代史料笔记,全文21行,记咸丰七年(1857年)英法联军攻陷广州始末。内容以外交军事为主,预估服饰内容稀疏。
第二步:多轮grep提取
第一轮:核心词检索
grep -n '服色\|舆服\|冠服\|章服\|衣\|裳\|裘\|弁\|履\|舄\|笏\|绶\|冕\|袍\|衫\|裙\|袄\|褐\|帛\|绢\|绫\|罗\|缎\|锦\|绮\|纱\|绸\|丝\|布\|葛\|麻\|棉\|茧\|蚕'
命中行:第3、4、8、12、14、17、19行
第二轮:制度词检索
grep -n '赐服\|赐紫\|赐绯\|借紫\|品色\|紫袍\|绯袍\|绿袍\|金带\|玉带\|鱼袋\|幞头\|补服'
命中行:无
第三轮:装饰词检索
grep -n '黼黻\|文章\|纹\|绣\|织\|染\|彩\|画'
命中行:第8、10、20、21行
第四轮:动作词检索
grep -n '冠\|佩\|带\|著\|被\|披\|裹\|束\|系\|戴\|穿'
命中行:第3、4、7、8、11、12、14、15、17、19行(大量非服饰用法)
第三步:精确验证
对粗筛结果进行逐条甄别,排除非服饰用法:
| 关键词 | 行号 | 语境 | 判定 |
|---|---|---|---|
| 羽缎 | 4 | "载黑铅、番钱、羽缎、哆罗、哗叽诸物" | ✅ 纺织品贸易品 |
| 哆罗 | 4 | 同上 | ✅ 纺织品贸易品 |
| 哗叽 | 4 | 同上 | ✅ 纺织品贸易品 |
| 布政使 | 3 | "布政使江国霖" | ❌ 官职名 |
| 裙带路 | 8 | "裙带路(香港附近之地名)" | ❌ 地名 |
| 锦绣 | 8 | "皆卿胸中之锦绣" | ❌ 喻指才略 |
| 画策 | 10 | "为之画策" | ❌ 谋划义 |
| 系身 | 12 | "以巨绠系身桅上" | ❌ 捆绑义 |
| 被 | 14等 | "被吹圮""被击毁"等 | ❌ 被动词 |
| 弱冠 | 15 | "巴甫弱冠" | ❌ 年龄词 |
| 盛服 | 20 | "令各官盛服将事" | ✅ 官员礼服 |
| 衣服 | 21 | "请备衣服食物" | ✅ 个人衣物 |
| 剃发匠 | 21 | "募一厨役、一剃发匠" | ✅ 发式/服制相关 |
| 衣物 | 21 | "附缴箱笼衣物及银三千两" | ✅ 个人衣物 |
| 改敛 | 21 | "华廷杰为启棺改敛" | ✅ 丧葬服饰礼仪 |
第四步:服饰内容确认
最终确认服饰相关内容3处,分布在3行:
- 第4行:羽缎、哆罗、哗叽——西洋毛织品贸易
- 第20行:盛服——官员礼服制度
- 第21行:衣服、剃发匠、箱笼衣物、改敛——个人衣物与丧仪
第五步:产出文件
| 文件名 | 内容 | 大小 |
|---|---|---|
| 粤客谈咸丰七年国耻_总结.md | 服饰内容分类总结 | ≤20KB |
| 粤客谈咸丰七年国耻_日志.md | 处理流程日志 | ≤20KB |
| 粤客谈咸丰七年国耻_原文提取.md | 原文片段摘录 | ≤20KB |
注意事项
- 本文为外交军事史笔记,服饰内容极少,仅3处有效命中。
- 大量"衣""服""被""带""系""画"等字在文中为非服饰用法,经逐条甄别排除。
- "裙带路"为香港地名,虽含"裙""带"二字,与服饰无关。
- "锦绣"为道光帝朱批中喻指才略之词,非织物实指。