《西域行程记》服饰内容提取日志
任务信息
| 项目 | 内容 |
|---|---|
| 任务ID | 20-e |
| 输入文件 | /home/z/my-project/upload/part4/西域行程记.txt |
| 输出目录 | /home/z/my-project/upload/44output/西域行程记/ |
| 处理日期 | 2026-03-05 |
处理流程
步骤1:文件概况
wc -l → 158行
文件较短,为明代陈诚、李暹出使西域的逐日行程记录。
步骤2:多轮关键词检索
第1轮:核心词检索
grep -n '服色|舆服|冠服|章服|衣|裳|裘|冠|弁|佩|带|履|舄|笏|绶|冕|袍|衫|裙|袄|褐|帛|绢|绫|罗|缎|锦|绮|纱|绸|丝|布|葛|麻|棉|茧|蚕'
命中结果:
- 第58行:地名"孔葛思"(葛为音译用字,非服饰材料)
- 第67行:河名"衣烈河"(衣为音译用字,非服装)
第2轮:制度词检索
grep -n '赐服|赐紫|赐绯|借紫|品色|紫袍|绯袍|绿袍|金带|玉带|鱼袋|幞头|补服'
零命中。
第3轮:装饰词检索
grep -n '黼黻|文章|纹|绣|织|染|彩|画'
零命中。
第4轮:动作词检索
grep -n '服|冠|戴|穿|著|被|衣|披|裹|束|系'
命中结果:
- 第21行:"系哈密大烟墩处"(系=隶属关系,非服饰动作)
- 第67行:"近衣烈河边"(同前,音译河名)
第5轮:精确单字检索
对"服""衣""冠""帽""巾""履""靴""鞋""袜""袍""衫""裙""袄""褐""裘""帛""绢""绫""罗""缎""锦""绮""纱""绸""丝""带""佩""绶""笏""绣""织""染""彩""画""纹""布""棉""麻""葛""蚕"逐一精确检索。
| 字 | 命中 | 说明 |
|---|---|---|
| 服 | 0 | 全文无"服"字 |
| 衣 | 1 | 第67行"衣烈河"(河名音译) |
| 冠 | 0 | 全文无"冠"字 |
| 帽/巾/履/靴/鞋/袜 | 0 | 全文无此数字 |
| 袍/衫/裙/袄/褐/裘 | 0 | 全文无此数字 |
| 帛/绢/绫/罗/缎/锦/绮/纱/绸/丝 | 0 | 全文无此数字 |
| 带 | 0 | 全文无"带"字 |
| 佩/绶/笏 | 0 | 全文无此数字 |
| 绣/织/染/彩/画/纹 | 0 | 全文无此数字 |
| 布/棉/麻 | 0 | 全文无此数字 |
| 葛 | 1 | 第58行"孔葛思"(地名音译) |
| 蚕 | 0 | 全文无"蚕"字 |
第6轮:扩展检索
grep -n '胡|番|夷|俗|妆|饰|环|钏|钗|簪|珥|珠|玉|金|银'
命中:夷人(第9、13、21、32、59、77、92行),玉门关(第6行)。均为地名或族群泛称,无服饰描写。
grep -n '帐|幕|毯|毡|帷|幄'
命中:第92行"忽歹达帐",指帐篷居所。
grep -n '赏|赐|礼|贡|献|馈'
命中:第114行"赏赐头目也的哥儿哈班",未载具体赏赐物品。
步骤3:关键段落上下文提取
对全部命中行号提取上下文(前后各2行),逐一判读,确认均为伪命中或与服饰无关。
步骤4:分类整理
经全部检索与判读,本书无任何明确的服饰描写内容。所有关键词命中均为以下类型伪命中:
- 音译地名/河名中包含形似字(孔葛思、衣烈河)
- 虚词/通用词(系=隶属)
- 居所类(帐=帐篷,非服饰)
步骤5:产出文件
| 文件 | 说明 |
|---|---|
| 西域行程记_总结.md | 提取结论与分析 |
| 西域行程记_日志.md | 本文件,处理流程记录 |
| 西域行程记_原文提取.md | 原文提取(含伪命中判读) |
检索统计
| 检索轮次 | 检索词数量 | 命中条目 | 确认服饰相关 |
|---|---|---|---|
| 核心词 | 36 | 2 | 0 |
| 制度词 | 12 | 0 | 0 |
| 装饰词 | 8 | 0 | 0 |
| 动作词 | 11 | 2 | 0 |
| 精确单字 | 38 | 2 | 0 |
| 扩展检索 | 30+ | 9 | 0 |
| 合计 | 135+ | 15 | 0 |
结论
《西域行程记》为纯粹的行程日记,全书158行,格式统一为"日期+天气+方向+里程+地名+安营",不含任何服饰描写内容。建议转查陈诚《西域番国志》获取相关服饰资料。