研究总结 日志 原文

《香乘》服饰提取日志

基本信息


操作步骤记录

步骤1:查看文件总行数

wc -l /home/z/my-project/upload/器物/器物/香乘.txt

结果:5977行

步骤2:多轮grep提取服饰关键词

2.1 grep"衣"

grep -n '衣' 香乘.txt

结果:匹配行数极多(80+行),涵盖熏衣、染衣、衣冠、衣领、衣裾、衣香、衣笥等。大部分行10为长行,含大量沉香考证内容。

2.2 grep"裳"

grep -n '裳' 香乘.txt

结果:3行

2.3 grep"冠"

grep -n '冠' 香乘.txt

结果:7行

2.4 grep"带"

grep -n '带' 香乘.txt

结果:约25行,大量"带"作动词"携带"义,筛选后服饰相关:

2.5 grep"袍"

grep -n '袍' 香乘.txt

结果:0行,无匹配。

2.6 grep"裘"

grep -n '裘' 香乘.txt

结果:2行

2.7 grep"褐/巾/履/屦/绅/袂/裾/襟/裙/幅"

grep -n '褐\|巾\|履\|屦\|绅\|袂\|裾\|襟\|裙\|幅' 香乘.txt

结果:筛选后服饰相关:

2.8 grep"弁/冕/簪/珥/佩/环/绮/罗/纱/绢"

grep -n '弁\|冕\|簪\|珥\|佩\|环\|绮\|罗\|纱\|绢' 香乘.txt

结果:大量匹配,筛选后服饰相关:

注意:大量"佩"作动词"佩戴"义,需筛选与服饰佩饰相关者;"罗"大量作地名(暹罗、三佛齐罗等),需筛选织物义。

2.9 grep"帛/锦/绣/练/絮/布/麻/丝/绸/缎"

grep -n '帛\|锦\|绣\|练\|絮\|布\|麻\|丝\|绸\|缎' 香乘.txt

结果:大量匹配,筛选后服饰相关:

注意:"麻"大量出现于"芝麻油""麻叶""麻树香"等非服饰语境;"丝"大量出现于"金丝""天蚕丝""丝桐"等非服饰语境;"练"多作"炼蜜"异写。

2.10 grep"缯/绫/纨/绡/绶/绂/黼/黻/鹖/帻"

grep -n '缯\|绫\|纨\|绡\|绶\|绂\|黼\|黻\|鹖\|帻' 香乘.txt

结果

其余"绶/绂/黼/黻/鹖/帻"无匹配。

2.11 grep"帷/帐/幄/旗/旌/旆/纛"

grep -n '帷\|帐\|幄\|旗\|旌\|旆\|纛' 香乘.txt

结果:筛选后:

"旗/旌/旆/纛"无服饰相关匹配。


步骤3:上下文提取

使用 sed -n '行号-2,行号+10p' 提取关键行上下文,重点提取行号: 88, 161, 190, 410, 516, 626, 653, 677, 689, 725, 828, 924, 931, 939, 1018, 1027, 1152, 1309, 1332, 1357, 1363, 1412, 1481, 1505, 1625, 1635, 1641, 1645, 1757, 1771, 1785, 1858, 1905, 2039, 2227, 2438, 2683, 2842, 3332, 3399, 3764, 3776, 3842, 3945, 3995, 4248, 4482, 5329, 5343, 5553, 5563, 5582, 5613, 5620, 5651, 5784, 5844, 5865, 5887, 5915, 5924


步骤4:噪音过滤

已排除的无关用法


步骤5:关键发现

  1. 《香乘》服饰信息集中在"熏佩之香"卷(卷十九),列举十余种衣香配方,是研究古代熏衣习俗的核心文献
  2. 碧芬裘为本书最独特的服饰条目——异兽皮裘且自带香气,仅见于《明皇杂录》
  3. 飞云履染四选香——白居易自制香履,体现文人香趣
  4. 紫罗香囊——谢遏年少所佩,为六朝香囊经典意象
  5. **"衣冠之儒""黄冠缁衣"**出现于序跋中,非叙事性服饰内容,但反映香文化与衣冠阶层的关联
  6. 帷帐类内容丰富,帐中香(李后主帐中香法)为著名典故
  7. 香囊为本书最密集出现的佩饰,有锦香囊、紫罗香囊、连蝉锦香囊、绣香袋、缯香囊等多种形制

步骤6:审核结果

对总结中10条关键引文逐条执行grep验证:

序号 引文片段 grep结果 状态
1 染衣以沉香水 行10匹配 ✓通过
2 珠珥珠履衣五重 行88匹配 ✓通过
3 碧芬之裘 行679匹配 ✓通过
4 飞云履 行1625-1626匹配 ✓通过
5 紫罗香囊 行1635匹配 ✓通过
6 罗纨绮绣 行1773匹配 ✓通过
7 衣冠身惹御炉香 行5616匹配 ✓通过
8 红罗复斗帐 行5613匹配 ✓通过
9 黄巾裙 行5329匹配 ✓通过
10 黄冠缁衣 行5924匹配 ✓通过

审核结论:10条引文全部通过原文验证,无杜撰。


文件大小检查