研究总结 日志 原文

香咳集 服饰提取日志

执行信息

项目 内容
书名 香咳集
源文件 /home/z/my-project/upload/四库别集3/四库别集3/香咳集.txt
输出目录 /home/z/my-project/upload/四库别集3output/香咳集/
文件总行数 765
执行时间 2024年

提取流程

Step 1: wc -l

765 /home/z/my-project/upload/四库别集3/四库别集3/香咳集.txt

Step 2: 8轮grep -n 关键词提取

第1轮:冠冕弁帻帽巾幞头进贤冠武冠

第2轮:衣裳袍衫袄褂襦褐裘袈裟

第3轮:裙裤履舄靴袜鞋

第4轮:带佩笏绶鱼袋玉带金带银带

第5轮:锦绮帛绢绫罗缎绸缂丝纱

第6轮:丝麻葛布裘棉缯缣

第7轮:染色绣纹黼黻章赭朱紫绯青

第8轮:赐服赐衣赐紫赐绯赐袍赐带

Step 3: sed精确提取

对去误判后的42个有效行号执行sed -n提取,附行号引用。

Step 4: 对抗审查(去误判)

误判类型 数量 示例
人名含服饰字 12 倪弁江、字冠之、冯履端、张佩兰、陈佩、梁青笏、字佩玉、字佩珊、字逸佩、字纫佩、席佩兰、柯锦机、葛秀英
自然意象 8 苔衣、帘衣、柳丝丝、蛛丝、雨丝、罗云、青蟑、碧纱窗
动词/修饰非服饰义 10 带斜阳、带去年愁、带雨、带余香、带月垂、带落花、一带暗窗纱、带晚霞
地名/书斋名 4 紫阳、青藤书屋、麻姑山、绣佛阁
典故引用 2 黄石履、苎萝

Step 5: 写三份MD

文件名 内容 字节数
香咳集_总结.md 服饰统计与特征分析
香咳集_日志.md 提取流程与误判记录
香咳集_原文提取.md 逐行原文附行号

关键发现

  1. 本书为清代女性诗选,服饰内容以闺阁日常为主,无制度性服饰
  2. "绣"字高频出现(9次),反映女红刺绣为女诗人核心生活场景
  3. 罗、锦为最高频织物,体现清代闺阁丝织品使用
  4. 裙装描写精微:红裙、石榴裙、裙腰,色彩鲜明
  5. 弓鞋1处(L402),为缠足文化记录
  6. 赐服完全缺位,与作者群体身份一致
  7. 男性服饰仅2处:乌帽、青衫,均出现在赠答/忆念诗中

日志记录完毕。