《胡涂世界》服饰提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 胡涂世界 |
| 作者 | 清·吴趼人 |
| 版本 | 光绪三十二(1906)丙午年中秋,世界繁华报馆出版单行本 |
| 卷回 | 十二卷十二回 |
| 源文件 | /home/z/my-project/upload/part3/胡涂世界.txt |
| 文件行数 | 595行 |
| 文件大小 | 290,456字节 |
| 输出目录 | /home/z/my-project/upload/3小说output/胡涂世界/ |
提取流程
第1轮grep:基础服饰关键词(衣、裳、袍、衫)
搜索命令:rg -n '衣|裳|袍|衫'
命中行数:约25行,有效服饰相关约20行
有效发现:
- 第55行:穿了衣帽来拜(官场日常穿着)
- 第68行:换了件洋缎的衣裳(丁忧后换华服)
- 第96行:穿的衣裳都是素的(丁忧素服)
- 第99行:几件时新衣裳当银子
- 第118行:蟒袍(官服关键条目)
- 第142行:改了素衣
- 第160行:穿的衣裳龌龊不堪
- 第277行:月白湖绉紧身棉袄、寿衣
- 第281行:棉袍子(画眉笼子段)
- 第451行:衣服千万不可古董/华丽(官场穿衣术)
- 第461行:蟒袍补褂
过滤掉:纯语气词"衣"的无实义搭配若干
第2轮grep:基础服饰关键词(裙、裤、帽、冠、履、鞋、靴)
搜索命令:rg -n '裙|裤|帽|冠|履|鞋|靴'
命中行数:约20行,有效约15行
有效发现:
- 第77行:戴上帽子站班
- 第113行:鞋子扎铁搭、鞋口拉破
- 第118行:粉底皂靴(官靴)
- 第145行:衣裳鞋袜拖一片挂一片
- 第149行:衣履
- 第191行:履声橐橐(脚步声,非服饰实义,过滤)
- 第281行:靴子、外褂子、帽盒
- 第306行:做了袍套买了一副补子
- 第371行:红缨大帽
- 第404行:脱了小褂子装的、脱了裤子装的、脱了套裤装的
- 第414行:帽子探了下来
- 第461行:戴着水晶项子
- 第474行:戴红缨大帽子的
- 第570行:鞋子已是没有底了
过滤掉:第191行"履声橐橐"仅为脚步声描写
第3轮grep:配饰/织物关键词(带、佩、簪、钗、钏、环)
搜索命令:rg -n '带|佩|簪|钗|钏|环'
命中行数:大量("带""环"为常见字),有效服饰相关约5行
有效发现:
- 第62行:衰绖之中(丧服)
- 第231行:首饰、银器
过滤掉:"带"字大量无关用法(带着、带来等),"环"字无首饰实义用法
第4轮grep:织物关键词(锦、绢、绸、缎、纱、罗)
搜索命令:rg -n '锦|绢|绸|缎|纱|罗'
命中行数:约10行,有效约5行
有效发现:
- 第68行:洋缎的衣裳
- 第224行:纺纱织布等局(非服饰,过滤)
- 第277行:月白湖绉
- 第458行:绸绉绫绢等物
过滤掉:第224行"纺纱织布"为工厂名称,非服饰描写
第5轮grep:颜色/纹饰/身份服饰(红、绿、青、紫、绣、蟒、补、顶戴、花翎、朝珠)
搜索命令:rg -n '红|绿|青|紫|绣|蟒|补褂|补子|顶子|顶戴|花翎|朝珠'
命中行数:约30行,有效约20行
有效发现:
- 第96行:红伞(官仪)
- 第118行:蓝顶子、大花翎、朝珠、补褂、蟒袍
- 第116行:红巾(盖头)
- 第231行:深蓝顶子、透亮顶子、红顶子、水晶项子
- 第306行:水晶项子、袍套、补子
- 第371行:红缨大帽
- 第414行:红顶花翎、大马褂、墨晶方眼镜、绿呢大轿
- 第442行:花绫子、红毡铺地
- 第453行:衣服齐整(官场诀窍)
- 第461行:蟒袍补褂
过滤掉:大量"红人"(指得势者)、"红封袋"等非服饰用法
第6轮grep:官场/丧服专词(马褂、褂子、翎子、功牌、吉服、素服、孝服、成服、号褂等)
搜索命令:rg -n '马褂|褂子|翎子|功牌|功碑|吉服|素服|孝服|成服|衰绖|朝服|公服|号衣|号褂'
命中行数:约15行,有效约12行
有效发现:
- 第62行:衰绖之中
- 第68行:成服
- 第97行:换过马褂
- 第111行:脱了吉服、重新成服、换了素衣
- 第113行:披了一件马褂
- 第141行:吉服到黎大人家
- 第204行:穿了马褂
- 第241行:穿了缺襟袍子、方马褂
- 第311行:缺襟马褂
- 第314行:披上一件马褂
- 第404行:小褂子、套裤
- 第413行:号褂子
- 第522行:孝衣未齐
过滤掉:无
过滤统计
| 轮次 | 命中行 | 有效行 | 过滤率 |
|---|---|---|---|
| 第1轮 | ~25 | 20 | 20% |
| 第2轮 | ~20 | 15 | 25% |
| 第3轮 | 大量 | 5 | >90% |
| 第4轮 | ~10 | 5 | 50% |
| 第5轮 | ~30 | 20 | 33% |
| 第6轮 | ~15 | 12 | 20% |
主要过滤原因:
- "带"字作为动词(带着、带来)占比极高
- "红"字用于"红人"(得势者)非颜色服饰
- "衣"字在某些搭配中为泛指而非具体服饰描写
- "纱"出现于"纺纱织布局"为工业名词
审查结论
- 全书服饰描写约40条有效记录,数量不多但信息密度高
- 核心服饰集中在官服品级与丧服礼制两个系统
- 最精妙段落:第231行妓女论顶戴品级、第281行"画眉笼子"典故
- 服饰描写的文学功能以讽刺为主,非以审美为主
- 无虚构或生造服饰名称,所有服饰均有清代实物对应
产出文件
| 文件名 | 大小限制 | 内容 |
|---|---|---|
| 胡涂世界_总结.md | ≤20KB | 服饰分类分析与核心发现 |
| 胡涂世界_日志.md | ≤20KB | 本文件,提取流程记录 |
| 胡涂世界_原文提取.md | ≤20KB | 服饰相关原文摘录 |