字诂.txt 服饰内容提取日志
处理信息
- 文件:/root/.openclaw/workspace/小学/字诂.txt
- 处理时间:2026-05-02 02:54 (Asia/Shanghai)
- 提取方式:grep正则匹配42个服饰关键词
步骤记录
1. grep -c 统计匹配数
结果:32行匹配
命令:grep -c '衣|裳|服|袍|衫|裙|冠|帽|巾|带|绶|佩|鞋|履|靴|裘|丝|绢|锦|绣|罗|绫|绸|缎|布|麻|染|缝|裁|织|纺|纨|縠|襟|裾|衽|袖|袂|领|缘|纯|褐' 字诂.txt
2. grep -n 提取上下文
结果:32行全部输出(不足50行)
行号分布:4, 28, 29, 63, 77, 80, 81, 83, 93, 95, 97, 99, 107, 113, 127, 137, 139, 143, 149, 151, 155, 175, 191, 199, 203, 207, 213, 215, 242, 243, 251, 265
3. 创建输出目录
mkdir -p /root/.openclaw/workspace/小学output/字诂
成功
4. 写入输出文件
- 总结.md(含对抗式学术审查)
- 原文提取.md
- 日志.md
数据质量评估
| 指标 | 数值 |
|---|---|
| 总匹配行 | 32 |
| 有效服饰条目 | 12 |
| 误匹配行 | 20 |
| 有效率 | 37.5% |
| 核心服饰条目(★★★) | 3(巾、衣裳里、不借) |
| 次要条目(★★) | 4(章服、婀娜、衣冠了鸟、纺) |
| 一般条目(★) | 2(衯、齐衰) |
| 误匹配条目 | 3(含间接关联) |
误匹配分析
误匹配率较高(62.5%),主要原因:
- 多义字:"布"(古字形vs布帛)、"冠"(鸟名vs首服)
- 音切用字:"绢"在"裳绢反"、"尺绢切"中仅为注音
- 同形异义:"带"在"驼马所带铃声"中为动词非名词
- 复合词拆分:"服"在"扶掖"中非衣服义
字诂服饰内容特点
- 非服饰专著,服饰考证散见于字条中
- 以六书训诂为本,服饰为旁证
- "巾"条最为系统,从语义演变角度梳理
- 考据精审,引证广博,体现清代朴学特色