研究总结 日志 原文

嵗时杂咏 服饰内容提取日志

基本信息

第一步:wc统计

4983 行 506403 字节

第二步:5轮grep

轮次 关键词类型 命中行数
1 核心词 760
2 材质词 362
3 色彩纹饰词 1116
4 制度词 50
5 配饰词 68

第三步:Python正则二次过滤

最终提取:152行

第四步:分类统计

输出文件

  1. 嵗时杂咏_总结.md
  2. 嵗时杂咏_日志.md
  3. 嵗时杂咏_原文提取.md