研究总结 日志 原文

广州四先生诗 服饰内容提取日志

基本信息

第一步:wc统计

387 行 49758 字节

第二步:5轮grep

轮次 关键词类型 命中行数
1 核心词 85
2 材质词 47
3 色彩纹饰词 117
4 制度词 4
5 配饰词 13

第三步:Python正则二次过滤

最终提取:22行

第四步:分类统计

输出文件

  1. 广州四先生诗_总结.md
  2. 广州四先生诗_日志.md
  3. 广州四先生诗_原文提取.md