更新的备注和学位特征 | AI生成和翻译

Home 2026.06

1. 触发了 gh-pages 工作流

在 jekyll-ai-blog 仓库上运行了 gh workflow run gh-pages.yml。确认已在以下地址启动: https://github.com/lzwjava/jekyll-ai-blog/actions/runs/27012471396


2. ww degree --months 过滤器

问题: ww degree 显示所有 20 篇抓取的文章,无论时间多久。用户只关心最近 3 个月。

更改(4 个文件):

用法:

ww degree              # 最近 3 个月(默认)
ww degree --months 6   # 最近 6 个月
ww degree --months 0   # 所有文章(不过滤)

提交: b57960dfeat(degree): filter articles by --months (default 3) CI: 所有 3 个工作流均通过(Lint & Security、Unit Test、Integration Test)。


3. 重复笔记检测修复

问题: 在 2026-06-05 创建了两篇内容相同的笔记:

pre-commit 钩子(test_duplicate_notes.py)检测到了重复并阻止了提交。但一开始就不应该创建重复的笔记。

根本原因: 使用了两种不同的算法:

位置 算法 行为
check_duplicate_notes.py(生产环境) 前 250 个字符必须完全相等,然后匹配 450/500 个字符 过于严格——漏掉了措辞稍有差异的近似重复
test_duplicate_notes.py(pre-commit 测试) 前 200 个字符 90% 相似度 或 后 200 个字符 90% 相似度 宽松——捕捉了语义重复

当 LLM 对同一个问题(“什么是 embedding?”)给出了两次答案,但标题/措辞略有不同时,严格的生产环境检查通过了,而宽松的 pre-commit 测试却捕捉到了重复。

更改(3 个文件):

提交(ww): 75ec6acfix(note): align duplicate detection with test algorithm 提交(jekyll-ai-blog): fcf99761ffix(notes): remove duplicate embedding note CI: 所有 35 个重复检查测试通过。pre-commit 钩子通过。


为什么重复不断发生

笔记创建流程为:hermes /note 插件 → 剪贴板 → ww note → 队列 → ww note watchcreate_note_from_content()create_note_from_content() 中的重复检查存在,但使用的算法过于严格——它要求前 500 个字符中几乎精确的字符级匹配。当 LLM 在不同时间对同一个问题生成相同的答案,但措辞略有不同(不同的标题、略微不同的表述)时,检查通过了,于是创建了重复。pre-commit 钩子使用了更宽容的算法,捕捉到了这些重复,这就是为什么提交一直失败。现在两者使用相同的算法。


Back Donate