以下为论文标签库后续计划增加的功能。状态基于当前代码库:部分后端逻辑或数据已就绪,尚缺前端 Tab 或交互。
相似论文图谱
后端已实现Connected Papers 风格的关联网络:基于 TF-IDF 内容相似度,叠加标签、文件夹与发表年份加权,展示近邻论文与探索路径。
兴趣变迁时间线
已有数据待接入按季度汇总研究方向(topic 标签)的论文数量,可视化阅读兴趣随时间的演进曲线;页面已嵌入 EVOLUTION 数据,待独立 Tab 渲染。
LLM 智能中文摘要
进行中两档策略:规则摘要质量足够时跳过 LLM;其余走 gpt-4o-mini 生成并缓存至 .papers_cache.json。默认构建零 API 调用;--llm-summary 增量补全,sync 脚本在 OPENAI_API_KEY 存在时自动启用。
标签体系与校验增强
进行中完善 taxonomy 分类、修复误标与 uncategorized 论文,在 UI 中展示 validation flags 与 needs_review 标记,支持批量复核。
历史快照对比
已有数据待接入利用每日快照(snapshots/history.json)对比库规模、方向分布与需复核数量的变化,追踪知识库增长轨迹。
发表年份全景
已有数据待接入独立于「标签×年份」的发表时间分布视图,展示各年论文入库量、日期来源覆盖率,辅助发现缺失元数据的年份段。
阅读笔记与批注
规划中关联 PDF 阅读器批注或独立 Markdown 笔记,在论文卡片中展示个人阅读心得;当前仅通过 mtime 推断最近阅读。
筛选结果导出
规划中将当前标签筛选、搜索结果的论文列表导出为 BibTeX、CSV 或 Markdown,便于引用管理与分享。
公开发布模式
已有基础生成不含阅读时间戳的公开版 HTML(--public 构建选项已支持);后续可在 UI 提供一键切换或独立发布入口。
本页内容为静态路线图,随开发进度更新。如有优先级建议,可在 generate_papers.py 或 _html_template.py 中直接修改。