开发文档¶

1. 架构与边界¶

CoAuthors 是查询前端，不承担 DBLP 建库与学术数据计算，职责拆分如下：

真实的作者解析、共作计算、数据库约束由 CoAuthors/DblpService 负责。

浏览器请求 GET /。
app.py 调用 RuntimeStore.record_page_visit()，写 page_visits + 计数器 visit_count。
返回 index.html，注入：
app_version
visit_count
api_base（来自 API_BASE_URL）

前端读取左右作者输入，按行拆分（parseLines）。
对每条作者做清洗（sanitizeAuthorEntries）：
去首尾空格，压缩中间空白。
截断组织后缀（如 Name || Org、Name (Org) 等）。
去重，保留首次出现顺序。
构造查询 payload（left/right/exact_base_match/limit_per_pair/author_limit/year_min）。
生成缓存键：pairs:v1:<fnv1a32(json_payload)>。
调用本地缓存读取 POST /api/runtime/cache/get。
命中时直接渲染；未命中时调用 DblpService POST /api/coauthors/pairs。
远端成功结果异步写入本地缓存 POST /api/runtime/cache/put。
上报遥测 POST /api/runtime/query/event（成功或失败都会记录）。

注意：缓存写入与遥测上报是“尽力而为”（失败被吞掉，不阻断主查询流程）。

场景	约束	超限行为	结果
前端作者数量	每侧最多 `50`	前端直接拦截（不发请求）	UI 错误提示
DblpService 作者数量	每侧最多 `MAX_ENTRIES_PER_SIDE`（默认 50，硬上限 50）	立即拒绝	`400`
`limit_per_pair`	夹紧到 `[1, MAX_LIMIT]`（默认 MAX_LIMIT=200）	不拒绝，自动夹紧	`200` 正常返回
`author_limit`	最大 `MAX_AUTHOR_RESOLVE`（默认 800）	不拒绝，自动夹紧	`200` 正常返回
Runtime SQLite 写冲突	`sqlite timeout=30s` + `WAL`	先等待锁	超时后抛异常（通常表现为 `500`）
DblpService DB 锁冲突	`PRAGMA busy_timeout=30000`	先等待锁	超时后失败（常见 `500`，连接不可用时 `503`）
Pipeline 重复启动	仅允许一个 pipeline 线程	立即拒绝	`409 Pipeline is already running`
Pipeline 运行中 reset	不允许 reset	立即拒绝	`409 Cannot reset while running`
Runtime 缓存读取失败	无	查询降级到后端直连	业务继续
Runtime 缓存写入/遥测失败	无	忽略失败	业务继续

结论：本系统对“流量并发”主要是等待数据库锁；对“违反业务上限”是立即拒绝；对“观测与缓存故障”是降级不中断。

runtime_store.py 初始化下列表：

核心指标建议：