方法论
本页记录 OutbreakWatch 如何收集、处理与呈现数据。我们公开这些内容,是为了使工作可被审计,并满足2026年任何健康信息服务所需的可信度标志。
来源优先级
我们按权威性对信息来源排序,对每一项主张优先采用可获得的最高等级来源:
- 第1级 —— 官方卫生主管部门:WHO 疾病暴发新闻(DON)、ECDC 威胁评估、CDC、Africa CDC、PAHO,以及各国卫生部(如 Ministero della Salute)。
- 第2级 —— 同行评议研究:PubMed 收录期刊,以及附有警示说明的预印本。
- 第3级 —— 主流新闻:Reuters、AP、BBC、NPR、CNN、Al Jazeera、Time、Le Monde、Corriere della Sera、ANSA、RAI News、ARD、Le Figaro。
- 第4级 —— 行业新闻与聚合平台:STAT News、ProMED、Healio、Quotidiano Sanità。
我们排除博客与个人观点、匿名 Telegram/4chan 信息,以及未经核实的社交媒体报道。
新闻采集
我们通过一个 Cloudflare Worker,每4小时从上述来源抓取一次 RSS 订阅。对每条新条目我们会:
- 按规范化 URL 与标题相似度(基于词向量的余弦相似度)去重。
- 标注一个事件类型:
confirmed_case、death、tracing、response、media、science。 - 使用 Gemini 2.0 Flash 模型按严格的结构化 schema 抽取地点;地理编码兜底回落到 Nominatim(OpenStreetMap)。
- 校验地点精度:
exact>city>region>country。 - 剔除无法抽取地点或地点置信度低于阈值的条目。
预测市场采集
我们每小时轮询 Polymarket 与 Kalshi 的公开 API,存储 YES 的概率与美元总成交量的快照。我们展示实时数值并附7日历史曲线。我们从不展示挂单簿明细,也不撮合任何交易。市场条目均链接回原始平台,供希望参与的用户访问。
分国汇总
国家页仅依据一手来源汇总确诊病例、疑似病例与死亡数据。风险等级(无 / 极低 / 低 / 中 / 高)反映最相关权威机构发布的评估(欧洲采用 ECDC,美洲采用 PAHO,非洲采用 Africa CDC 等)。我们绝不通过编辑判断指定风险等级。
编辑审校
摘要与常见问题解答在发布前会与所引一手来源进行核对。每篇内容都标注最近更新时间戳。更正会标注日期,并显示在受影响页面的底部。
我们不做的事
- 我们不编造数字。每一个数字都可链接到一个来源。
- 我们不提供症状自测器、分诊工具或个人医疗建议。
- 我们不聚合用户自述症状,也不开展公民科学式的数据采集。
- 未经用户明确订阅,我们不推送通知或警报。
更新与更正
重大错误一经发现,将在24小时内更正。更正会标注在受影响页面的底部。如需报告问题,请发送邮件至 [email protected]。