跳到主要内容
透明度数据来源

Mindber 数据来自哪里

每个产品页由两条采集路径支撑:少量公开目录来源提供身份和元数据,公开活跃度探测层生成 Mindber 活跃度分数。两者都按固定频率运行,并写入版本化审计轨迹。
版本 v1.4更新日期

目录来源

Mindber 采集公开 AI 工具目录,用于产品身份、发布、分类和榜单。每个来源都会链接回来源平台上的原始资料。

  • Product Hunt:通过 Product Hunt GraphQL API 获取发布信息、创作者元数据、分类标签、投票/评论和奖项,是新产品发现的主要来源。
  • Toolify:仅采集官方工具列表页(不使用第三方汇编流量报告)。包含月流量估算、榜单信号、地区榜单、价格快照、AI 模型和平台元数据。
  • TAAFT:工具发现、国家、创作者社交链接、问答、替代品和优惠。
  • AIbase:偏中国市场的目录覆盖、流量来源、地理分布、跳出率、域名 WHOIS 和使用步骤;当前暂停等待验证。
  • Futurepedia:历史条目仅为连续性保留,新采集已停用。

活跃度信号来源

以下独立公开探测会进入 Mindber 活跃度分数,权重与活跃度方法论一致。标注"补充"的信号为辅助数据,不直接参与权重计算。

  • 公开流量估算(30%):月访问量和 30 天变化,来自上方 Toolify 与 AIbase 采集路径。
  • 社交:YouTube Data API v3 + LinkedIn(20%):关联公开频道距离最近一次发布的天数。YouTube 数据通过 YouTube Data API v3 只读方式获取。
  • 公开 ATS 端点(15%):Greenhouse、Lever 等招聘系统和职业页面上的开放职位数。
  • HTTP 首页探测(15%):可访问性、内容哈希变化、页面标题和 TLS 健康。
  • 公开 DNS(A / MX / NS)(10%):通过公开 DNS 查询获取 DNS 解析和记录存在情况。
  • 公开价格页(10%):价格页可访问性、检测到的价格数量和随时间变化。
  • GitHub API(公开)(补充):关联 GitHub 组织的公开仓库数量、提交活跃度(近 90 天)、Star 趋势和 Issue 数。仅访问公开数据,使用 GitHub REST API v3 只读权限。
  • Reddit 公开 API(补充):工具专属子版块的订阅数和发帖频率,仅使用公开子版块数据。
  • RSS / Atom 订阅源(补充):来自关联 RSS/Atom 订阅源的博客和更新日志发布频率,用于独立检测内容新鲜度。

已停用来源

  • X / Twitter:2026-05-01 停用。两个 syndication 端点均已关闭,非 API 抓取不再可靠;社交信号现在只读取 LinkedIn 和 YouTube。

采集政策

  • 每个探测在抓取前都会按 RFC 9309 尊重 robots.txt,遇到明确拒绝会暂停该来源。
  • 活跃度抓取会以 Mindber-LivenessBot/1.0 标识自身并附联系 URL,供应商可清晰地屏蔽我们。
  • 希望从产品页移除任何来源的供应商,可以 提交删除请求 认领页面 控制展示内容。
所有数据均来自公开可访问来源,不使用任何私有、付费或专有数据,仅采集事实信息,不使用第三方汇编报告。来源列表有版本记录;移除项会列在【已停用来源】而不是静默删除。返回 Mindber ->
Mindber Data Sources — How We Track AI Tools