RT ,类似那种全量数据统计的需求,比如有个每日打卡的需求,用户每天都可以点击打卡按钮打卡,保存一条打卡记录,最终要统计每个用户每周、每月、每年打卡天数在全站排名前百分之几; 假设用户量千万级。
类似这种全量统计的需求,一般你们是丢给数仓直接全量刷数据统计,还是自己搞个业务 mysql 表一点点统计?
1
dobelee 4 小时 11 分钟前
我的经验,一般准确性、实时性要求高的,就走服务端;涉及复杂关联或聚合的就走数仓。
你这个例子,服务端记录简单的操作日志,用户查询走服务端。聚合统计走数仓,这种一般是运营数据需求,非业务需求,理论上你可以不用管。 |
![]() |
2
sagaxu 3 小时 39 分钟前 via Android
打卡这个例子并不好,每年打卡最多才 366 次,每个次数都记录下人数,再记录比每个次数多的人数总和,根本用不上全量统计,直接实时出结果。
|