想了解一下大厂的大佬们 这些指标是如何实践的,感谢大佬们赐教 最近在服务上想上一个 sentinel 的熔断规则,不太清楚里面那些具体参数有没有什么最佳实践 熔断降级支持慢调用比例、异常比例、异常数三种熔断策略
![]() |
1
opengps 2024-02-01 11:07:20 +08:00 ![]() 这些问题显然需要有个参考,这个参考就来自于压力测试
|
![]() |
2
woduzibue OP @opengps 是的,最近也在做一些压测,不过没有专门的压测人员,当服务压力上来 应该以哪个节点作为 瓶颈设置熔断点呢?
是 tps 开始下降的那个点还是 保证哪个时间点的数值 |
![]() |
3
opengps 2024-02-01 11:30:10 +08:00 ![]() 压测结果是极限值,而且测试时候过于单一,没法等于实际业务负载值。所以参考也仅仅是参考,具体业务适合多少,可能得凭借运维人员的经验了,比如单独压测接口 1 的 tps 能 200 ,在实际总共的 100 个接口可能只占用十分之一的实际调用比例,这时候单个接口可能得用 20 作为严重预警了
|
![]() |
4
dlmy 2024-02-01 11:43:08 +08:00 ![]() 把项目的流量录制下来,然后重放并扩大 10 倍、20 倍、30 倍。。。
通过这种方式,你可以观测到项目运行中的各种极限指标,再以这个作为参考,并逐步调整 Sentinel 配置,这样反复测个几次,就差不多了 Sentinel 具体参数配置,可以根据公司内部的业务指标和技术指标作为参考,让项目能满足验收条件即可 别迷信网上的 "最佳实践",这世上压根就没有最佳实践 |
5
wudaye 2024-02-01 11:45:58 +08:00 ![]() 本小厂的小弟觉得这玩意不会有最佳实践。比如熔断时长,你们的生产环境的某一个核心接口熔断 30 秒和熔断 60 秒分别会发生哪些后果,不直接上故障演练是很难预见得到的
|
![]() |
7
woduzibue OP @opengps 是的 我真的实践起来压测 也有这个疑问 如何确定哪些接口是必须得压到的,非常 感谢大佬的回复
|
9
sampeng 2024-02-01 20:08:47 +08:00
经验之谈。先拍脑袋写一个。然后再以事故为导向
|
11
sampeng 2024-02-02 14:20:32 +08:00
@woduzibue 事实就是这样的,世界就是一群草台班子组成的。除了极个别大公司有足够的资源正儿八经的去验证得到一个正儿八经的值。这个道理很简单,图啥啊?原先没有就一点事都没。现在有了,那我只要保证在现在没问题就好了。。
|
![]() |
12
woduzibue OP @sampeng 确实是,问了一圈没人支持一下压测,没有资源搞一套跟生产一样的环境来压测,老板只是想加一个限流的功能
|
![]() |
13
MoYi123 2024-02-02 16:58:36 +08:00
个人建议别熔断, 做这种事情就是纯背锅的.
|